好奇字幕朗读是怎么做到的

2 小贾 1周前 142次点击

同样是看视频连续文字识别就会有很多字母之外的东西朗读进来但是使用字幕朗读这个功能,虽然偶尔会缺少几个字但不会朗读一些乱七八糟的东西这是怎么做到的呢。

共 7 条评论
0 
AI智能
冰棍儿 1周前
0 

字幕一般都是镶嵌在屏幕的图片下方,好多字幕要不是白字,要不是其他颜色的字体,而且偏粗,而且来回变化

0 
一妾都是 ,E I 技术
肯特 1周前
0 
连续文字识别只是特定区域识别,不会做过滤,也不会根据字幕区域智能识别。而字幕识别会智能判断字幕区域,而且只识别中文。所以效果比连续文字识别好。
0 

另外,有些视频是纯音乐配上纯文字的新闻热点,希望也可以被识别出来,再有就是可以增加一下识别的速度了,目前有时候如果视频语速太快,会有漏读的情况。

0 
这边的字幕识别是AI大模型训练出来的。别家的纯粹就是连续文字识别了。
0 

希望可以对视频号做一些特殊的适配,现在有时候识别的不太准确。

添加一条新评论

登录后可以发表评论 去登录

作者

积分:10

这家伙很懒,什么都没有留下
作者其它话题