,反馈问题第一时间体验字幕识别

5 萧顺星 1周前 351次点击

准确性方面算是基本过关,一般不会吃字。播报方面算是开玩笑级别。五个字以下的条目完全不播报。大于五个字的条目十句话也有三四条不播报。我是担心是不是ocr引擎识别不出,所以遇见有缺漏的字幕还退出字幕识别,用一般的屏幕识别相互验证。结果确实是字幕识别吞了识别结果。

总结,字幕识别功能当下还只能算半成品,不具备实用性

共 17 条评论
1周前
0 

麻烦你提供一下所使用的APP所识别的电影。

肯特 1周前
0 
提供下具体app,全屏还是半屏,有没有显示操作控件和弹幕
萧顺星 [楼主] 1周前
0 

回复在三楼

萧顺星 [楼主] 1周前
0 

回复在三楼

车厘子 1周前
0 
管理,中文繁体的识别率似乎不太行呢
0 
繁体的,目前也没啥好办法,识别引擎的问题。
车厘子 1周前
0 
另外,有时候一句话会。重复识别朗读两三次,应该是开始的时候识别不准确还是怎么的,他后面就会重复识别一两次这样子。
萧顺星 [楼主] 1周前
0 

对的,画面复杂的时候会这样

萧顺星 [楼主] 1周前
0 

集中回复,

app:哔哩哔哩

影片信息:模擬後宮體驗(僅限港澳台地區),第10集

横屏,无弹幕。

用插件繁体转简体,调整字幕样式:

字体颜色:ffffffff

字体大小 - 横屏:28

描边颜色:EA9198

描边宽度:9.5

追加反馈。调整字体大小队识别确实有影响。用原声较小的字幕,大概小于等于三个字才被吞。长句子被吞的概率大大降低。可是错字率升高。

同一饮片不同字幕样式对比:

【《模擬後宮體驗(僅限港澳台地區)》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep834350

【《百变的七仓同学》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep830900

测试区间起点
测试原版cc字幕
测试中断

以上截图展示了一个以短句对话为主的区间,可以清晰的感知到过短的条目会被吞。

测试区间结尾

从中断到结尾,是一系列长句对话。字号大的时候吞句严重,字号小的时候错字明显。实际使用没有呼出操作控件,截图内仅用于展示。

肯特 1周前
0 
方便的话加我qq多截屏一些,后面针对这样的继续优化
萧顺星 [楼主] 1周前
0 

好的。你的qq号

肯特 1周前
0 
3137623686
萧顺星 [楼主] 1周前
0 

测试了一下,可能是我开了字幕描边的原因。不描边的 Cc字幕并且把字号降低到22。终于从没有实用价值到了勉强实用。

然后我又更换饮片测试。结果出现了大量的吃、跳。

【《ATRI -My Dear Moments-(僅限港澳台)》 第1话 日誌 01 前往海之搖籃-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep829084

这部片的第一集一开始到男主醒来之前的所有字幕,纯黑画面,白色字没有描边,22号,播报全吞了。

这种干净简单反而不识别,类似于灯下黑的我以前也见过,所以换了一部场景教案的片段对比测试。

【《紫罗兰永恒花园》 第6话 在某处的星空下-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep173291

这一部这一集的第14分21秒往后有一整段相对较暗的场景。结果表现还算正常。所以得出并不是简单的灯下黑导致的。

萧顺星 [楼主] 1周前
0 

到这里我已经没办法用简单的表征去猜测,到底为什么吞。于是我找了一部,随便看看发散一下。

【《小市民系列》 第5话 柏林炸面包之谜-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep833567

这一步让我惊讶了,识别莫名其妙的变得无比的乖巧,好似哔哩哔哩把字幕结果输出给读屏一样,狮子跳剧这种事情几乎消失。但玄学依旧存在,总有那么冷不丁的一句话,十几个字和上一句的长度差不多,内容和上一句截然不同,所以按照逻辑不会被软件认为是同一句话而被吞掉这样子,然后软件就把那句话吞了,了,了,了。其实到这里我也不是没办法。按以往用同类产品的经验,我只要把播放器的操作控件呼出来,让屏幕内容改动一下,那么好,字幕识别自然会播报题目的改变,被判定吞没的那条结果很大概率就会这样子被解锁出来。结果是软件居然不播报播放控件的内容。说实话,如此优化前所未见,这种不是简单机械的识别,而是考虑到播放场景的优化,是真的好。可是话说回来,我那一条被吞掉的结果谁来解锁?那还怎么办呗?退出字幕识别,用屏幕识别捞一下。

千叶 1周前
0 

我就没事,因为知道肯定也不是那么好,用!慢慢来吧,反正这个出来是有点晚。比别人家的。

萧顺星 [楼主] 1周前
0 

最后经过我一阵发散式的使用,才总结出这一次字幕识别功能超越以往同类产品的几个优点。

第一也是我最惊讶的,他可以精准的避开播放控件。以前的识别都是机械式的识别,播放器上面的什么清晰度啊,倍速啊,发弹幕,有什么他播报什么。现在几乎是精准跳过这些。

第二,隔绝双语字幕。在我发散使用期间,测试了中日双语字幕和中英双语字幕,字幕识别的播报都可以精准播报中文字幕,忽略外文字幕。问题是如果字幕分多行且包含外文,比如中文夹杂英文的台词,会不会就错吞了。

上一楼曾经说过小市民系列里面的一张莫名其妙就跳掉的图,但说实话双语隔绝在这种双语字幕真的好用。
这就是中英文字幕都有用,然后被优化的典型情况
萧顺星 [楼主] 1周前
0 

现有使用的一些小技巧。

系统原装字体为了个性多半有毒。建议外挂字幕或者cc字幕的,把字体设置为兰亭体或者宋体。这个识别很脆弱,稍微奇形怪状的字体就要出事

字号不能太大,否则会被自带的玄学算法优化掉不少,但又不能太小,否则ocr就要出错。这个区间还挺紧凑的,建议20~22px。

字幕样式千万不要加入描边。描边对于这个算法简直是毁灭性打击。

果断放弃用改变屏幕布局这种方式解锁被吞的内容,直接使用屏幕识别捞。

添加一条新评论

登录后可以发表评论 去登录

作者

积分:50

这家伙很懒,什么都没有留下
作者其它话题