5 萧顺星 2个月前 572次点击
准确性方面算是基本过关,一般不会吃字。播报方面算是开玩笑级别。五个字以下的条目完全不播报。大于五个字的条目十句话也有三四条不播报。我是担心是不是ocr引擎识别不出,所以遇见有缺漏的字幕还退出字幕识别,用一般的屏幕识别相互验证。结果确实是字幕识别吞了识别结果。
总结,字幕识别功能当下还只能算半成品,不具备实用性
回复在三楼
回复在三楼
对的,画面复杂的时候会这样
集中回复,
app:哔哩哔哩
影片信息:模擬後宮體驗(僅限港澳台地區),第10集
横屏,无弹幕。
用插件繁体转简体,调整字幕样式:
字体颜色:ffffffff
字体大小 - 横屏:28
描边颜色:EA9198
描边宽度:9.5
追加反馈。调整字体大小队识别确实有影响。用原声较小的字幕,大概小于等于三个字才被吞。长句子被吞的概率大大降低。可是错字率升高。
同一饮片不同字幕样式对比:
【《模擬後宮體驗(僅限港澳台地區)》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep834350
【《百变的七仓同学》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep830900
以上截图展示了一个以短句对话为主的区间,可以清晰的感知到过短的条目会被吞。
从中断到结尾,是一系列长句对话。字号大的时候吞句严重,字号小的时候错字明显。实际使用没有呼出操作控件,截图内仅用于展示。
好的。你的qq号
测试了一下,可能是我开了字幕描边的原因。不描边的 Cc字幕并且把字号降低到22。终于从没有实用价值到了勉强实用。
然后我又更换饮片测试。结果出现了大量的吃、跳。
【《ATRI -My Dear Moments-(僅限港澳台)》 第1话 日誌 01 前往海之搖籃-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep829084
这部片的第一集一开始到男主醒来之前的所有字幕,纯黑画面,白色字没有描边,22号,播报全吞了。
这种干净简单反而不识别,类似于灯下黑的我以前也见过,所以换了一部场景教案的片段对比测试。
【《紫罗兰永恒花园》 第6话 在某处的星空下-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep173291
这一部这一集的第14分21秒往后有一整段相对较暗的场景。结果表现还算正常。所以得出并不是简单的灯下黑导致的。
到这里我已经没办法用简单的表征去猜测,到底为什么吞。于是我找了一部,随便看看发散一下。
【《小市民系列》 第5话 柏林炸面包之谜-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep833567
这一步让我惊讶了,识别莫名其妙的变得无比的乖巧,好似哔哩哔哩把字幕结果输出给读屏一样,狮子跳剧这种事情几乎消失。但玄学依旧存在,总有那么冷不丁的一句话,十几个字和上一句的长度差不多,内容和上一句截然不同,所以按照逻辑不会被软件认为是同一句话而被吞掉这样子,然后软件就把那句话吞了,了,了,了。其实到这里我也不是没办法。按以往用同类产品的经验,我只要把播放器的操作控件呼出来,让屏幕内容改动一下,那么好,字幕识别自然会播报题目的改变,被判定吞没的那条结果很大概率就会这样子被解锁出来。结果是软件居然不播报播放控件的内容。说实话,如此优化前所未见,这种不是简单机械的识别,而是考虑到播放场景的优化,是真的好。可是话说回来,我那一条被吞掉的结果谁来解锁?那还怎么办呗?退出字幕识别,用屏幕识别捞一下。
我就没事,因为知道肯定也不是那么好,用!慢慢来吧,反正这个出来是有点晚。比别人家的。
最后经过我一阵发散式的使用,才总结出这一次字幕识别功能超越以往同类产品的几个优点。
第一也是我最惊讶的,他可以精准的避开播放控件。以前的识别都是机械式的识别,播放器上面的什么清晰度啊,倍速啊,发弹幕,有什么他播报什么。现在几乎是精准跳过这些。
第二,隔绝双语字幕。在我发散使用期间,测试了中日双语字幕和中英双语字幕,字幕识别的播报都可以精准播报中文字幕,忽略外文字幕。问题是如果字幕分多行且包含外文,比如中文夹杂英文的台词,会不会就错吞了。
现有使用的一些小技巧。
系统原装字体为了个性多半有毒。建议外挂字幕或者cc字幕的,把字体设置为兰亭体或者宋体。这个识别很脆弱,稍微奇形怪状的字体就要出事
字号不能太大,否则会被自带的玄学算法优化掉不少,但又不能太小,否则ocr就要出错。这个区间还挺紧凑的,建议20~22px。
字幕样式千万不要加入描边。描边对于这个算法简直是毁灭性打击。
果断放弃用改变屏幕布局这种方式解锁被吞的内容,直接使用屏幕识别捞。
麻烦你提供一下所使用的APP所识别的电影。