萧顺星评论的话题
萧顺星 1周前 评论了 肯特 创建的话题 › 天坦读屏8.2.0更新,增加字幕识别、连续文字识别,升级文本编辑器

字幕朗读建议加入可选识别范围设置,因为很多影片的插曲经常把中文字幕放在画面顶端。

画面和字幕源于:
magnet:?xt=urn:btih:6e3132c9f781748ef722e0125028bfb72226699e&dn=%5bSweetSub%5d%20Shikanoko%20Nokonoko%20Koshitantan%20-%2010%20%5bWebRip%201080p%20HEVC-10bit%20AAC%20CHS%26CHT%5d.mkv&tr=udp%3a%2f%2ftr.bangumi.moe%3a6969%2fannounce&tr=http%3a%2f%2ftr.bangumi.moe%3a6969%2fannounce&tr=https%3a%2f%2ftr.bangumi.moe%3a9696%2fannounce&tr=http%3a%2f%2fopen.acgtracker.com%3a1096%2fannounce&tr=udp%3a%2f%2f208.67.16.113%3a8000%2fannounce&tr=http%3a%2f%2f208.67.16.113%3a8000%2fannounce&tr=http%3a%2f%2ftracker.ktxp.com%3a6868%2fannounce&tr=http%3a%2f%2ftracker.ktxp.com%3a7070%2fannounce&tr=http%3a%2f%2ft2.popgo.org%3a7456%2fannonce&tr=http%3a%2f%2fbt.sc-ol.com%3a2710%2fannounce&tr=http%3a%2f%2fshare.camoe.cn%3a8080%2fannounce&tr=http%3a%2f%2f61.154.116.205%3a8000%2fannounce&tr=http%3a%2f%2fbt.rghost.net%3a80%2fannounce&tr=http%3a%2f%2ftracker.openbittorrent.com%3a80%2fannounce&tr=http%3a%2f%2ftracker.publicbt.com%3a80%2fannounce&tr=http%3a%2f%2ftracker.prq.to%2fannounce&tr=http%3a%2f%2f192.168.31.195%3a60000%2fannounce&tr=http%3a%2f%2fopen.nyaatorrents.info%3a6544%2fannounce
萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

现有使用的一些小技巧。

系统原装字体为了个性多半有毒。建议外挂字幕或者cc字幕的,把字体设置为兰亭体或者宋体。这个识别很脆弱,稍微奇形怪状的字体就要出事

字号不能太大,否则会被自带的玄学算法优化掉不少,但又不能太小,否则ocr就要出错。这个区间还挺紧凑的,建议20~22px。

字幕样式千万不要加入描边。描边对于这个算法简直是毁灭性打击。

果断放弃用改变屏幕布局这种方式解锁被吞的内容,直接使用屏幕识别捞。

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

最后经过我一阵发散式的使用,才总结出这一次字幕识别功能超越以往同类产品的几个优点。

第一也是我最惊讶的,他可以精准的避开播放控件。以前的识别都是机械式的识别,播放器上面的什么清晰度啊,倍速啊,发弹幕,有什么他播报什么。现在几乎是精准跳过这些。

第二,隔绝双语字幕。在我发散使用期间,测试了中日双语字幕和中英双语字幕,字幕识别的播报都可以精准播报中文字幕,忽略外文字幕。问题是如果字幕分多行且包含外文,比如中文夹杂英文的台词,会不会就错吞了。

上一楼曾经说过小市民系列里面的一张莫名其妙就跳掉的图,但说实话双语隔绝在这种双语字幕真的好用。
这就是中英文字幕都有用,然后被优化的典型情况

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

到这里我已经没办法用简单的表征去猜测,到底为什么吞。于是我找了一部,随便看看发散一下。

【《小市民系列》 第5话 柏林炸面包之谜-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep833567

这一步让我惊讶了,识别莫名其妙的变得无比的乖巧,好似哔哩哔哩把字幕结果输出给读屏一样,狮子跳剧这种事情几乎消失。但玄学依旧存在,总有那么冷不丁的一句话,十几个字和上一句的长度差不多,内容和上一句截然不同,所以按照逻辑不会被软件认为是同一句话而被吞掉这样子,然后软件就把那句话吞了,了,了,了。其实到这里我也不是没办法。按以往用同类产品的经验,我只要把播放器的操作控件呼出来,让屏幕内容改动一下,那么好,字幕识别自然会播报题目的改变,被判定吞没的那条结果很大概率就会这样子被解锁出来。结果是软件居然不播报播放控件的内容。说实话,如此优化前所未见,这种不是简单机械的识别,而是考虑到播放场景的优化,是真的好。可是话说回来,我那一条被吞掉的结果谁来解锁?那还怎么办呗?退出字幕识别,用屏幕识别捞一下。

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

测试了一下,可能是我开了字幕描边的原因。不描边的 Cc字幕并且把字号降低到22。终于从没有实用价值到了勉强实用。

然后我又更换饮片测试。结果出现了大量的吃、跳。

【《ATRI -My Dear Moments-(僅限港澳台)》 第1话 日誌 01 前往海之搖籃-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep829084

这部片的第一集一开始到男主醒来之前的所有字幕,纯黑画面,白色字没有描边,22号,播报全吞了。

这种干净简单反而不识别,类似于灯下黑的我以前也见过,所以换了一部场景教案的片段对比测试。

【《紫罗兰永恒花园》 第6话 在某处的星空下-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep173291

这一部这一集的第14分21秒往后有一整段相对较暗的场景。结果表现还算正常。所以得出并不是简单的灯下黑导致的。

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

好的。你的qq号

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

对的,画面复杂的时候会这样

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

回复在三楼

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

回复在三楼

萧顺星 1周前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

集中回复,

app:哔哩哔哩

影片信息:模擬後宮體驗(僅限港澳台地區),第10集

横屏,无弹幕。

用插件繁体转简体,调整字幕样式:

字体颜色:ffffffff

字体大小 - 横屏:28

描边颜色:EA9198

描边宽度:9.5

追加反馈。调整字体大小队识别确实有影响。用原声较小的字幕,大概小于等于三个字才被吞。长句子被吞的概率大大降低。可是错字率升高。

同一饮片不同字幕样式对比:

【《模擬後宮體驗(僅限港澳台地區)》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep834350

【《百变的七仓同学》 第10话 生日-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep830900

测试区间起点
测试原版cc字幕
测试中断

以上截图展示了一个以短句对话为主的区间,可以清晰的感知到过短的条目会被吞。

测试区间结尾

从中断到结尾,是一系列长句对话。字号大的时候吞句严重,字号小的时候错字明显。实际使用没有呼出操作控件,截图内仅用于展示。