萧顺星

入驻时间: 7个月前
萧顺星评论的话题
萧顺星 1周前 评论了 萧顺星 创建的话题 › 希望能有精度更高的李现文字识别引擎,以及继续优化字幕识别功能

希望尽力,因为我确实是见过好的,所以才敢这么说。

萧顺星 1周前 评论了 萧顺星 创建的话题 › 希望能有精度更高的李现文字识别引擎,以及继续优化字幕识别功能

这几年的技术发展离线OCR引擎是相当完善的了。虽说正确性和在线的引擎没得比,但诚实的把所有条目都展现出来,没有疏漏是没有问题的。天坦这种连错带漏的,明显就是引擎过时了。而且咱们的ocr引擎又不是去翻录书籍,用于简单播报的ocr,哪怕识别正确性没那么高也无所谓,错一两个字,靠脑补都能补回来。就害怕有些内容他就是识别不出来,连脑补的机会都没有。用百度高精度去替代字幕识别的离线ocr,那就真的是天方夜谭。我以前曾经用隔壁解说测试过的,一小时观影用在线引擎进行字幕识别,需要消耗1400条识别资源。说明一下,我记得百度好像是,1万条100块钱。看这么一小时的字幕识别需要上传流量1.5个g左右。想要用的爽,只有离线引擎精益求精,没有其他。

萧顺星 7个月前 评论了 肯特 创建的话题 › 天坦读屏8.2.0更新,增加字幕识别、连续文字识别,升级文本编辑器

字幕朗读建议加入可选识别范围设置,因为很多影片的插曲经常把中文字幕放在画面顶端。

画面和字幕源于:
magnet:?xt=urn:btih:6e3132c9f781748ef722e0125028bfb72226699e&dn=%5bSweetSub%5d%20Shikanoko%20Nokonoko%20Koshitantan%20-%2010%20%5bWebRip%201080p%20HEVC-10bit%20AAC%20CHS%26CHT%5d.mkv&tr=udp%3a%2f%2ftr.bangumi.moe%3a6969%2fannounce&tr=http%3a%2f%2ftr.bangumi.moe%3a6969%2fannounce&tr=https%3a%2f%2ftr.bangumi.moe%3a9696%2fannounce&tr=http%3a%2f%2fopen.acgtracker.com%3a1096%2fannounce&tr=udp%3a%2f%2f208.67.16.113%3a8000%2fannounce&tr=http%3a%2f%2f208.67.16.113%3a8000%2fannounce&tr=http%3a%2f%2ftracker.ktxp.com%3a6868%2fannounce&tr=http%3a%2f%2ftracker.ktxp.com%3a7070%2fannounce&tr=http%3a%2f%2ft2.popgo.org%3a7456%2fannonce&tr=http%3a%2f%2fbt.sc-ol.com%3a2710%2fannounce&tr=http%3a%2f%2fshare.camoe.cn%3a8080%2fannounce&tr=http%3a%2f%2f61.154.116.205%3a8000%2fannounce&tr=http%3a%2f%2fbt.rghost.net%3a80%2fannounce&tr=http%3a%2f%2ftracker.openbittorrent.com%3a80%2fannounce&tr=http%3a%2f%2ftracker.publicbt.com%3a80%2fannounce&tr=http%3a%2f%2ftracker.prq.to%2fannounce&tr=http%3a%2f%2f192.168.31.195%3a60000%2fannounce&tr=http%3a%2f%2fopen.nyaatorrents.info%3a6544%2fannounce
萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

现有使用的一些小技巧。

系统原装字体为了个性多半有毒。建议外挂字幕或者cc字幕的,把字体设置为兰亭体或者宋体。这个识别很脆弱,稍微奇形怪状的字体就要出事

字号不能太大,否则会被自带的玄学算法优化掉不少,但又不能太小,否则ocr就要出错。这个区间还挺紧凑的,建议20~22px。

字幕样式千万不要加入描边。描边对于这个算法简直是毁灭性打击。

果断放弃用改变屏幕布局这种方式解锁被吞的内容,直接使用屏幕识别捞。

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

最后经过我一阵发散式的使用,才总结出这一次字幕识别功能超越以往同类产品的几个优点。

第一也是我最惊讶的,他可以精准的避开播放控件。以前的识别都是机械式的识别,播放器上面的什么清晰度啊,倍速啊,发弹幕,有什么他播报什么。现在几乎是精准跳过这些。

第二,隔绝双语字幕。在我发散使用期间,测试了中日双语字幕和中英双语字幕,字幕识别的播报都可以精准播报中文字幕,忽略外文字幕。问题是如果字幕分多行且包含外文,比如中文夹杂英文的台词,会不会就错吞了。

上一楼曾经说过小市民系列里面的一张莫名其妙就跳掉的图,但说实话双语隔绝在这种双语字幕真的好用。
这就是中英文字幕都有用,然后被优化的典型情况

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

到这里我已经没办法用简单的表征去猜测,到底为什么吞。于是我找了一部,随便看看发散一下。

【《小市民系列》 第5话 柏林炸面包之谜-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep833567

这一步让我惊讶了,识别莫名其妙的变得无比的乖巧,好似哔哩哔哩把字幕结果输出给读屏一样,狮子跳剧这种事情几乎消失。但玄学依旧存在,总有那么冷不丁的一句话,十几个字和上一句的长度差不多,内容和上一句截然不同,所以按照逻辑不会被软件认为是同一句话而被吞掉这样子,然后软件就把那句话吞了,了,了,了。其实到这里我也不是没办法。按以往用同类产品的经验,我只要把播放器的操作控件呼出来,让屏幕内容改动一下,那么好,字幕识别自然会播报题目的改变,被判定吞没的那条结果很大概率就会这样子被解锁出来。结果是软件居然不播报播放控件的内容。说实话,如此优化前所未见,这种不是简单机械的识别,而是考虑到播放场景的优化,是真的好。可是话说回来,我那一条被吞掉的结果谁来解锁?那还怎么办呗?退出字幕识别,用屏幕识别捞一下。

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

测试了一下,可能是我开了字幕描边的原因。不描边的 Cc字幕并且把字号降低到22。终于从没有实用价值到了勉强实用。

然后我又更换饮片测试。结果出现了大量的吃、跳。

【《ATRI -My Dear Moments-(僅限港澳台)》 第1话 日誌 01 前往海之搖籃-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep829084

这部片的第一集一开始到男主醒来之前的所有字幕,纯黑画面,白色字没有描边,22号,播报全吞了。

这种干净简单反而不识别,类似于灯下黑的我以前也见过,所以换了一部场景教案的片段对比测试。

【《紫罗兰永恒花园》 第6话 在某处的星空下-哔哩哔哩番剧】https://www.bilibili.com/bangumi/play/ep173291

这一部这一集的第14分21秒往后有一整段相对较暗的场景。结果表现还算正常。所以得出并不是简单的灯下黑导致的。

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

好的。你的qq号

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

对的,画面复杂的时候会这样

萧顺星 7个月前 评论了 萧顺星 创建的话题 › ,反馈问题第一时间体验字幕识别

回复在三楼