4 夜舞倾城 3小时前 85次点击
起因
还是帮派喝酒答题
我作为这个帮的帮主,不做喝酒答题不行啊,而且还得给他们答案
科举想不做可以不做,但是喝酒答题这个不行
所以说必须得有一个靠谱的方法
以前
最初的时候,我是用另一个手机去播报题目,然后这个手机用的豆包语音转文字发给豆包
正确率约70%有一些错字,标点符号不通顺
后来呢,我又用了deep seek,直接用它内置的语音转文字
正确率约40%效果拉完了,有很多的错字,而且标点符号非常不通顺,还容易出现漏字的情况
后来呢,我用了豆包输入法的语音转文字,直接转出来发给deep seek,麻烦的是每次用都得关读屏
正确率约95%还行,但是也会有一些错字
最后也就是现在,因为我这个手机坏了,以前那个手机坏了,说实话,他很早很早就已经坏了,只不过能勉强用而已,但是现在真的是用不了了,所以就只能再想新办法了
懒得写提示词了,直接把题目截图发给一个官方做好的豆包的提取文字助手
唉,他直接把文字提取出来发给我,然后我再把文字发给deep seek
效率有点低,有点慢,中间约耗费30~40秒的时间
正确率约99%为啥不到100%呢?因为他错别字是真的没了,但是容易漏字
有可能是截图不完整吧,但是我直接截的全屏图
所以我好奇的是,这个截图里面的文字到底是不是完整的?是不是因为画质的问题或者什么的问题漏字了
当时我清楚的记得,有一道很长的题目,幸好选项就在第1个,然后他给我的文字里面,第3个和第4个选项都被漏掉了,假如选项是第3个或者第4个的话,那糟糕了
大多数情况下,4个选项都被弄出来的,但是后面那一堆啰嗦的话,比如说按住右下角与帮会玩家交流,这个是没有了的
但是想一想还是比较危险的
所以说接下来我稍后发两张截图,你们看一下到底是不是完整的哈
Ok,图片也发了
后来呢,我又问了一下豆包本包,然后把图片都发给了他,又把提取文字的截图发给了他,问他到底是我图片的问题,还是ai的问题
我当时又特意用了一下咱们天坦的全屏文字识别,去识别了一下图片
我这边用的是离线接口,还是vivo接口来着,反正肯定是这两个其中的一个
忘了
它识别出来的呢,有一些不该加标点符号的地方,他可以加标点符号了,但是错别字没有几个,我也没用字符浏览,直接听的
和提取文字的结果一样,还是有漏字,后面那几个字都漏掉了
Ok啊,帖子最后再粘贴一下豆包的两段一本正经胡说八道
我太懂这种崩溃了!本来以为截图OCR稳得一批,结果关键文字缺斤少两,长题直接就翻车,安全感瞬间没了对吧😅
一、为啥AI截图提取文字总漏字、缺后半段?
根本不是你图片拍得差,是这几个坑在搞鬼:
1. 文字排版+背景天生劝退OCR
游戏画面是纯黑暗底、字体偏纤细、字间距又挤,最后一行文字位置很低、靠近屏幕边缘,还被右下角那个金色圆形按钮挤压遮挡,AI的文字识别框很容易直接把边缘的文字判定成“不重要的边角垃圾信息”,直接砍掉不读。
2. AI偷懒+自作聪明删“冗余”
你给AI发图让它“提取文字”,很多AI会自动过滤它认为没用的“无效话术”(比如游戏提示语:一分钟讨论时间、按住屏幕交流这类系统旁白),只优先保留它觉得是核心题干、选项的内容,主动给你截断、省略尾巴。
3. 分辨率+字体太小
游戏UI文字字号偏小,截图压缩之后,底部文字像素更低,OCR识别精度断崖式下滑,长句子到后半段直接识别失败、丢字。
4. 单次识别字数上限
部分轻量AI识图,单次能精准识别的文字长度有限,题目一长,就会出现“前半段完美、后半段直接截断丢失”。
二、立刻就能用的「零漏字、100%完整提取」解决办法
不用换手机、不用改画质,改一下发给AI的指令话术,效果直接翻倍:
❌ 错误指令:帮我提取图里的文字
✅ 万能精准指令(直接复制用):
请逐字完整、一字不差地提取这张图片里的所有全部文字内容,包括所有小字、末尾的系统提示语、边角文字、标点符号,禁止省略、禁止删减、禁止自行总结过滤、不要遗漏任何一个字,原样原文输出。
就加这几句强约束,AI再也不敢自作主张删掉尾巴文字,漏字率直接降到几乎为0。
三、针对你这个答题场景,终极稳上加稳优化
既然你只有1分钟答题窗口、容错率极低,额外再补2个小技巧:
1. 优先手动复制屏幕文字,再发给AI
游戏里的题干文字本身就是可选中的文本,长按屏幕直接全选复制文字,粘贴给AI,零识别误差、零漏字、速度还比截图更快,比OCR截图靠谱一万倍。
2. 如果只能截图,拍图/截图时往下多留一点边
别让最后一行文字紧贴屏幕最底部,留出一点黑边,AI就不会把边缘文字忽略掉。
3. 兜底备用方案
万一某题题干超长、OCR还是翻车,立刻切回方案一语音转文字,语音播报整段题目+选项,题干长反而语音识别比残缺OCR更不容易错。
四、回到你最开始的两种方案再复盘
表格
方案 速度 原来翻车点 优化后稳度
1. 语音转文字 5-10秒 同音字、错字 中等
2. 截图OCR 30-40秒 AI漏字、截断 优化指令后=接近100%全对
现在你只要固定用上面那个强制逐字提取指令,截图漏字这个致命问题就彻底解决了,40秒完全在1分钟时限内,全程稳到离谱,再也不怕答错坑全队。
要不要我顺便把你这三道题的标准答案直接给你,顺便帮你整理一份快速核对速记?
这张聊天截图一对比,原因就非常清晰了。这根本不是图片模糊的问题,而是AI的“识别逻辑”和“你的需求”完全错位导致的,甚至可以说是AI在“自作聪明”帮你倒忙。
我给你拆解一下这背后的三个核心原因,你就明白为什么会漏选项、漏最后一句话了:
1. 最致命的原因:AI把“末尾提示语”当成了“干扰项”自动过滤
你看第7题和第9题的截图原文,最后都有一句:
“一分钟讨论时间开始,按住屏幕右下角与帮会玩家交流”
而你发给AI的结果里,这一句完全消失了。
这是因为很多AI识图工具自带了一个“智能降噪”功能。在它的逻辑里,“一分钟讨论”这种系统提示属于“废话”,它会自动把它过滤掉,只保留它认为是“题目本体”的内容。
结果就是: 它好心帮倒忙,把最末尾的关键信息直接咔嚓了。
2. 第二大原因:AI误判“选项边界”,把“选项”当成“题目结尾”截断
你看第7题,截图原文选项是:“甲、相同,乙、偏...”
但是AI返回的结果只到了“偏。。。”就停了,甚至连选项甲、乙的标识都没了。
这是因为游戏画面中,选项文字是紧挨着题目正文的,AI识别到句子很长,读到“偏”这个字刚好是句子末尾,又没有立刻出现下一题的标志,它就误以为“偏”是整段话的结尾,直接截断了。
3. 输入图像的“压缩损耗”
你看这张聊天截图,你是把游戏截图发给AI,然后AI又生成了这张图发给你。
这中间经过了一次截图+一次上传+一次展示压缩。
图像分辨率在传输中掉了很多,底部细小的文字(比如第8题被截断的“按住屏。。。”)像素点不够,AI就直接识别不出来了。
💡 既然AI这么不靠谱,怎么救?(专属定制指令)
为了对付这种“自作聪明”的AI,你必须给它下达极其强硬、甚至有点啰嗦的指令,强制它把所有字都吐出来。
请把下面这段指令复制,以后发给AI时,先把这段指令发过去,再发图片:
【强制完整提取指令】
“请你仔细识别这张游戏截图,必须一字不差、完整无遗漏地把所有文字提取出来。
注意:
1. 不要过滤任何内容,包括末尾的‘一分钟讨论...’、‘按住屏幕...’这类系统提示语,必须完整保留。
2. 必须保留选项前缀,即‘甲、...’‘乙、...’‘丙、...’‘丁、...’全部保留,不要遗漏。
3. 不要删减、不要总结、不要改写,严格按照图片上的文字顺序,原文照抄。”
✅ 效果预测
用了这个指令,AI就不敢乱删了。它会老老实实把:
题目 + 甲/乙/丙/丁选项 + 末尾的提示语
全部一字不差地发给你,这样你就不会再被吓到了,而且复制粘贴给答案AI也能秒出结果。
要不要我现在就用这个指令帮你把这三道题的答案直接解出来,让你验证一下新方法的效果?
本楼来自:我的世界肝帝玩家的资源库,可以进来看看