关于ocr的那些是

6 阅读者 1年前 336次点击

  不知道是我的错觉还是就是这样,在那个古老的没有ocr的时候,我用着巨慢无比的tb,没有ocr,在手机上依然能完成许多的事情,那时候,手机也不行,读平也不那么快,那时候的无障碍,按道理来说是比现在糟糕的,毕竟说了那么多的年的无障碍。可是,现在有了ocr,我突然发现,不管是做什么事情,永远都离不开ocr,美团外卖微信领券需要ocr,抖音团购需要ocr,甚至有的时候,美团外卖突然抽风,也需要ocr,随着ocr的普及,仿佛我们在使用电子设备的时候,要用到ocr的场景越来越多了。

  作为一个双持党,我来说说我在ios、harmonyos、Windows上我ocr的不同感受。首先,我们大概要把安卓和鸿蒙分开来,因为在它系统里总是有自己的ocr接口的,可是不巧的是,好像不能用。如果为了用系统自己的API,那还要用屏幕朗读。不是我有偏见,但是,屏幕朗读的反应速度,真的不知我们用那优化得一团糟的本地ocr的。当然,面对着日益复杂的网络环境,读平也在自我完善,大家都在优化第三方的文字识别。由于我没有用过保亿,点名,但是我用过解说和天坦啊。至今,解说的离线ocr识别响应速度是最快的,我们的天坦到不久以前才上了离线文字识别,但是,由于时间尚短,响应速度比以前快了不少,但是比解说还差了一点。不过有人说:解说是最靠近旁白的一个读平,因为它能够在安卓上有着接近旁白的响应速度。这里,大家也说了,旁白是快的稳,解说是快的飘。天坦虽然没有那样快,但是人家稳。不得不说,解说要么不出问题,一出问题就是大问题。至今,解说快的飞起,就是试试,可是大小的问题是层出不穷。当然,在ocr的优化上,我对解说还是很佩服的。说一个比较冷门的场景:我们打开王者荣耀,用文字识别来点击屏幕上的按钮,解说就可以顺利地解决所有的点按操作,可是我们的天坦,到了战斗结束,是无法通过文字识别来返回大厅。这里我猜测,解说的虚拟屏幕,可能对ocr文字焦点点击做了优化,而我这个冷门的场景,我想工程师们都没有想到的。在配合他的速度,体验真的好。

  当然,从响应速度来说,即使世界说,那个速度,比起旁白的屏幕识别,那还差一些。毕竟,它能做到让你感觉极低延迟,连续侦测的完美体验,但是没有买iPhone的坛友们,你们不要被他的表象骗了,还是那个冷门的王者荣耀的场景,我们的天坦好歹能自己独立开一局,可是旁白吗?它做不到。到了游戏大厅的场景,人家甘萃把屏幕上所有的内容都读了一遍,就是不能执行点击。你说气不气。当然,我想这都是拓展,最普通的借助ocr点击的场景,大家都很不错。只不过ios这里依托于继承性高,有着天然优势。还有一个Windows的win10本地ocr,是一个离线接口,那个识别效率,真的高,至少在争渡保亿电脑读平调用的时候,无比的丝滑。看来,系统集成的优势,可真的无法比拟啊。

  到了离线和快速两个要素的实现,酒有了字幕识别,说真的,在解说用了那个功能以后,我就非常的期待,天坦也出一个这样的功能,对了,这个功能IPO是没有的。赶紧跟进一下,多利用起来,这个ocr技术,可以被使用得更加充分。

  其实,上面的都是小意思,毕竟识别屏幕截图,这个难度比起拍摄蚊子再来识别可是简单的多。我用天坦文字识别还有一个用处那就是:请客喝奶茶的时候,用手机拍标签,然后读上面的字。说起来,即使我现在已经是一个脱离了九年义务教育,正在就读高中,可是我的识字量是0。这就尴尬了,再出门,在点餐,在朗读材料,拍照识别是我不可或缺的功能。以前不知道,后来在翻百宝箱的时候,才发现了其实我们的天坦是有物体识别,文字识别等功能的。可是每一次都要打开百宝箱,如果有一个快捷指令,直接打开这个功能,我想这会更好地。顺便说一个自己的想象,前几次的出行,让我发现,手机拍照,在识别朗读的方式,是在在公共场合里不太方便。如果ocr能更加的精确,配合高精度的相机,我们能不能有一个设备,长得像眼睛,又具备相机ocr识别的功能。我希望,这个产品真的做了出来,最好是小米华为苹果做出来,因为我希望这是一个功能,而不是单独的一个产品。想想看,用几千买来的就是一个可以ocr识别的眼镜像机,实在不太划算,估计这些项目也没有办法立项。但是,如果这是一个集成的功能,放在只能眼镜中,那么依靠着大厂产品的产品力,就有大产能,高销量的优势,这样的话,后期维护会更勤快,价格也不会特别高。但如果是小公司,那么供应链成本降不下来,技术成电又不够,实在没有美丽的价格。

  其实说了这些,我希望在未来的日子里,能多多优化ocr。这对于我们来说,是一项革命的技术。有了他,配合相机,我们说不定就有了一部分眼睛的功能,这想想就让人兴奋啊。

共 5 条评论
0 

坐个沙发,感觉楼主的想法很酷诶,希望未来能实现,其实现在的技术做到这些因该不算难吧

0 

来坐个板凳好吧?为什么楼主要叫愤怒的键盘侠,真好奇这个名字怎么来的?嘿嘿。

0 

对了,咱们小毛毯工具箱的文字识别似乎已经可以快速启动啦,快捷首饰快捷键和滑动菜单都可以实现,真的超爱这个功能,拍照的时候的语音提示超赞,还有能快速启动也很棒

叮咚 1年前
0 

文字识别在电脑上感觉用处比手机大多了,电脑那个无障碍环境比手机差很多,有的软件是不支持读屏朗读的,用那个文字识别就非常方便了。这个微软还是好的,那个接口速度是真的快,从按键到识别出结果,只需要一秒左右,甚至有时候还能更快一些。就是那东西识别准确率有点低,但是也能用,并且对某些文本好像还做了优化识别,有的东西准确率就高,如果遇到复杂界面,准确率就会下降挺多。没有那东西,电脑使用就麻烦很多了,再次点赞微软

0 

来个地下室,楼主的见解很独到呢,而且很实用

添加一条新评论

登录后可以发表评论 去登录