智能识别的建议

10 钢琴的心声 3周前 331次点击

不知道能不能针对证件和银行卡这些做一个识别功能,我想到了两个方面的使用场景。

第一,就像带引导的文字识别一样,但是需要符合拍摄证件的要求,语音提示用户调整角度,把证件挪入框内,调整清晰之后瞬间拍照,这样就能得到一张合格的,可以用来上传的证件的照片。

第二种是类似悬浮窗的,有些软件没有上传图片功能,只能当时拍照上传,然后在拍摄的过程中同样有语音时时提醒。

共 26 条评论
0 

没必要做,你拍照的时候用豆包的屏幕共享功能就行了,可以实时询问有没有把拍摄对象包括在取景框里。天坦的开发速度实在太慢了,应该把有限的精力放在不可替代的功能上,比如更好的输入法。

钢琴的心声 [楼主] 3周前
0 
拜托,都多长时间了,豆包还没玩明白吗,你不问他,他根本不会说话,就算真的对齐了也不行,屏幕上并不是干干净净的,还有很多按钮和边框,这样的图片截图下来根本不能用,而且自动识别对准之后自动截图,也能避免手抖乱晃之类的问题
0 

你不会用文档模式拍吗,现在还有哪个手机没有文档模式

你只要保证你要拍的东西在取景框里面就行了,边边角角的部分文档模式都会帮你裁剪掉,哪怕角度是倾斜的也没关系他会帮你调整成垂直拍摄的样子。

豆包主动提醒也已经开始测试了,你猜是豆包开放这个功能快还是天坦的开发速度快?

钢琴的心声 [楼主] 3周前
0 
你要是用不着就不要阻止别人好吧,到底能不能做还不知道,你是不是太闲了
0 

我当然是能知道这么做才告诉你的,而且我也是一直这么做的

钢琴的心声 [楼主] 3周前
0 
读屏里很多功能通过其他软件也能实现,包括你之前说的输入法,更是一大堆,你为啥还要读屏去做,不都一样吗,读屏开发出来的才是最适合我们使用的,我的建议为什么要随着你的习惯
0 

行啊,你先说一个其他的输入法支持天坦读屏全屏模式以及无触摸浏览操作的?真要是随随便便都有第三方的替代品就不会有这么多人反馈输入法问题了

钢琴的心声 [楼主] 3周前
0 
你也知道其他的输入法不够方便,所以事实证明读屏才能针对性的开发适合我们的功能,凭什么我就不能题建议呢
0 

没问题,你当然可以提建议,我也可以提出已有的解决方案, 我也说了天坦开发的经历实在是捉襟见肘,所以必须好钢用在刀刃上,什么事情都指望他解决,结果就是样样都做样样都不精,样样都被第三方解决方案吊打。

钢琴的心声 [楼主] 3周前
0 
我倒是认为输入法现在最起码能用,而我需要的这个功能,目前并没有真正方便的替代方式,谁都有自己的习惯和看法,一上来就说没必要做,太霸道了点
0 

因为我现实中的工作就是档案管理,拍身份证拍合同是家常便饭,我敢说对于这个功能的需求和了解绝对超过99%的人,VIVO看见和落寞工具箱拍照不好用就是因为他们的拍照部分做的不好,而不是主动提示部分,能把文件边缘不需要的部分裁剪掉以及调整倾斜角度是非常专业的事情,用专业的文档模式相机配合大模型描述才能保证拍下来的文件完全准确,万无一失,我既然是靠这个吃饭的,当然对我的言论有绝对的自信。

钢琴的心声 [楼主] 3周前
0 
然后能证明什么,你解决不了那么多人的问题
0 

您说笑了,我本来就没有义务帮别人解决问题,在这个内卷的社会,能帮自己的只有自己,你大可无视我的方案然后继续等待你想象中更好的方案。

钢琴的心声 [楼主] 3周前
0 
你当然没有义务帮别人解决问题,但是为什么要阻止别人找更好的方法,你既不能教大家使用,又不让出相应的功能,说了半天有什么用,来绣优越感吗
0 

我认为我已经提出了更好的且当前可行的方法并且已经交给你了,甚至还提出了其他几种方案的不足和缺陷,如果你什么都看不到,那我们的讨论可以到此为止了,您没有必要再回复我,谢谢。

钢琴的心声 [楼主] 3周前
0 
我需要更方便的功能,很感谢你给我提供其他的方法,但是你没有权利来阻止我的反馈,希望你也能分清楚,你同样有希望优化的功能
去试一下VIVO看见的文档卡证能不能满足你的要求。
钢琴的心声 [楼主] 3周前
0 
文字识别已经有相似的功能了,我认为技术上是没有障碍的,只是不清楚涉及到证件,有没有什么不方便的
0 

这种功能的话好像落寞工具箱就有,他会提醒你

钢琴的心声 [楼主] 3周前
0 
谢谢,我去看看
0 

自动引导拍照,它是不需要那个那个超级会员的

0 
楼主想要的这个功能,个人感觉应该是可以做到的。 Vivo看见就可以。他的文档卡证拍照模式就是楼主描述的这个样子。不过效果并不好。比较容易歪斜。感觉再做一下优化,就能府河需了。豆包的那个屏幕共享我也试过,感觉确实差一些。不好用

支持,我是了我手机的什么文档那个,首先说我是全盲,我打开以后它什么都不读怎么让我去拍身份证呢。难道让我开自带的读屏吗,我觉得这个功能还是有必要的

肯特 2周前
0 
其实目前的文字识别带引导就是会自动的进行一个矫正,但涉及到模型方面。可能没有那么准确。目前比较成熟的就是手机自带的一些文档卡证模式。
钢琴的心声 [楼主] 2周前
0 
嗯,就是这个意思,要是能做出来更好
添加一条新评论

登录后可以发表评论 去登录