建议读屏加入deepseek OCR文字识别模型。

6 寒雪落花静云月 1个月前 492次点击

昨天刚发布的模型。

3B(30亿参数)

60倍压缩比下还能保持60%的准确率。

一般的准确率可以保持在97%左右。

其原理就是光学视觉压缩的原理。

只要理解文字,然后提取文字,然后保留格式。最终输出MD格式的文本。

他压缩之后,处理几万字的内容的超长图片都可以进行。所以建议这么优秀的模型可以加上。

1张h100显卡一天可以跑20万张图片的处理。这么大的公司不至于显卡都买不起。所以建议加上,直接用个几张显卡,服务器配上应该够盲人的需求了。拍照识别文字和手机屏幕识别都可以运用上。

共 9 条评论
爱莎公主 1个月前
0 
支持一下。
爱莎公主 1个月前
0 
啥时候百宝箱的读书能够把AI弄进去?就是那种可以主动查询书籍内容,然后总结书籍概要。
寒月忧梦 1个月前
0 

支持

TEKMAN 1个月前
0 

你想的太天真了,云服务最大的考验是稳定性,不是算力,怎么应付停电,怎么应付区域网络波动,怎么让全国各地的盲人使用这个服务都能达到同样的延迟体验,服务器中途维护的时候需要有冗余备份保证服务不中断,你让天坦公司自己买计算卡搭建服务根本达不到上面这些要求。不然你以为百度云阿里云华为云这些云服务提供商是干什么的。

0 

这才是大实话

这玩意儿光嘴上说支持没用啊,几乎每天都能看到一条建议hhh

柳叶清风 1个月前
0 
个人感觉这也是大实
只要钱到位那都不是问题,但是要钱到位
爱莎公主 1个月前
0 
能用钱解决的问题都是小问题。
添加一条新评论

登录后可以发表评论 去登录

作者

积分:4717

6%5EX%5EY%5EA%5ER%5ENT%5ELW%5EZ%5EKT0X%5EA6RRY92U%5EW%5EQD%5EJL%5EC%5ETQ%5EM%5EWFP%5EY2T%5EZ%5ED%5EF%5EW%5EYMJ3%5ES%5ER%5EN67%5ES7%5EN%5EY%5ETH%5EZ1%5EXDO%5EF%5ES%5EVV%5EJ7D2%5EW3Z%5EQ1EF%2B%5EJ%5ELLW%5ELM%5EC%5EBU%5EWS%5ETZVC%5ED%5EH%5EA%5EG%5EE%5ER%5EL1%5ER6N3P1T%5EY3F%5EKB%5EI0SZ%5EU%5ED3%5EYA9LM