建议读屏加入deepseek OCR文字识别模型。

5 寒雪落花静云月 15小时前 172次点击

昨天刚发布的模型。

3B(30亿参数)

60倍压缩比下还能保持60%的准确率。

一般的准确率可以保持在97%左右。

其原理就是光学视觉压缩的原理。

只要理解文字,然后提取文字,然后保留格式。最终输出MD格式的文本。

他压缩之后,处理几万字的内容的超长图片都可以进行。所以建议这么优秀的模型可以加上。

1张h100显卡一天可以跑20万张图片的处理。这么大的公司不至于显卡都买不起。所以建议加上,直接用个几张显卡,服务器配上应该够盲人的需求了。拍照识别文字和手机屏幕识别都可以运用上。

共 9 条评论
爱莎公主 15小时前
0 
支持一下。
爱莎公主 15小时前
0 
啥时候百宝箱的读书能够把AI弄进去?就是那种可以主动查询书籍内容,然后总结书籍概要。
寒月忧梦 15小时前
0 

支持

用户734534 15小时前
0 

你想的太天真了,云服务最大的考验是稳定性,不是算力,怎么应付停电,怎么应付区域网络波动,怎么让全国各地的盲人使用这个服务都能达到同样的延迟体验,服务器中途维护的时候需要有冗余备份保证服务不中断,你让天坦公司自己买计算卡搭建服务根本达不到上面这些要求。不然你以为百度云阿里云华为云这些云服务提供商是干什么的。

永恒的流星 14小时前
0 

这才是大实话

0 

这玩意儿光嘴上说支持没用啊,几乎每天都能看到一条建议hhh

柳叶清风 12小时前
0 
个人感觉这也是大实
只要钱到位那都不是问题,但是要钱到位
爱莎公主 6小时前
0 
能用钱解决的问题都是小问题。
添加一条新评论

登录后可以发表评论 去登录