4 用户55219 2个月前 185次点击
您好,我在使用百宝箱的文字识别功能的时候,当导入PDF扫描版后再点击更多里面直接导入的时候有一个高精度文字识别可是点击完了以后,这个按钮就消失了,我认为这样有一个小弊端,就是如果不小心识别不是很完整的时候在想要重新识别,按钮就已经没了,就需要重新进行导入。我在识别一个PDF扫描版文档的时候,就遇到了这样的问题,当时我没有识别完毕,可能就直接分享了TXT文档而分享出的TST文档是不完整的,我想要重新识别的时候高精度文字识别这个按钮已经没有了,当然我知道我们也有离线识别的功能。但是离线识别的精度还有错别字的情况来说,肯定还是要差一些。还有一个小问题,但是这个可能克服起来难度有点大,应该是跟OCR的接口有关,就是好像表格的排版还是会比较乱一些能不能够在升级的时候考虑到这个问题识别的时候把表格识别也融入进去不知道这个难度大不大。
对,我感觉表格识别可能有点儿难,但是加上还是挺有必要的可能对我更有必要一些。因为识别一些教材有很多是需要用到表格识别的,因为他们排版的本身就是一个一个的表格,现有的很多表格识别的都需是需要一个一个图片上传,像这种整个的PDF的可能只有ABBYY但是那个软件有一个致命的缺点,就是错别字太多了,当然,这只是我的一个小小的期待,如果我们天坦读屏能加上这个那可是太方便了。
哦,那这样就可以了,可能是我之前没注意这一点
表格识别有些难,但是有必要加上。