【寻找】有无一种OCR软件,可以识别起点的小说图片?
起点中文网的VIP小说都是图形方式的,有无一种OCR软件可以准确地将其识别转换成为文本呢?希望各位有经验的大大不吝赐教 有倒是有,但是识别率是个问题,据说现在方正有款扫书仪很厉害,能基本100%。 扫书仪也是先把书扫成图片再识别的吧,那现在已经有了现成的图片,应该更方便才对啊
难道是因为起点用的不是宋体之类的印刷体? 楼上的说法对头。起点中文用的是启体简体,而一般的OCR主要识别的是宋体简体,所以识别率相当的低。这一点我以前早就试过了。 网上找了一下,见到有人推荐汉王、尚青等等OCR软件,也有说直接用Office2003的
不过好像很多书的电子版都有了(看了几个其中错别字还是不少),所以暂时不需要自己去研究了
尚书七号ocr已注册版下载地址
http://www.d3down.com/down.asp?id=1124&no=2已经测试过了,可以下载,速度很快 要是起點加上水印,那不是先要ps,再OCR?
尚书OCR 6.0(38.6MB)
不好意思这个地址好用http://www.oldrain.com/other/SHOCR60.zip Posted by hotnoodle on 2007-10-4 10:28 http://www.ibmnb.com/images/common/back.gif
要是起點加上水印,那不是先要ps,再OCR?
起点倒是没有加上什么水印,只是在图片四角有一串数字,是VIP订阅的识别码
反正现在已经有很多高人在搞转换,我等就不需要去自己动手了
看了几个觉得识别率还是蛮高的,至于错别字,其实很多是原作者自己的杰作 汉王比较出名。 http://www.onlinedown.net/soft/266446.htm
新科技ocr
好不好用,用用就知道 ABBYY FineReader 11 Professional Edition v11.0.102.481 Build 975.7
这个才是王道,楼主搜搜吧 进来学习一下,顺便每日报道贴 12楼的意见相当好 一直用ABBYY FineReader onenote 2010试过吗? 图片先转成pdf,在用pdf-office工具试试看、。 这个要留个印。。。:D :D 新科技ocr 试试这个 简单易用
http://www.onlinedown.net/soft/266446.htm ABBYY FineReader 11 Professional Edition,这个确实厉害!现在最新都到v11.0.102.583了吧!
企业版的功能好像更强大,但是作为个人来说专业版的已经够用了!呵呵 帮顶一下 起点那个字体真难看
页:
[1]