dxsheng_2 发表于 2007-4-23 01:45

【请教】中文OCR软件大家都用什么?

现在有很多文档都需要是图片格式的,尤其是有些PDF文档也是图片格式的,不能进行编辑。不知道大家是怎么改成可编辑的文档的。还有就是一些中文书籍,扫描以后都是图片,你们如何将其变成可编辑的文档的?

就我的经历来看,我使用过清华紫光OCR软件,效果一般。后来用过汉王文本王,效果不错,现在我用的是尚书七号,是我所见到过的中文OCR中识别效果比较好的。还有一个就是office 2003自带的document imaging,效果也不错,配合office 2003的专用虚拟打印程序,可以轻易的将一些图片格式的文件进行识别。

希望大家见到这个贴子以后踊跃发言,互相取长补短,能够使用上最好的软件。

nbtp 发表于 2007-4-23 09:21

我也需要,最好是英文识别率比较高的

21cnsound 发表于 2007-4-23 10:21

微软OFFICE2003自带的和几百K的miniOCR(对字体和字号有要求)。

spark1 发表于 2007-4-23 10:56

尚书七号
慧视视觉图像文字识别系统

DL 发表于 2007-4-23 12:28

回复 #2 nbtp 的帖子

可以试试ABBYY的FineReader

bigtime 发表于 2007-4-23 12:38

我觉得紫光的还可以啊

dxsheng_2 发表于 2007-4-23 18:06

原帖由 DL 于 2007-4-23 12:28 发表 http://www.ibmnb.com/images/common/back.gif
可以试试ABBYY的FineReader

英文的倒适合用Abbyy,但中文的呢?大家推荐推荐,互相交流。

Daney 发表于 2007-4-23 18:08

尚书七号

dxsheng_2 发表于 2007-4-28 00:43

回复 #2 nbtp 的帖子

如果要英文的,可以用abbyy的finereader,自己到网上搜索。

hhtree 发表于 2007-5-15 17:37

楼主,要英文的最好是OMEG啊,英文或者是印欧文字的识别率高达95%以上,这还是保守的。
我用过,基本上识别的文档不用再做排版。好强。

我在霏凡上发了正版序列号。

nine 发表于 2007-5-16 19:50

尚书七号是很好用的。
页: [1]
查看完整版本: 【请教】中文OCR软件大家都用什么?