请问急!!!!
可以用OCR软件来识别文字资料,并发送到WORD里编辑..
OCR("光学字符识别"的英文编写)是为了使汉字信息高速输入计算机,以解决低速的信息输入与高速信息处理之间的矛盾,从而提高整个计算机系统的效率。 这种根据汉字人工编码录入汉字文本的方法,从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。 所以OCR产品的推广意义是深远的。
提高OCR识别率
购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软...全部
可以用OCR软件来识别文字资料,并发送到WORD里编辑..
OCR("光学字符识别"的英文编写)是为了使汉字信息高速输入计算机,以解决低速的信息输入与高速信息处理之间的矛盾,从而提高整个计算机系统的效率。
这种根据汉字人工编码录入汉字文本的方法,从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机,就能通过OCR软件自动产生汉字文本文件,这与人手工键入的汉字效果是一样的,但速度比手工快几十倍。
所以OCR产品的推广意义是深远的。
提高OCR识别率
购买了扫描仪,你一定会发现,附赠的软件中有中英文OCR识别软件,当然一般都是基础版。很多人认为此类OCR的识别率不是很高,甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。
其实,你只要注意使用技巧,此类OCR的识别率完全可达实用化水平。
1、处理原稿扫描图像,使之清晰可“辨”。在其它因素都满足的前提下,对一般的印刷稿、打印稿(包括清晰的针打稿)等质量较好的文稿进行识别,其识别率一般可达到98%以上。
而对报纸、复印件等不太清晰的文稿进行识别,无论哪种OCR都难以达到较高的识别率。对那些原稿不太清晰的,要注意识别前对图像加以处理,除去其上的污迹。并注意将偏斜的版面“改斜归正”,通常OCR软件均有此功能,且一般都设有自动纠偏和手动纠偏。
2、分辨率应选择适宜。一般选择300dpi较合适,分辨率选小了会使识别率降低,选得太大了并不能有效提高识别率,还会大幅度加长文件长度,浪费处理时间。有的扫描软件设备上有一项“OCR扫描”,干脆将分辨率锁定为300dpi,这是很有道理的。
3、调整好亮度值和对比度值。这条非常关键,对识别率的影响很大。亮度值的调整是在识别前,先看看扫描得到的图像中文字质量如何,如果文字线条凹凸不平,甚至有断线,说明亮度值太大了,应减小亮度值;当文字线条很黑很粗,甚至挤成了黑疙瘩,分不清笔划时,则说明亮度值太小了,应增加亮度值;对比度的调节要视原稿确定,笔者常根据预扫时图像清晰度确定。
4、利用OCR的自学习功能。有时OCR对某些字总是难以识别,比如OCR开始对“的”和“二”等字总是搞错,这时可以利用OCR软件的自学习功能,“引导”它正确识别一次(有些不同的字体各需一次),它以后就对这些字“熟识”了。
具体操作极易,上机看一下菜单即可明白。另外,若原稿全是英文或其中中文很少,最好用附赠的英文OCR软件。还有,现在已有一些很好的文字校对软件,其中一般都设置了OCR校对,利用这些软件先行处理一下所得文本文件,则可大大减轻人工校对负担。
参考资料:
五大王牌OCR软件:
清华紫光 OCR,尚书OCR,汉王OCR,蒙怡OCR,丹青OCR
清华紫光 OCR是一套集OCR识别、高效校对、版面还原、自动生成THML、PDF、RTF、TXT、WPS等多种格式的文档、先进的流程管理和质量控制为一体的自动化数据处理转换系统。
彻底解决传统数据录入方式效率低下、错误率无法保证、校对方式陈旧等问题、极好地满足了专业用户的需求。让用户亲身体验到:
高效:具有对超大字符集(达二万余字)、超多种字体(近百种)的汉字识别能力;具有对彩色及复杂中文报纸等进行版面分析、版面理解和准确复原的能力,生产效率是传统生产方式的3倍以上。
高质:不需打印校样,一次录入就能达到出版质量,将电子文档的错误率控制在万分之一以下。
增强竞争力:TH-OCR2000的数据处理方式得到的数据不再是传统的格式单一、版式简单的数据,它可将加工的数据应用于再版、光盘出版、网上出版、接入各类数据库等,有了这些优势让您在同行业内处于绝对的竞争优势。
office2003本身也自带有OCR功能.
。收起