南斯拉夫老电影译制片:何谓OCR？

来源：百度文库编辑：中科新闻网时间：2024/04/28 21:43:29

在介绍验证码的文章中谈到了“防止OCR”。请问“OCR”的定义？

把图片里面的文字变成文本
比如我把语文书拍进扫描仪里一扫
打开word，通过OCR软件，这页书里的课文：孔乙己……就全全进入Word了，仿佛我刚刚用了几秒钟的时间输入的一样，不过会有许多的错字，主要有扫描效果决定。
至于你问的防止OCR就是有些恶意注册或恶意登陆软件，会用OCR软件扫描那些面目全非的验证码得到里面的数字，从而继续恶意攻击之类的事情。于是乎验证码越来越面目全非……

汉字识别OCR（"光学字符识别"的英文编写）是为了使汉字信息高速输入计算机，以解决低速的信息输入与高速信息处理之间的矛盾，从而提高整个计算机系统的效率。这种根据汉字人工编码录入汉字文本的方法，从根本上改变了人们对计算机汉字人工编码录入的概念。使人们从繁重的键盘录入汉字的劳动中解脱出来。只要用扫描仪将整页文本图像输入到计算机，就能通过OCR软件自动产生汉字文本文件，这与人手工键入的汉字效果是一样的，但速度比手工快几十倍。所以OCR产品的推广意义是深远的。

提高OCR识别率

购买了扫描仪，你一定会发现，附赠的软件中有中英文OCR识别软件，当然一般都是基础版。很多人认为此类OCR的识别率不是很高，甚至怀疑只有那些正版的数千元的OCR软件其识别率才很高。其实，你只要注意使用技巧，此类OCR的识别率完全可达实用化水平。

1、处理原稿扫描图像，使之清晰可“辨”。在其它因素都满足的前提下，对一般的印刷稿、打印稿（包括清晰的针打稿）等质量较好的文稿进行识别，其识别率一般可达到98％以上。而对报纸、复印件等不太清晰的文稿进行识别，无论哪种OCR都难以达到较高的识别率。对那些原稿不太清晰的，要注意识别前对图像加以处理，除去其上的污迹。并注意将偏斜的版面“改斜归正”，通常OCR软件均有此功能，且一般都设有自动纠偏和手动纠偏。

2、分辨率应选择适宜。一般选择300dpi较合适，分辨率选小了会使识别率降低，选得太大了并不能有效提高识别率，还会大幅度加长文件长度，浪费处理时间。有的扫描软件设备上有一项“OCR扫描”，干脆将分辨率锁定为300dpi，这是很有道理的。

3、调整好亮度值和对比度值。这条非常关键，对识别率的影响很大。亮度值的调整是在识别前，先看看扫描得到的图像中文字质量如何，如果文字线条凹凸不平，甚至有断线，说明亮度值太大了，应减小亮度值；当文字线条很黑很粗，甚至挤成了黑疙瘩，分不清笔划时，则说明亮度值太小了，应增加亮度值；对比度的调节要视原稿确定，笔者常根据预扫时图像清晰度确定。

4、利用OCR的自学习功能。有时OCR对某些字总是难以识别，比如OCR开始对“的”和“二”等字总是搞错，这时可以利用OCR软件的自学习功能，“引导”它正确识别一次（有些不同的字体各需一次），它以后就对这些字“熟识”了。具体操作极易，上机看一下菜单即可明白。另外，若原稿全是英文或其中中文很少，最好用附赠的英文OCR软件。还有，现在已有一些很好的文字校对软件，其中一般都设置了OCR校对，利用这些软件先行处理一下所得文本文件，则可大大减轻人工校对负担。

何谓OCR？什么是OCR？ OCR是什么意思？什么是OCR OCR是什么？？ acrobat ocr OCR是什么意思 OCR是什么？什么是”OCR”，中文名称是什么？如何使用汉王OCR?