黄金瞳在线全文阅读:我想把扫描的文字转化成word格式,但是用ocr转换之后,出现很多乱码,是怎么回事?

来源:百度文库 编辑:中科新闻网 时间:2024/04/24 20:21:41

是否文字的方向不对,请正确调整文字方向。
是否定义的文字属性(简体多体、繁体多体、纯英文、手写体等)与原稿不符,请设定字旁有辅助线,字体为斜体或艺术字等,此类原稿不能被正确识别。
是否原稿中的文的分辨率是否不合适,请在扫描扫描时设置相应的文字属性。时参照分辨率设定与字号大小对照表中的推荐值选择适合的分辨率。
扫描文稿时设定了镜像处理功能,扫描结果图像与原稿左右相反。原稿不清晰(如传真件、油印试卷、报纸等),若是报纸,可以适当地调节图像的对比度或亮度以得到较好的扫描效果,提高识别率。

CAJ文件转换为word中的过程也比较简单,打开它并且用它打开一个CAJ文件,如果这时点工具栏上的图像选择然后再点文字识别的话常常会出现乱码,你可以这样来做,点栏选----点复制,然后粘贴到word中这样的话就不大会出现乱码的,你可以试试看。也有可能是版本不够高的原因,所以在识别的时候按你上面说的方法常出现乱码,,,不过你在选择文字识别时不要选用带数学公式的那种,这样的情况一般是很难识别的。你不妨试试我的办法吧。就是点栏选托动一段文字---然后点复制,这样的话就行了。

用OCR软件识别后,如果直接粘贴到word里,经常会出现这种情况,具体原因我也不清楚。不但是OCR识别的文字,就连网页上的文字往word里粘贴,有时也会出现这种情况。估计是内码的问题吧。

想彻底解决问题,你就直接用带有word文档输出功能的OCR软件吧。汉王文本王、紫光的都有这个功能,识别率都挺高的。