神兵的无字真经:图片格式的PDF如何把其中的问题分离出来?

来源:百度文库 编辑:中科新闻网 时间:2024/05/15 02:59:06
我手头上有个pdf格式的文件,是由扫描仪扫描进入的文字文档,我用过Adobe Acrobat 7.0 Professional 的“另存为”,可是转化后的word仍是图片格式的文字,仍不能进行编辑。
所以我现在用的是键盘上的“Print Screen”截图然后用OCR进行文字识别,由于原本的pdf文件的扫描很不清晰,所以一页要截图两次,否则识别率极低。我这个文档有五百多页,这样进行了3天也才搞了60多页。
所以请教高手,如何才能批量处理 ?
谢谢!

http://www.yesky.com/109/1816609_1.shtml
来这里看看吧,有可能帮到你!!

装一个识别软件:汉王识别,别的什么就解决了。