黄咪被高山打手心视频:如何自动抓取word或者pdf文档中的数据

来源:百度文库 编辑:中科新闻网 时间:2024/05/09 07:45:18
一个word或pdf文件中每一页的格式都是相同的,只是具体的数据不同,例如第一页是张三,男,体重70公斤等等,第二页是李四,女,体重50公斤等等,不知有没有软件可以自动抓取这些数据,或者如何编写程序来自动抓取这些数据,万望赐教。

另一个问题是如果是n个word或者pdf文档,每一个文档都有很多页,但是这些文档的格式都是相同的,只是具体的数据不同,那将又如何自动抓取呢?
我的意思是把这些数据原来在word或pdf文档中,现在要把它们抓出来放在excel或access文件中,我的意思也可以这样表达,我们都知道word中有一个邮件合并的功能,它能够利用excel或者数据库中文件,自动生成word文档,我现在要做的是它的逆过程,就是现在有了生成的word文档,如何把数据收集起来放在excel或者数据库中?

用EXCEL就好办了

这位老兄,根据我多年的使用OFFICE软件的经验来看,这是不可能的。
我看了好多办公自动化的书,单位附件大学里的办公自动化的书我都看一遍了,没有一本书讲这个的,所以据推测,没有这项功能,老兄,还是麻烦点,复制吧。