如何自动抓取word或者pdf文
不知道你是用什么开发工具的,如果用Delphi,我可以告诉你一个大致的思路。
首先你需要建立一个WordApplication的COM接口,然后将Word文件赋值给这个接口;
建立一个ExcelApplication的COM接口,并建立一个空白的Excel文件;
然后读出这个文件中的每一段,并将其赋值给相应的一个字符串变量,比如把“张三”赋值给“姓名”变量;把“男”赋值给“性别”变量;
通过这些变量,把相应的变量值送入Excel文件。
最后,关闭Word接口和Excel接口。
如果是PDF文件,你需要将其转化为Word文件再处理。
我这里已经有了具体的源代码,并已经调试成功。如果你是学...全部
不知道你是用什么开发工具的,如果用Delphi,我可以告诉你一个大致的思路。
首先你需要建立一个WordApplication的COM接口,然后将Word文件赋值给这个接口;
建立一个ExcelApplication的COM接口,并建立一个空白的Excel文件;
然后读出这个文件中的每一段,并将其赋值给相应的一个字符串变量,比如把“张三”赋值给“姓名”变量;把“男”赋值给“性别”变量;
通过这些变量,把相应的变量值送入Excel文件。
最后,关闭Word接口和Excel接口。
如果是PDF文件,你需要将其转化为Word文件再处理。
我这里已经有了具体的源代码,并已经调试成功。如果你是学习Delphi 的我可以给你贴出来,否则,贴出来就没有什么意义了。
收起