求教:扫描的PDF文件怎么转换成
是图片的话我试过生成pdf格式后,直接用foxit reader或软件是adobe reader是不能复制的(即不能复制到word文档进行编辑)我推荐使用中国知网的cajviewer软件,它有文字识别功能,识别后再复制到word。 (见图,图中的pdf是由专利说明书(。tiff图片格式)生成的)。当然,可以通过文件-->另存为,将其存为。txt格式,再转为word文档(我试过,它是能够的)。
下载地址:
另还有其它识别软件如尚书七号(或其它版本)
尚书七号(文字识别)
本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据...全部
是图片的话我试过生成pdf格式后,直接用foxit reader或软件是adobe reader是不能复制的(即不能复制到word文档进行编辑)我推荐使用中国知网的cajviewer软件,它有文字识别功能,识别后再复制到word。
(见图,图中的pdf是由专利说明书(。tiff图片格式)生成的)。当然,可以通过文件-->另存为,将其存为。txt格式,再转为word文档(我试过,它是能够的)。
下载地址:
另还有其它识别软件如尚书七号(或其它版本)
尚书七号(文字识别)
本软件系统是应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。
本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
识别字符 简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
纯英文字符集。 简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
识别字体种类 能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
识别字号 初号 小六号字体。
表格识别 可以自动判断、拆分、识别和还原各种通用型印刷体表格。
可支持繁体WINDOWS系统
。收起