在日常办公中,我们都会遇到需要把PDF文档转换成Word文档的时候。按正常来说,用作存档的电子文件,PDF格式跟Word格式区别不大。而PDF软件基本都可以把文档输出成Word,但是这种输出只是把PDF页面当成是图片,直接粘贴到Word里面罢了。当你需要编辑这个文档的时候,才会发现这种转换根本没什么作用。
那么,如何把PDF文档转换成真正的Word文档呢?之前我写过的《打印稿变电子稿》是使用Microsoft Office Document Imaging这个Office组件实现转换,但在操作上较为复杂,而且转换的精确率不太高。现在介绍另外一种方法,较为简便,就是使用PDF-Xchange软件。
这个软件对于可搜索的PDF文档,是可以直接选择里面的文字并拷贝到Word里面的,完成拷贝后再排版,就可以得到真正的Word文档了。
但是,如果遇到不可搜索的PDF文档,就只能使用这个软件的OCR识别功能,先把文档转换成可搜索的PDF文档,具体方法如下:
1、添加识别语言
在PDF-Xchange的OCR识别功能里面,并没有默认添加中文识别的语言包,需要重新从官网上下载语言文件,具体操作步骤是:通过“转换”—“识别页面”对话框里面的“更多语言”,打开PDF-Xchange的官网,下载相应的语言包后,解压安装即可。
2、打开需要转换的PDF文档,然后打开“转换”—“识别页面”对话框,按需求选择好页面范围、识别语言以及输出类型,然后点击确定后,等待软件识别即可。在这里,我一般是按以下的选项去处理文档的:
页面范围:全部
识别语言:勾选中文和英文
准确性:高(这个选项会导致转换速度较慢)
输出类型:创建新的壳搜索的PDF
质量:400
3、转换完毕后再选中所有的文字,拷贝到Word里面,再对照PDF文档完成排版即可。这个步骤是无法避免的,因为识别软件是不可能把格式也识别出来,所以这个只能人工去做了,而且不管识别的准确性有多高,转换的文档总会有些无法识别的地方,比如手写的签名。这些无法识别的只能靠人工去修正了。
按照以上方法,你可以把纸质文档扫描成PDF后,再转换成Word文档来使用,虽然在排版上会比较花时间,但至少你可以省去了打字的时间,提高一些工作效率了。
|
文章
|
23637
|
创建日期
|
2-1-2019
|
作者
|
zhongmc
|
评分
|
(None)
|
|