发布于:2008-11-12 10:53:12
来自:环保工程/环保软件
[复制转发]
关于如何把pdf转化为可编辑文档的问题
在网站上一连看到几个问如何转pdf为可编辑文档的帖子,本人日常从事文字工作,对word、pdf这两种最常用的文档格式比较了解,回答如下:
⑴ pdf文档中的文字一般由两种来源,一种是由可编辑文档转成的,如txt,word等转来的,这种好办。①在adobe reader中可以直接另存为txt格式,可以把纯文字内容保存下来,表格和图片是无法保存的。②在adobe acrobat中另存为其它格式,可存的格式很多,如jpg,word,txt,rtf等,此时可以存为word或rtf,一般能把pdf中的95%内容保存下来,包括图片和表格。
⑵ 另一种转化来源是图片格式,比如你用扫描仪把一页文字扫成图片,然后转成pdf或你用可编辑图片的软件photoshop在一张图片上写字,把这张图片转成了pdf。此时再由pdf转可编辑文字是【比较难的】,只能通过OCR(文字识别)软件来完成,完成质量的好坏取决于pdf中文字的清晰度、校正度以及所用的OCR软件的性能。目前比较流失的ocr软件一般为汉王、尚书、清华同方等。转化途径如下:①首先把pdf转化为图片(adobe acrobat可以直接另存实现,或用其它软件),然后用汉王OCR软件识别为txt。②用office2003带的Microsoft Office Document Imaging打印机打印成MDI格式,然后点识别转化,转化为word格式。此种方法可以批量实现转化,适用于清晰,无倾斜的pdf文档,一般扫描而来的文档不适用此方法。
③adobe acrobat本身也带ocr识别,毕竟是外国人的作品,本人试过,识别效果跟前两种根本无法比拟。
注:word文档其实为.doc格式,为方便理解文中都说成了word格式。
全部回复(3 )
只看楼主 我来说两句-
yjc_0806
沙发
将PDF文件转换成WORD文档,就方便多了
2010-11-14 12:11:14
赞同0
-
guojianjiang
板凳
学习了,刚好遇到问题呢,呵呵非常感谢
2010-06-20 07:53:20
赞同0
加载更多回复 举报
回复 举报