使用Office2003自带的工具转换
首先使用Adobe Reader打开待转换的PDF文件,接下来选择“文件→打印”菜单,在打开的“打印”设置窗口中将“打印机”栏中的“名称”设置为“Microsoft Office Document Image Writer”,确认后将该PDF文件输出为MDI格式的虚拟打印文件。
如果在“名称”设置的下拉列表中没有找到“Microsoft Office Document Image Writer”项,那证明你在安装Office 2003的时候没有安装该组件,请使用Office 2003安装光盘中的“添加/删除组件”更新安装该组件。
运行Microsoft Office Document Imaging,并利用它来打开刚才保存的MDI文件,选择“工具→将文本发送到Word”菜单,并在弹出的窗口中勾选“在输出时保持图片版式不变”,确认后系统提示“必须在执行此操作前重新运行OCR。这可能需要一些时间”,不管它,确认即可。
小提示:Microsoft Office Document Imaging对PDF转DOC的识别率不是特别完美,转换后会丢失原来的排版格式,所以转换后还需要手工对其进行排版和校对工作。
ScanSoft PDF Converter for Microsoft Word
ScanSoft PDF Converter for Microsoft Word是由ScanSoft公司和微软共同组队开发的一个Word的插件,它可以让你在没有Adobe Acrobat的情况下将PDF文档转化为Word文档,并且完全保留原来的格式和版面设计。
ScanSoft PDF Converter for Microsoft Word是首先捕获PDF文档中的信息,分离文字同图片,表格和卷,再将其统一到Word格式。在Microsoft Word中你可以直接通过“文件”—>“打开”来打开PDF文件。ScanSoft PDF Converter for Microsoft Word插件会自动弹出,在分析完PDF文件后即可自动转换成DOC格式的文档。
这款软件的优点是体积非常小巧、并且可以最大限度的保留原PDF文件的格式,缺点是转换速度较慢,泡杯咖啡耐心的等待吧:)
PDF 2 Word (目前版本貌似3.0)
PDF 2 Word是一个独立运行的软件, 而非插件。可将 PDF 格式直接转换成 WORD 格式文件。
PDF 2 Word虽然是一款英文软件,但其操作界面及参数设置都非常简单,没有特殊需要的话直接按照软件的默认值进行转换即可,PDF 2 Word转换的速度非常快,对于图片和文档格式的识别也非常好,在这样的一款小软件中做到这些还是很难能可贵的。
Solid Converter PDF(目前版本貌似3.0)
Solid Converter PDF是一套专门将PDF文件转换成DOC的软件,除了转换成DOC文件外,还可以转换成RTF以及Word XML文件。除此之外,它还有一个图片撷取功能,可以让我们将PDF档里的图片撷取出来,以及将PDF档里的表格撷取出来,并输出到Excel里,方便我们编辑表格里的资料。
PDF转换为WORD,TXT,图片等格式工具。对中文支持一级棒,是目前同类软件中最出色的。
[fly]========插播广告:智星论坛,欢迎灌水========[/fly]
当然,有些PDF文档本身的制作过程中并不是以文字方式进行制作的,比如,本身是就是图片格式,因而上述软件或许转换的效果不很理想。
SO,这里再给出一个通过利用文字识别软件的功能进行的“曲线转换”。
软件需要:Adobe Acrobat Pro(注不是Reader),识别软件(如汉王文本等),Word
方法:
Step 1
用Adobe Acrobat Pro打开该PDF文档
点击File—Save As
在弹出窗口中保存类型选取“Jpeg”
Step 2
打开Word程序,并新建一空白文件备用
Step 3
打开OCR程序,打开刚保存的Jpeg文档
点击“版面分析”
点击“文字识别”
可在编辑窗口中进行更正编辑
点击“插入Word文档”
Step 4
转到Word中,进行稍微的排版
以上软件太平洋、华军、天空等应该都有的下,选个合适自己的吧
笔者按:软件毕竟是软件,如果本身pdf格式复杂,转换的不尽如君意,也情有可原啊,呵呵