下载此文档

CAJ及PDF文档直接编辑.doc


文档分类:IT计算机 | 页数:约2页 举报非法文档有奖
1/2
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/2 下载此文档
文档列表 文档介绍
CAJ 及 PDF 文档直接编辑有时候我们会遇到用户提出想要编辑一些特殊文档, 往往不是很熟悉如何编辑。以下介绍如何进行一些特殊文档的编辑。在网上的许多资料都是以 CAJ 、 PDF 等文件格式提供的,其中的文本不能被直接编辑。网上提供了许多处理这种情况的软件,但是它们不是效率低,就是只能提取其中部分文本。本文所述利用微软提供的 OCR 识别技术从 CAJ 、 PDF 等文件中提取全部文本的方法,简便快捷,效率很高。从不同格式的文件中提取文本前需要做好以下准备工作,安装 浏览器软件和 acrobat 5 专业版浏览器软件安装 Office2003 ,并完全安装 Of? 鄄 fice 工具 Microsoft Office Document Imaging ,然后在打印机里面会增加 Microsoft Office Document Image Writer 打印机。 Microsoft Office Document Image 可以非常准确的全文件识别转化中文、英文、表格。一、 CAJ 文件的识别(一)首先,从网上下载 CAJ 格式的资料文件保存到本地硬盘上。(二) 然后, 启动 CAJViewer 浏览器程序, 并在该程序中打开刚才保存的 CAJ 格式的文件。浏览文件到最后一页后,不要关闭 CAJ 浏览器程序。(三)在 CAJ 浏览器程序窗口中, 选择“文件”→“打印”, 并选择打印机为 Microsoft Office Document Image Writer 打印机,勾选打印到文件选项和确定打印页数。(四) 保存打印文件( *.prn ) 到适当位置。等待打印完成后, Microsoft Office Document Image 自动打开刚才保存的打印文件。(五)在 Microsoft Office Document Image 窗口中, 选择“页面”菜单中的“选择所有页面”菜单项,然后选择“工具”菜单中的“使用 OCR 识别文本”提取文本。(六) 选择“工具”下的“将文本发送到 word ”, 最后将把整个 CAJ 文件识别输出到 wor d 文件中。二、 PDF 文件的识别(一) 以文本形式保存的 PDF 文件,用 acrobat 5 专业版, 识别整个文件。直接打开从网上下载的 PDF 格式文件另存为 RTF 文件, 或者选择工具栏上的文字选择按钮, 然后选择文字区域,然后复制到 Word 中即可。(二)以图片形式保存的 PDF 文件,将 PDF 文件打印到 Microsoft Office Document Image Writer 打印机,选择打印形成的文件的保存位置,然后会自动形成一个 MDI 文件,并且自动用 Microsoft Office Document Image 打开此文件, 然后在 Microsoft Office Document Im? 鄄 age 中选择“工具”菜单中的“使用 OCR 识别文本”,识别完成后,在选择“工具”下的, “将文本发送到 word ”,最后将把整个 PDF 文件识别输出到 word 文件中。(三)加密的 PDF 文件先下载解密软件,解密后在参照上述步骤 1),2) 进行。(四) 繁体 PDF 文件用上述步骤 2) 的方法识别到 word 后,用 word 中

CAJ及PDF文档直接编辑 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数2
  • 收藏数0 收藏
  • 顶次数0
  • 上传人nhrocm338
  • 文件大小98 KB
  • 时间2017-05-17