小经验-提取PDF中数据表的方法.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
小经验-提取PDF中数据表的方法

问题描述: 想要提取PDF格式文件中的数据表,用Adobe转成word困难,用Adobe/CAJ等软件提取文字困难时,快速提取数字出来,节省时间。待处理的是如图1形式给出的踏面坐标:图 1步骤(1):用Adobe软件的“组织—拆分”页面功能(图2.1、图2.2),选出踏面参数所在页,保存成小的PDF文件(如图3)。(因为捷速OCR识别软件只能免费识别前5页) 图2.1 图3图2.2步骤(2):用捷速OCR识别软件(如图4)识别PDF格式成为DOCX格式文本文档,识别过程见图5,识别之后的文本文档见图6 图4图5图6因为识别的原因,每个数据都是以“文本框”的形式显示在页面中,而不是普通文本呈现,字体大小、数据位置参差不齐,所以不能直接考出到Excel文件中。步骤(3):删除不需要的数据列,留下需要的数据列(编辑键下拉使用“选择”键,按住Shift框选-Delet),如图8所示:步骤(4):设置 数据列 板式“浮于文字上方---左对齐”步骤如图7所示(因为接下来步骤中转成普通文本时,数据顺序是根据文本框位置顺序从左往右或者从上往下排列的,文本框位置又参差不齐,所以要做 对齐处理),结果如图9所示:图7 图8 图9步骤(5):将图9文本 另存为**.rtf格式(如图10),用“写字板”(如图11)打开,这时文本框数据变成普通数据(如图12) 图10 图11图12步骤(6):再将数据经过简单处理就可以导出到Excel表格中了(如图13)。图13

文档评论(0)

ctuorn0371 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档