(PDF阅读器的设计与实现.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
(PDF阅读器的设计与实现

PDF?阅读器的设计与实现 摘???要:为有效提取?PDF(portable?document?format)文件中的文字、图片、图形信息,提出了包含文件预处理、显示预处理、功能 扩展、显示?4?个单元的?PDF?阅读器的实现模型。基于?PDF?文件结构特点,提出了忽略次要信息定位关键位置的解析思路。在 此基础上,针对?FlateDecode、DCTDecode?和?CCITTFaxDecode?这?3?种过滤器处理的数据流,给出了详细的解决方案,然后对?PDF 页面内容进行两次解析,设计相应的文字图形等数据结构保存结果,最后对数据利用和功能扩展进行了讨论。通过实验结 果表明,该模型能较好地实现?PDF?信息提取和显示,有利于?PDF?在中文信息处理领域中的进一步开发利用。 关键词:可移植文档格式;???阅读器;???文件解析;???图像提取;???信息处理 中图法分类号:TP391 文献标识码:A 文章编号:1000-7024?(2010)?07-1635-04 Design?and?implementation?of?PDF?reader LI?Qiang, LIU?Shi-jin (College?of?Physical?Science?and?Technology, Central?China?Normal?University, Wuhan?430079,???China) Abstract:To?extract?the?text,???images?and?graphical?information?from?PDF?file?validly,???an?implementation?model?including?four?units (file?pretreatment,???display?pretreatment,???function?extension?and?display)???is?raised.???Based?on?the?structure?of?PDF?file,???a?solution?of ignoring?secondary?message?and?positioning?key?information?is?put?forward.???On?this?basis,???a?solution?to?the?data?stream?processed?by FlateDecode,???DCTDecode?and?CCITTFaxDecode?filters?is?presented.???After?analyzed?PDF?pages?twice,???corresponding?data?structure of?text?and?graphical?are?designed?to?record?the?results.???At?last?the?data?utilization?and?function?extension?are?discussed.???The?model?can implement?the?extraction?and?display?of?information?in?PDF?file?well?by?experimental?comparison,???and?it?will?benefit?the?further?deve- lopment?of?PDF?in?the?field?of?Chinese?information?processing. Key?words:PDF;???reader;???file?parse;???image?extraction;???information?processing 0???引 言 PDF?作为国际标准的电子文档格式[1],以跨平台、多媒体 集成、可靠安全、精确的色彩还原度和丰富的图象显示等许多 其它文档格式无法比拟的优点,在全球范围得到广泛的认可 和应用。全世界有超过?1800?家供应商提供基于?PDF?的解决 方案,包括生成工具、插件、咨询、培训和支持工具。 (怎么把PDF转换成word) 目前,对?PDF?各方面的研究正处于一个全面发展的时期。 国内很多作者从?PDF?文件的图像、链接信息、文本信息提取和  PDF?文件阅读器的具体实现方案。 1???阅读器体系结构 本阅读器从实用出发,充分考虑了代码的可维护性和功 能可扩展性的需求,用?VC++6.0?实现。主要有?4?个单元模块: 文件预处理模块、显示预处理模块、功能扩展模块、显示模块, 各模块之间调用关系如图?1?所示。其中,文件预处理模块解 析?PDF?文件,得到相关文字、图片、图形等页面内容信息;显 示预

文档评论(0)

yyf7373 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档