基于深度学习的中文古籍图像文字识别研究.pdfVIP

基于深度学习的中文古籍图像文字识别研究.pdf

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

古籍数字化作为一种古籍保存的重要手段逐渐引起了广泛的关注,通过古

籍图像文本识别技术将古籍转化为可有哪些信誉好的足球投注网站、可编辑、可存储的电子文档具有必

要性。当前古籍图像文本识别方法中普遍存在两个不足:一、大多数文本识别

方法应用于文本短并且稀疏的场景文本识别场景,并不适用于识别古籍图像中

的密集长文本识别场景。二、古籍图像由于古籍本身年代久远或者图像采样过

程中设备晃动等问题,导致古籍图像内容产生弯折,扭曲,影响古籍图像中的

文字辨别结果。

1.针对不足一提出了古籍图像文本识别方法ACR-Net。ACR-Net是一种基于

古籍图像下长文本识别的端到端的文本识别方法,针对古籍图像在密集文本场

景下的长文本检测问题提出了基于特征增强模块(FEPM)结合组合注意力机制

的进行特征提取的网络,并提出了特征头和识别头结构。ACR-Net在保证推理

速度的情况下实现更好的文本识别效果。实验结果表明ACR-Net无论是在处理

速度还是识别精度上都在古籍图像数据集上优于国内外现有开源方法。

2.针对不足二提出了针对于古籍的图像矫正方法(ACC-Net),并针对于该

方法提出了一种生成式对抗网络(AC-GAN)。针对古籍文本图像采样过程中的

曲折的问题,首先提出了使用机器图像处理对图像进行畸变的方法,用于生成

畸变图像以及映射矩阵作为数据集。提出了针对于古籍的图像矫正方法ACC-

Net并使用GAN网络进行强化学习。实验结果显示该方法对于古籍图像文本具

有良好的矫正效果,验证了该方法的有效性。

3.基于古籍图像文字识别方法以及图像矫正方法提出了一种组合文本识别

方法,基于该文本识别方法设计并开发了一种基于中文古籍图像的OCR系统。

测试了多种数据集联合训练下该组合方法使用古籍数据集测试的效果,经验证

该组合方法在古籍图像文字识别场景下的效果优于当前国内外现有的开源OCR

算法架构。

关键词:OCR;古籍图像文字识别;深度学习;注意力机制;图像矫正方法

ABSTRACT

Asanimportantmeansofpreservingancientbooks,thedigitalizationof

ancientbookshasgraduallyattractedwideattention.Itisnecessarytoconvert

ancientbooksintosearchable,editableandstorableelectronicdocumentsthrough

imagetextrecognitiontechnologyofancientbooks.Therearetwoshortcomingsin

thecurrenttextrecognitionmethodsofancientbooksimages:First,mosttext

recognitionmethodsareappliedtoscenetextrecognitionsceneswithshortand

sparsetext,andarenotsuitableforrecognizingdenseandlongtextrecognition

scenesinancientbookimages.Second.duetotheancientbooksthemselvesorthe

equipmentintheprocessofimagesamplingandotherproblems,theimagecontent

ofancientbookswillbebentanddistorted,whichwillaffecttheresultoftext

discriminationinancientbooks.

1.

您可能关注的文档

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

温馨提示:本站文档除原创文档外,其余文档均来自于网络转载或网友提供,仅供大家参考学习,版权仍归原作者所有,若有侵权,敬请原作者及时私信给我删除侵权文

1亿VIP精品文档

相关文档