- 1、本文档共79页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
古籍数字化作为一种古籍保存的重要手段逐渐引起了广泛的关注,通过古
籍图像文本识别技术将古籍转化为可有哪些信誉好的足球投注网站、可编辑、可存储的电子文档具有必
要性。当前古籍图像文本识别方法中普遍存在两个不足:一、大多数文本识别
方法应用于文本短并且稀疏的场景文本识别场景,并不适用于识别古籍图像中
的密集长文本识别场景。二、古籍图像由于古籍本身年代久远或者图像采样过
程中设备晃动等问题,导致古籍图像内容产生弯折,扭曲,影响古籍图像中的
文字辨别结果。
1.针对不足一提出了古籍图像文本识别方法ACR-Net。ACR-Net是一种基于
古籍图像下长文本识别的端到端的文本识别方法,针对古籍图像在密集文本场
景下的长文本检测问题提出了基于特征增强模块(FEPM)结合组合注意力机制
的进行特征提取的网络,并提出了特征头和识别头结构。ACR-Net在保证推理
速度的情况下实现更好的文本识别效果。实验结果表明ACR-Net无论是在处理
速度还是识别精度上都在古籍图像数据集上优于国内外现有开源方法。
2.针对不足二提出了针对于古籍的图像矫正方法(ACC-Net),并针对于该
方法提出了一种生成式对抗网络(AC-GAN)。针对古籍文本图像采样过程中的
曲折的问题,首先提出了使用机器图像处理对图像进行畸变的方法,用于生成
畸变图像以及映射矩阵作为数据集。提出了针对于古籍的图像矫正方法ACC-
Net并使用GAN网络进行强化学习。实验结果显示该方法对于古籍图像文本具
有良好的矫正效果,验证了该方法的有效性。
3.基于古籍图像文字识别方法以及图像矫正方法提出了一种组合文本识别
方法,基于该文本识别方法设计并开发了一种基于中文古籍图像的OCR系统。
测试了多种数据集联合训练下该组合方法使用古籍数据集测试的效果,经验证
该组合方法在古籍图像文字识别场景下的效果优于当前国内外现有的开源OCR
算法架构。
关键词:OCR;古籍图像文字识别;深度学习;注意力机制;图像矫正方法
ABSTRACT
Asanimportantmeansofpreservingancientbooks,thedigitalizationof
ancientbookshasgraduallyattractedwideattention.Itisnecessarytoconvert
ancientbooksintosearchable,editableandstorableelectronicdocumentsthrough
imagetextrecognitiontechnologyofancientbooks.Therearetwoshortcomingsin
thecurrenttextrecognitionmethodsofancientbooksimages:First,mosttext
recognitionmethodsareappliedtoscenetextrecognitionsceneswithshortand
sparsetext,andarenotsuitableforrecognizingdenseandlongtextrecognition
scenesinancientbookimages.Second.duetotheancientbooksthemselvesorthe
equipmentintheprocessofimagesamplingandotherproblems,theimagecontent
ofancientbookswillbebentanddistorted,whichwillaffecttheresultoftext
discriminationinancientbooks.
1.
您可能关注的文档
- 马来西亚私立学校小学生汉字书写偏误考察--以古晋圣若瑟私立小学为例.pdf
- 迈克尔·哈内克室内剧电影的空间叙事研究--兼论毕业短片《画框》的创作.pdf
- 迈克尔契诃夫“气氛学说”视阈下探究舞台行动的组织与选择--以《啤酒谋杀案》中安吉拉角色为例.pdf
- 迈斯纳方法下演员如何打破固有设定建立自发性交流.pdf
- 麦克道威尔钢琴组曲《海》文本分析与演奏诠释.pdf
- 美国“年度教师”评选项目的传播路径研究.pdf
- 美国货币政策意外对国际铜期货市场影响的实证研究.pdf
- 迷影文化的视觉呈现--以毕设纪录片《沪上观影指南》为例.pdf
- 密集仓储立库的四向穿梭车精准极速停靠及路径规划方法研究.pdf
- 棉布辐射接枝反应性染料实现绿色印染.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)