基于多层特征融合的手势识别算法研究.pdfVIP

基于多层特征融合的手势识别算法研究.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

随着智能设备的发展,手势作为人机交互的方式渐渐被人们所习惯,因此手势识别技术

变得尤为重要。目前基于计算机视觉的手势识别技术依然存在诸多限制,在复杂背景下的手

势识别容易受到环境因素的干扰,如光照条件变化,背景杂物的遮挡等;再加上手势自身的

翻转、重叠以及区域占比小等问题,使得提取单一特征的方法已经无法完成准确识别手势的

需求。

针对传统手势识别方法中特征描述单一的问题,本文基于机器学习与深度学习两种框架,

提出了两种改良的手势识别算法,并开展和完成了两种算法的代码实现、数据集测试、平台

验证等工作。具体完成的研究工作如下:

1.针对传统方向梯度直方图(HistogramofOrientedGradient,HOG)信息单一和易受到

颜色信息影响的问题,提出了一种基于特征融合方法的新型特征向量HOG-C,增加了颜色信

息与手势关键特征的关联性。HOG-C特征利用YCbCr色彩空间建立肤色椭圆模型,标记图

像中的肤色区域,并对其增加权重系数建立颜色梯度直方图;利用通道压缩的方法重建HOG

特征向量,将包含手势关键信息的通道进行比例放大,得到HOG-C特征向量;最后利用支持

向量机(supportvectormachines,SVM)进行训练,识别出正确的手势区域。该算法在Egohands

数据集上进行测试,平均准确率达到了93.47%,在类肤色干扰下的识别效果有较大的提升。

2.针对传统FasterR-CNN网络检测小目标手势的识别率较低问题,提出了一种结合特征

金字塔网络(FeaturePyramidNetworks,FPN)的改良结构,提升了整体模型在不同尺度上检

测手势目标的能力。本文选用ResNet-50残差网络作为特征提取网络来减少特征信息的缺失,

并加入卷积块注意力模块(ConvolutionalBlockAttentionModule,CBAM)对网络框架进行融

合优化,同时设计对比实验,筛选出CBAM模块最佳插入位置,加强了整体网络模型对上下

文信息的的捕获能力,进一步提高了对小目标手势的检测准确率。该算法在Egohands数据集

上进行测试,达到了96.88%的准确率。

3.针对两种改良算法,我们搭建了一套用于手势识别的智能监控云台,并在该平台开展

了算法的实测验证。该平台选用树莓派CM4作为核心系统,Pi-Camera摄像头作为图像采集

设备。选取六种不同的场景进行算法测试和分析,基于HOG-C特征的识别算法平均识别率达

到95.9%,平均识别时间为144毫秒,适用于对识别准确率要求不高的实时监控场景;Faster

R-CNN改良模型的平均识别率达到98.9%,平均识别时间为1278毫秒,适用于对准确率要

求较高但识别速率要求低的识别平台。

关键词:手势识别,特征提取,特征融合,HOG,FPN,FasterR-CNN

ABSTRACT

Withthedevelopmentofsmartdevices,gestureasawayofhuman-computerinteractionis

graduallybeingaccustomedto,sogesturerecognitiontechnologybecomesparticularlyimportant.

Thegesturerecognitiontechnologybasedoncomputervisionstillhasmanylimitations.Thegesture

recognitionincomplexbackgroundsiseasilydisturbedbyenvironmentalfactors,suchaschangesin

lightingconditionsandbackgroundclutter;coupledwiththeproblemsofflip,overlapandsmallarea

shareofthegestureitself,themethodofextractingasinglefeaturecannolongerfulfillthed

您可能关注的文档

文档评论(0)

拥有快乐的你 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档