- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
动手操作:从连续序列中分割单个符号
LowJianHe,HarryWalsh,OzgeMercanogluSincan,RichardBowden
CVSSP,UniversityofSurrey,Guildford,UnitedKingdom
{jianhe.low,harry.walsh,o.mercanoglusincan,r.bowden}@surrey.ac.uk
Abstract—本工作解决了连续手语分割的挑战,这是手语
翻译和数据标注中一个具有重大影响的关键任务。我们提出了
一种基于变换器的架构,该架构将手势的时间动态建模,并使
用开始-内部-外部(BIO)标签方案将帧分割问题视为序列标
注问题。我们的方法利用了HaMeR手部特征,并辅以3D角
度。大量实验表明,我们的模型在DGS语料库上实现了最先
进的结果,而我们的特征在BSLCorpus上的表现超过了先前
的基准。
Fig.1.特征表示的说明:图展示了手语视频的一个样本帧,以及与其
I.介绍对应的基于3D骨架的角度姿态表示和HaMeR生成的左手和右手网格
本手语是一种通过手势、面部表情和身体动作来传达可视化。
译意义的视觉语言[1]。作为聋人社区的主要交流方式,手
基于这些见解,我们提出了一种新的手语分段模型,
中语体现了深厚的文化和语言认同。
该模型整合了强大的语言和视觉线索。我们的方法利用
3手势语言翻译(SLT)系统的发展为弥合沟通障碍提
v最先进的HandMeshRecovery(HaMeR)模型[10]提取
供了一种有希望的方法,因为它们被设计用于将手势语
3精细的手部形状特征,并结合3D骨架角度[11]来捕捉身
9言翻译成文本并反之亦然。然而,手势语言的多通道性
5体与手的动态变化。我们在图1中提供了一个视频帧上
8质,涉及复杂的肢体动作、身体姿势和面部表情,提出了的这些特征示例。这些特征被整合到一个统一的多模态
0显著的挑战。这进一步因注释数据的稀缺性而加剧,特
.框架中,该框架利用基于变压器的架构建模时间依赖性,
4别是在帧级别上,注释手势语言视频是一个劳动密集型、
0从而能够精确识别手语序列中的停顿和转换。
5需要专业知识且成本高昂的过程[2]。这限制了大规模数总结而言,我们的贡献如下:(i)我们首次利用
2据集的可用性,并极大地阻碍了SLT系统的泛化能力。
:HaMeR特征进行手语分割,并展示了它们与身体姿态
v手势分割,即在连续视频中识别手势的时间边界,对
i特征结合时的有效性。(二)我们提供了广泛的实验来分
x于应对这些挑战至关重要。一个强大的分割模型可以自
r析设计选择对性能的影响。(三)在DGS语料库上,我们
a1
动化大部分词汇注释过程,让语言学家能够修改预测
实现了最先进的分割结果。(四)通过在BSLCorpus上将
的片段而不是手动标注它们,从而大
您可能关注的文档
- 实例空间分析的带容量车辆路径问题-计算机科学-机器学习-算法.pdf
- 预编码 Zak-OTFS 用于每载波均衡-计算机科学-机器学习-预编码技术.pdf
- ZonUI-3B:单个消费级 GPU 训练的 30 亿参数 GUI 对齐视觉语言模型-计算机科学-视觉语言模型-图形用户界面定位.pdf
- 无损量子计算通过减少量子比特开销以实现高效的算术运算-计算机科学-机器学习-量子算术-量子哈密顿计算.pdf
- DiffGradCAM: 一种抵抗对抗训练的通用类激活图方法-计算机科学-深度神经网络-可解释性-类激活映射.pdf
- SpecMaskFoley: 通过 ControlNet 引导预训练的频谱掩码生成变换器实现同步视频到音频的合成-计算机科学-音频生成-视频生成.pdf
- 离散时间双层遗忘 RLS 识别在有限激励下的应用-计算机科学-机器学习-自适应系统-参数识别.pdf
- 什么是通用人工智能?-计算机科学-人工通用智能.pdf
- 那是你的最终答案?测试时间缩放改进选择性问答-计算机科学-大语言模型-模型推理.pdf
- 石鱼:支持海洋机器人中的机器学习研究-计算机科学-人工智能-海洋机器人.pdf
- 2025中国冶金地质总局所属在京单位高校毕业生招聘23人笔试参考题库附带答案详解.doc
- 2025年01月中国人民大学文学院公开招聘1人笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
- 2024黑龙江省农业投资集团有限公司权属企业市场化选聘10人笔试参考题库附带答案详解.pdf
- 2025汇明光电秋招提前批开启笔试参考题库附带答案详解.pdf
- 2024中国能建葛洲坝集团审计部公开招聘1人笔试参考题库附带答案详解.pdf
- 2024吉林省水工局集团竞聘上岗7人笔试参考题库附带答案详解.pdf
- 2024首发(河北)物流有限公司公开招聘工作人员笔试参考题库附带答案详解.pdf
- 2023国家电投海南公司所属单位社会招聘笔试参考题库附带答案详解.pdf
- 2024湖南怀化会同县供水有限责任公司招聘9人笔试参考题库附带答案详解.pdf
- 2025上海烟草机械有限责任公司招聘22人笔试参考题库附带答案详解.pdf
文档评论(0)