- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
训练和弦识别模型的人工生成音频方面
MartynaMajchrzakJacekMadziuk
FacultyofMathematicsandInformationScienceFacultyofMathematicsandInformationScience
WarsawUniversityofTechnologyWarsawUniversityofTechnology
Koszykowa75,00-662Warsaw,PolandKoszykowa75,00-662Warsaw,Poland
martyna.majchrzak19@mandziuk@.pl
本ABSTRACT
译音乐信息检索中一个具有挑战性的问题是获取足够的非版权音频录音用于模型训练和评估。
中本研究比较了两种基于Transformer的神经网络模型在音频录音中的和弦序列识别,并考察
了使用人工生成的数据集进行此目的的有效性。这些模型是在各种组合的人工合成多轨音频
1
v(AAM)、舒伯特的《冬之旅》数据集和麦吉尔比莉板数据集上训练的,并用三个指标进行评
8估:根音、大调小调和和弦内容度量(CCM)。实验表明,尽管人工生成音乐与人类创作音
7
8乐在复杂性和结构上肯定存在差异,前者在某些情况下仍然有用。具体而言,AAM可以丰
5富一个人类作曲的小训练数据集,或者甚至可以在没有其他可用数据的情况下作为模型的独
0.立训练集,该模型用于预测流行音乐中的和弦序列。
8
0
5Keywords音乐信息检索,自动和弦识别,变压器,人工音频多轨
2
:
v
i
x1介绍
r
a
音乐信息检索(MIR)是一个跨学科的研究领域,涉及诸如音乐学、信号处理、信息学和机器学习等领域的
研究。MIR包括各种与音乐相关的活动方面,如音乐分类(类型和作曲家)[1,2,3],音乐推荐系统[4,5,6],
旋律和声[7,8,9],音乐创作[10,11,12],音乐转写[13]等许多其他方面[14]。
音乐信息检索中的一个核心任务是自动和弦识别(ACR),它包括将音频记录或从该记录中提取的特征序列
划分为多个段,并为每个段标记出存在于该段中的音乐和弦名称。
1.1动机。
可靠性参考数据的收集是将深度神经网络或其他机器学习(ML)模型应用于解决此任务的主要障碍和挑战
之一。
手动数据标注是繁琐且耗时的,甚至经验丰富的音乐家也可能在标记某些音乐片段上存在分歧。此外,由于
版权问题,许多开源数据集只共享标注信息,而不提供音频文件。实际上,适合直接使用的数据集稀缺,并且
通常不足以训练复杂的机器学习模型。机器学习领域的必威体育精装版进展,包括音乐生成系统的开发,已经扩展了这
些可能性。然而,一个问题是关于模型的有效性在应用于人类创作的音乐作品时,其在人工生成(编曲)音
乐上进行训练的表现如何。这个问题是本文研究的核心。
APREPRINT
1.2贡献。
本工作的主要贡献有四点:
•分析考虑的ACR数据集中的结构注释差异,
•对用于ACR模型评估的指标进行系统化,
•不同组合的人工和人创作音乐训练的ACR模型性能对比,
•关于将人工生成的音乐纳入由人类生成的数据组成的训练集可能产生的影响的指导性意见。
2相关工作
首批和弦识别系统主要是基于知识的,特别是模板式的[15,16]和基于HMM的[17,18,19,20]。随着数据驱
动方法的发
您可能关注的文档
- 快速运动估计和上下文感知优化在高效拜耳域视频视觉中的应用.pdf
- 动画场景:可控制相机的任何场景动画.pdf
- DAFMSVC: 基于双注意力机制和流匹配的一次性歌唱语音转换.pdf
- 具有扰动意识的空地双模无人机的动力学轨迹规划.pdf
- 跨市场推荐的双重原型注意力图网络.pdf
- 基于多臂赌博机的决策树优化.pdf
- SCALEFeedback:一个用于 LLM 生成教育反馈研究的大型合成计算机科学作业数据集.pdf
- LLM 导师院长:通过 LLM 反馈评估者探索全面和自动化的 LLM 生成教育反馈的评估.pdf
- 小型博物馆中用于无障碍和包容性的社会与远端存在机器人.pdf
- 以功能为导向的双臂装配遥操作技术用于拆卸连接部件.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)