基于数理统计的音乐情感识别.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数理统计的音乐情感识别

基于数理统计的音乐情感识别 二○一○年月日 isher判别方法 马氏距离法 神经网络 问题重述 为使机器能够获取人类的感情信息,计算机对音乐信号中喜怒哀乐等各色情感的识别将成为行之有效的初步研究。现已知所给20首风格各异的曲目被分成两类:1-10首为I类,11-20首为II类。从中,我们需要提取分类特征,并构造出有效地分类方法;以所构造的分类方法为依据,对21-50首乐曲,根据所包含情感不同,进行分类。 问题分析 针对此类较复杂的分类问题,我们不仅要从数学角度提取其特征,更应该充分结合其专业背景,从而给出更为合理准确的分类方法。以下就从上述两方面入手,分析阐述所构造的特征参数以及适用的分类方法。 特征参数的选择 对于特征参数的选择,必须满足如下条件: 所取特征参数必须可以标志I类和II类。也就是说,利用这些特征可以很好区分已经表示分类的20个序列; 所取特征必须具有相应的实际意义。比如说,如果不考虑参数的实际意义,我们就可以通过统计各音符在不同类的乐谱中出现的频率,给出分类所需遵循的准则,而这显然满足上述第一个条件。但是对于这样一个有着丰富背景的问题,仅采用简单的数理统计特征进行分类,是不可取的。 通过查阅相关的音乐乐理知识以及人对于音乐中情感信息的辨别情况,我们发现,影响音乐特征的较直接因素主要包含音区和速度两个方面。当乐曲所要表达的情感较为激昂、欢快时,音区(range)往往较高,反之则较低。一般来说,所要表达的情感较为激烈,则演奏速度(velocity)较快,感情较为舒缓时,演奏速度较慢。除此之外,某些因素能够充分表达出不同风格乐曲之间细小的差别。比如说,旋律方向(dir-pit)这一特征表现出旋律中的取向性。音高稳定性(sta-pitch)用于表现乐曲中音高的起伏变化情况。音程跨度(span-int)在总体上表现乐曲相邻音符之间的变化关系。音程稳定性(sta-interval)表现相邻音符之间的音程变化情况。通常来说,音符密度(NoteDencity)较大时所带情感激烈、起伏大;该参数较小时又给人以舒缓的感受。 基于以上所述两点条件,结合相关的音乐知识,我们给出如下所示的7维向量空间表示一个谱例,采用基于时值分布的加权平均来表示方向性指标,采用标准差作为稳定性指标,对乐曲的分类加以描述(式中Pitch表示单个音符的音高,Interval表示相邻两音符音高之差的绝对值,Duration表示单个音符的时值): 表1 特征空间向量 特征 求解策略 简述 音区 (range) 平均音高 速度 (velocity) 从乐谱中提取 演奏速度(每分钟的节拍数) 旋律方向 (dir-pit) 音高差分的时值分布 音高稳定性(sta-pitch) 音高的标准差 音程跨度 (span-int) 音程绝对值的均值 音程稳定性(sta-interval) 音程绝对值的标准差 音符密度(NoteDencity) 每小节所包含的音符数 以下通过对已分类的20首乐曲的各个参数进行主成分分析,从而研究相互之间的相关性: 表2 主成分分析结果 特征参数 特征值 方差贡献率% 累计贡献率% 速度 3.2421 32.421 32.421 音区 2.1341 21.341 53.762 旋律方向 1.0693 10.693 64.455 音高稳定性 0.9332 9.332 73.787 音程跨度 0.7513 7.513 81.3 音程稳定性 0.8453 8.453 89.753 音符密度 1.0247 10.247 100 由上表我们可以获得两方面的内容:首先,速度与音区两个参数的贡献率累积占50%左右,这与上文提到二者是影响音乐特征的较直接因素相契合;其次,除速度与音区两个指标外,其余各因子对于总方差的解释程度相近,说明变量间相关性较低,在计算求解过程中都应充分考虑。 分类方法的选择 如上文所述,由于乐谱自身所含丰富的音乐背景信息,我们不应该在不知道确切分类标准的情况下,使用单一的方法来处理这样一个分类问题。我们尝试综合使用几种设计思想不同的方法进行分类,相互印证,使得分类结果更加准确。 判别分析方法 判别分析方法是利用原有的分类信息,得到体现这种分类的函数关系式,然后利用该函数去判断未知样品属于哪一类。因此,这是一个学习和预测的过程。由于需要从已有分类中提取分类信息,构造函数关系式。我们在此采用马氏距离法与Fisher判别准则两种方法。利用Fisher准则时应将多维的各个参数样本映射到一维空间中,求其特征值,根据特征值进行类型判别;利用马氏距离法提取已分类样本的特征,并对待测样本根据其特征向量的值作出其所属类别的判断。 神经网络方法 神经网络是一种带反馈的自适应算法,其实质是选择一个

文档评论(0)

pengyou2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档