基于MapReduce的分布式音频分类技术研究.docVIP

基于MapReduce的分布式音频分类技术研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
 基于 MapReduce 的分布式音频分类技术研 究 张凤羽,刘亮** 5 10 15 20 25 (北京邮电大学计算机学院,北京市 100876) 摘要:音频信息在人们生活中占据着十分重要的地位,从大量的音频文件中提取出关注的音 频片段在多媒体检索和智能监控等领域都有着广泛的应用。本文首先选择合适的音频特征参 数和分类器模型,并针对现在大规模音频数据在单机环境下训练和分类过程计算时间较长, 提出一个基于分布式 MapReduce 集群、并使用支持向量机作为分类器的音频分类算法框架。 实验证明,该方案在保证较高精度的分类效果的前提下,能获得较好的加速比。 关键词:音频分类;支持向量机;MapReduce 中图分类号:TP39 Research on Distributed Audio Classification System Based on MapReduce ZHANG Fengyu, LIU Liang (School of Computer Science and Technology, Beijing University of Posts and Telecommunications, Beijing 100876) Abstract: Audio information pay an important role in social life, extracting concerned audio clips from massive audio files has a wide range of application in multimedia retrieval, intelligent monitoring and other areas. In this paper, firstly we select proper audio feature parameters and classifier, and for training and classification process with large-scale audio data has a very long computing time, we propose an MapReduce cluster based audio classification system, which using support vector machine as its classifier. Experiments show that the program get an better speed up on the premise that ensuring high accuracy in the classification results. Key words: 0 引言 Audio Classification; SVM; MapReduce 30 35  随着互联网和多媒体技术的发展,多媒体数据分析处理已经成为信息处理领域中主要的 信息形式,其中音频信息占有很重要的地位。面对如今海量的音频信息,能够有效的对音频 数据内容的语义信息进行深度处理分析并进行有效的分类在包括智能监控和多媒体检索等 很多领域都有应用前景,选择与提取能够准确区分各种类别音频的特征参数,并选择一种有 效的分类器是音频分类技术的关键。 再者,单一节点的计算能力已经遇到了瓶颈。因此,利用分布式计算获得网络中强大的 计算资源,将需要大量计算资源的复杂任务通过网络分布到多个节点上进行计算,是当前一 种行之有效的解决方案。音频分类中特征向量的计算、模型训练和预测分类的过程都是计算 复杂型任务,在单机环境下需要很高的计算时间,难以满足应用的要求。目前流行的 MapReduce 框架[1]无疑可以满足我们的要求,它将复杂的分布式计算高度抽象到了 map 和 作者简介:张凤羽(1987 年生),男,硕士,主要研究方向:多媒体与网络信息处理 通信联系人:刘亮(1982 年生),男,讲师,主要研究方向:计算机视觉,传感器网络,多媒体信息处理 等. E-mail: liangliu82@ -1-  40 45  reduce 两个函数上,具有编程简单、不易出错的特点。本文提出一种基于 MapReduce 框架、 选用短时域能量和 MFCC 作为特征参数[2]、支持向量机[3]作为分类器的分布式音频分类算 法,在保证获得很高的分类精度的前提下,大大降低了计算时间。并在系统设计上进行一定 的优化,使其在处理大量音频数据的分类任务时能更加高效。 1 关键技术 1.1 音频特征参数 选用合适的音频特征参数直接关系到分类的效果,实验表明,采用时域短时能量和 MFCC 进

文档评论(0)

baihuamei + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档