通过主要颜色添加剂改进鸟类分类-计算机科学-音频分类-鸟类分类-深度学习.pdfVIP

通过主要颜色添加剂改进鸟类分类-计算机科学-音频分类-鸟类分类-深度学习.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

通过主要颜色添加剂改进鸟类分类

EzhiniRasendiranR,ChandreshKumarMaurya

DepartmentofMetallurgicalEngineeringandMaterialsScience,IndianInstituteof

TechnologyIndore,India

DepartmentofComputerScienceEngineering,IndianInstituteofTechnologyIndore,

India

Abstract例如,自动化系统可以分析从部署在偏远地区的

mems210005019@alum.iiti.ac.in,chandresh@iiti.ac.in

生物声学被动声学监测(PAM)设备中收集的大

我们解决了通过鸟类的鸣叫声录音来分类鸟种的

数据集,使得长时间监控生物多样性成为可能。通

问题,这是一个由于环境噪声、重叠的叫声以及

过自动识别物种的声音信号,有助于研究人员做

缺失标签而极具挑战性的任务。现有的模型在处

出知情决策,保护生态系统并应对栖息地丧失和

理低信噪比或多种物种的录音时表现出困难。我

气候变化等威胁。这项技术的应用是迈向实现全

们假设可以通过可视化其音高模式、速度和重复

本球可持续发展目标的重要一步,确保我们星球丰

——统称为模式——对鸟类进行分类。应用于频

译富的生物多样性的保存[5]。

谱图图像的深度学习模型有所帮助,但不同物种

中深度学习的突破通过使从原始数据[6]中提取

之间相似的动机导致了混淆。为了解决这个问题,

1深层次抽象特征成为可能,彻底改变了生物声学

v我们将频率信息通过主要颜色添加剂嵌入到频谱

4图中。这增强了物种之间的区分度,提高了分类准音频分类;然而,重叠物种声音、广泛多样的发声

3模式以及物种叫声之间的显著相似性继续使得稳

3确性。我们的实验表明,所提出的方法在统计上

8健分类变得复杂。

1显著优于没有彩色化的模型,并超过了BirdCLEF

.无监督源分离,如MixIT方法[7],已被用于

72024的获胜者,提升了7.3%的F1分数,6.2%的

0ROC-AUC和6.6%的CMAP。这些结果证明了通拆分复杂声音景观中重叠的鸟类叫声。该方法通

5过隔离个别叫声并使声学特征的提取更加清晰来

2过色彩化方式融入频率信息的有效性。

:

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档