声纹检测通用规范安徽省地方标准.docxVIP

声纹检测通用规范安徽省地方标准.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

1

DB34/TXXXX—2023

声纹检测通用规范

1范围

本文件规定了声纹检测的术语和定义、检测准备和检测步骤。

本文件适用于电机制造及电机组装设备(例如家电、汽车、仪器仪表等)的生产线异音检测。

2规范性引用文件

本文件没有规范性引用文件。

3术语和定义

下列术语和定义适用于本文件。

3.1

声纹voiceprint

用电声学仪器显示的携带特征信息的声波频。

注:本文件所指的声纹仅指在工业生产线发出的声音。

3.2声纹检测voiceprintdetection

通过在产线集成声纹采集设备,利用声纹识别、异音诊断等技术,对电机产品发出的声音进行标注和训练,以实现产品缺陷自动识别报警的自动化检测过程。

3.3

标注label

标注人员根据所收集的设备声音样本性质不同进行分类的过程。

3.4

声音采集soundcollection

采用拾音设备对被检测对象所发出的声音进行采集,形成声纹文件。

3.5

异音abnormalnoise

具有缺陷的工业产品在运行时发出的异常声音。

4检测准备

2

DB34/TXXXX—2023

4.1标准声音采集

4.1.1总体要求

多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。

4.1.2采集设备

通过高保真麦克风设备采集音频样本。

4.1.3采集环境

4.1.3.1应在低噪声环境下进行,确保音频采集过程的环境噪音类型与产线部署过程的环境噪音一致,采集过程中避免出现其他人为异响。

4.1.3.2环境噪声标准:A记权分贝值≤30dB(A)。

4.1.4采集方式

4.1.4.1麦克风设备与被采集对象应固定放置,确保采集音频稳定性。

4.1.4.2麦克风设备与被采集对象距离固定在10cm左右,采集方向应正对被采集对象发声位置,使采集的音频满足4.1.5中所规定的峰值幅度值范围,若不满足,可通过拉进拉远距离的方式进行调节。

4.1.5采集音频参数

4.1.5.1编码格式:PCM编码。

4.1.5.2采样率:≥48K。

4.1.5.3量化精度:≥16bit。

4.1.5.4峰值幅度:≥-18dBFS且≤-3dBFS。

4.1.6采集样本

样本应覆盖所有对样本进行的标注类别(即正常类和异常类),样本时长和总量包括:a)单条样本时长:≥10s;

b)样本总量:每个类别≥500条。

4.2标注

4.2.1标注方法

4.2.1.1在计算机上对标准采集到的声音样本进行标注,对样本所进行的标注包括两种标注类别(即正常类和异常类),每个样本应仅有一种标注类别。

4.2.1.2检测人员使用计算机上的音频播放软件对待标注样本进行辨听,再进行标注结果记录,若无法判断是否为异常可注明无法判断。

4.2.2标注格式

标注完成后形成标注记录,存储于关系型数据库中,相关字段说明见表1。若待标注样本为正常声纹,则异常开始时间和异常结束时间一栏为斜杠符(/)。

3

DB34/TXXXX—2023

表1声纹样本标注字段说明

字段名称

字段类型

字段描述

备注

VoiceId

String

音频ID

MarkTime

Long

样本时长

单位:毫秒

MarkPerson

String

标注人员编号

录入人员编号

Abnormal

String

声纹类型标签

正常/异常/无法判断

StartPoint

Double

异常开始时间

单位:毫秒

EndPoint

Double

异常结束时间

单位:毫秒

4.3模型建立

对检测人员标注为正常/异常的声音样本提取声学特征,利用卷积神经网络算法对声学特征进行建模,得到可区分正常和异常的声纹分类模型,用于进行后续声纹检测任务。

5检测流程图

检测流程图见图1。

图1检测流程图

6检测步骤

6.1现场声音采集

6.1.1总体要求

多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。

6.1.2采集设备

应符合4.1.2规定的要求。

6.1.3采集环境

应在生产线环境下进行,周围环境噪声的A记权分贝值≤30dB(A),采集过程中避免出现其他人为异响。

4

DB34/TXXXX—2023

6.1.4采集方式

应符合4.1.4规定的要求。

6.1.5采集音频参数

应符合4.1.5规定的要求。

6.1.6采集样本

采集样本时长和总量如下:

a)单条样本时长:10s;

b)样本总量:10条。

6.2模型判定

6.2.1将现场采集的10条声音样本传输

文档评论(0)

法律咨询 + 关注
实名认证
服务提供商

法律职业资格证、中级金融资格证持证人

法律咨询服务,专业法律知识解答和服务。

版权声明书
用户编号:8027066055000030
领域认证该用户于2023年04月14日上传了法律职业资格证、中级金融资格证

1亿VIP精品文档

相关文档