- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
鼾声与语音的时频区分特征毕业答辩 通信
鼾声与语音的时频区分特征 学号姓名:陈宇 专业:电子信息工程 指导老师:侯丽敏 本次演示的结构安排 1.1 课题的背景与意义 1.2 课题研究现状和思考 2 设计思路 本次设计主要运用鼾声和说话声在时域中持续时间的不同来实现时域方法上的准确区分。 3 系统的过程实现 3.2 小样本分析 预加重 提升信号的高频部分,使其频谱变的平坦保持在低频到高频的整个频带中,能用同样的信噪比求频谱,以便于频谱分析或声道参数分析。 加窗分帧 语音信号具有短时平稳特性 采用汉明窗、汉宁窗、矩形窗等,汉明窗低通特性较好 分帧虽然可以采用连续分段的方法,但一般要采用交叠分段的方法,这是为了使帧与帧之间平滑过渡,保持其连续性.帧移帧长的比值一般取为0~1/2 帧长的选择:帧长为200,帧移100 3.3 语音信号提取 端点检测参数 语音提取算法流程 3.4 时域区分方案选定 时域区分通常依靠声音的语音学规律和特征 从已有的研究成果看鼾声呼气段和吸气段通常持续3s。一般的鼾声检测若只检测到吸气段,吸气段通常持续2s。 根据此规律确定鼾声和说话声的区分特征 3.5 具体方案设计 完成连续语音提取 单一连续语音时长介于1-2.5s为鼾声 三个具体判定参数的选取 第一个为鼾声和说话声的平均时长,记为average,定义公式为: 第二个为鼾声和说话声持续时间处于1s-2s之间的声音与总时长的比率,记为cm,定义公式为: 第三个为鼾声和说话声持续时间处于 1s-2s的连续帧个数占总帧数的比率,记为cm1,定义公式为: 三个参数各自的统计结果 最终方案选定 tsum小样本结果统计 4 实验结果和总结 4.1 时域分析参数判定结果统计 选取参数为单一语音持续时间为1-2s时的三个所求特征值之和,记为tsum, 此时tsum=1.2为鼾声,tsum1.2为说话声,否则为无声段 4.2 统计结果分析 tsum的对鼾声的判定准确率为97.5%,识别说话声的准确率为95%,总识别率为96.25%。 4.3 关于频域分析结论 1.常用频域参数语音识别的方法 多个频域参数提取,组成高维参数后进行模式识别 mfcc(mel域复倒谱系数)、lpcc(线性预测倒谱系数)等高维参数配合自身差分或其他参数进行模式识别 2.常用模式识别方法:支持向量机、隐马尔科夫模型、矢量量化等 本次课题采用mfcc及支持向量机。 4.4 频域参数区分未完成原因分析 4.5 频域区分方案的选定 4.5.1 频域参数选定准备工作 语音信号作为随机信号不存在能量谱,但由于短时平稳特性,可以对每一帧做短时傅里叶变换。 频域参数所用样本为小样本,和时域一样,先进行预处理和语音信号提取,然后对每一帧进行短时傅里叶变换,计算器能量,得出能量谱 4.5.2 频域区分参数的选定 4.5.3 最终统计结果 4.6 实验结论用于大样本区分 大样本中每一样本长度为10分钟,从七小时的夜晚录音中选取 大样本中混有说话声、鼾声、无声段及杂声(由于未涉及杂声分类,此时杂声可能为鼾声,可能为说话声)。 结果展示 最终八小时的判定统计结果 5.相关问题的探讨 课题准备 设计思路 系统的过程实现 实验结果和总结 出现的问题的探讨 1 2 3 4 5 课题背景 研究意义 鼾声是一种异常的呼吸音,由病变或睡眠姿势不对所引起。由于鼾声与许多疾病息息相关,在呼吸暂停综合征(OSAHS)等疾病的诊断上有着重要作用。针对现有鼾声诊断由于其他语音信号干扰造成的不足,人们越来越多的先通过语音信号处理录音再用计算机辅助分析。 本次毕业设计提出运用matlab的语音端点检测技术,最大程度的区分出说话声,排除其在鼾声提取过程中的干扰,为鼾声的准确分析提供有效的技术支持。 频域参数方法 近年来,随着人工智能的兴起,也可以通过支持向量机等模式识别的方式实现鼾声与说话声的精确区分。 时域参数方法 通过声学特征的自然成因差异来实现二者的区分。 语音信号的识别 经过前人在鼾声的时域特征上的分析,总结出了其在时域特征上的规律,我们可以通过这些使时域方法实现进一步的设计与应用。 思考 录音样本 大样本分析 小样本分析 预处理 实验结果统计 语音信号提取 时域分析 频
文档评论(0)