- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课题项目二语音特征提取
课时8课时(360min)
知识目标:
(1)了解语音特征的提取流程
(2)理解预加重、分帧和加窗的基本原理及其实现方法
(3)理解短时傅里叶变换的基本原理和实现方法
(4)掌握语谱图特征的提取方法
(5)掌握Fbank特征的提取方法
(6)掌握MFCC特征的提取方法
教学目标
技能目标:
(1)能够编写程序,完成语音数据的预处理操作
(2)能够编写程序,对语音数据进行短时傅里叶变换
(3)能够编写程序,提取语音数据的语谱图、Fbank和MFCC特征
素养目标:
(1)学习语音数据预处理和语音特征提取的相关技术,提升逻辑推理能力
(2)掌握不同语音特征的提取方法,形成知识体系,培养系统思维
教学重点:语音特征的提取流程,预加重、分帧和加窗的基本原理及其实现方法,短时傅里叶变换
教学重难点的基本原理和实现方法
教学难点:语谱图特征、Fbank特征和MFCC特征的提取方法
教学方法案例分析法、问答法、讨论法、讲授法
教学用具电脑、投影仪、多媒体课件、教材
教学过程主要教学内容及步骤
【教师】使用APP进行签到
考勤
【学生】班干部报请假人员及原因
【教师】播放“语音的产生和感知”视频(详见教材),并提出以下问题:
(1)哪些噪声会对语音信号的识别产生影响?请列举两种。
问题导入(2)如何在语音信号中有效去除噪声?
(3)去除噪声后的语音信号有什么特点?
【学生】聆听、思考、举手回答
【教师】通过学生的回答引入要讲的知识,讲解语音特征的提取流程,语音数据预处理,短时傅里
叶变换,以及语音特征的提取等知识
2.1语音特征的提取流程
原始的语音信号是不定长的时域信号,一般需要将其转换为特征向量,才能用于语音识别任务,
这个转换过程称为语音特征提取。随着深度神经网络技术的发展,虽然原始语音信号也可以作为网络
的输入,但是对深度神经网络提出了更高的要求。因此,语音特征提取仍是语音识别的关键技术之一。
传授新知
✈【教师】利用多媒体展示“提取语音特征的一般流程”图片(详见教材),并进行讲解
在语音识别领域中,常见的语音特征有语谱图特征、Fbank特征和MFCC特征。提取这些特征的
一般流程如图所示。
可见,提取3个语音特征之前,都需要经过预加重、分帧、加窗、短时傅里叶变换等步骤,然后
各自再进行不同的处理。其中,语谱图特征需要进行取对数操作,Fbank特征需要经过梅尔滤波器组
后再取对数,而MFCC特征是在Fbank特征的基础上进行离散余弦变换得到的特征。
2.2语音数据预处理
2.2.1预加重
1.预加重的基本原理
在音频采集过程中,由于传感器和麦克风等设备的特性,高频部分容易受到衰减,导致信号在这
些频率上的能量相对较低,影响语音识别的准确性。为了抵消这种效应,可采用预加重的方法补偿语
音信号高频部分的振幅。
假设输入语音第n个采样点的信号为X(n),则预加重的公式为
Y(n)X
您可能关注的文档
- 《Excel数据处理与分析案例教程[Win 10+Excel ]》教案 项目三 数据整理.pdf
- 《自然语言处理技术及应用》教案 项目9 智能问答机器人的设计与实现.pdf
- 《自然语言处理技术及应用》教案 项目8 情感分析.pdf
- 《自然语言处理技术及应用》教案 项目6 句法分析.pdf
- 《自然语言处理技术及应用》教案 项目7 语义分析.pdf
- 《自然语言处理技术及应用》教案 项目5 文本向量化.pdf
- 《自然语言处理技术及应用》教案 项目3 词法分析.pdf
- 《自然语言处理技术及应用》教案 项目4 关键词提取.pdf
- 《自然语言处理技术及应用》教案 项目2 构建语料库.pdf
- 《自然语言处理技术及应用》教案 项目1 搭建自然语言处理开发环境.pdf
- 《语音识别技术及应用》教案 项目五 训练语言模型.pdf
- 《语音识别技术及应用》教案 项目三 构建传统声学模型.pdf
- 《语音识别技术及应用》教案 项目四 使用深度神经网络构建声学模型.pdf
- 《语音识别技术及应用》教案 项目七 中文普通话语音识别.pdf
- 《语音识别技术及应用》教案 项目六 构建语音识别系统.pdf
- 《计算机视觉技术及应用》教案 项目9 人脸检测与识别.pdf
- 《计算机视觉技术及应用》教案 项目8 视频处理.pdf
- 《计算机视觉技术及应用》教案 项目6 物体检测与计数.pdf
- 《计算机视觉技术及应用》教案 项目7 图像拼接.pdf
- 《计算机视觉技术及应用》教案 项目5 形状识别.pdf
文档评论(0)