- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MATLAB的语音信号的清浊音分析
目录 1 语音信号概述 1 1.1 语音信号的基本组成 1 1.2 语音信号的“短时谱” 1 1.3 基音周期 2 1.4 短时分析技术 2 2 语音信号的采集及清浊音分析 2 2.1 语音信号的采集 2 2.2 采样分帧 3 2.3短时能量和短时平均幅度 4 2.4短时过零率 6 2.5短时自相关函数 8 3 心得体会 10 主要参考资料 10 附录 11 1 语音信号概述 1.1 语音信号的基本组成 语音信号的基本组成单位是音素。音素可分成“浊音”和“清音”两大类。如果将不存在语音而只有背景噪声的情况称为“无声”。那么音素可以分成“无声”、“浊音”、“清音”三类。一个音节由元音和辅音构成。元音在音节中占主要部分。所有元音都是浊音。在汉语普通话中,每个音节都是由“辅音一元音”构成的。 在信号处理中,语音按其激励形式的不同可分为2 类: (1)浊音 当气流通过声门时,如果声带的张力刚好使声带发生张弛振荡式的振荡,产生一股准周期的气流,这一气流激励声道就产生了浊音。这种语音信号是1 种激励信号,它是由规则的全程激励产生的,其时域波形具有准周期性,语音频率集中在比较低的频率范围内,短时能量较高,由于语音信号中的高频成分有高的过零率而低频有低的过零率,因此浊音的过零率低。通常,浊音信号可以由周期激励通过线性滤波器合成。 (2)清音 当气流通过声门时,如果声带不振动,而在某处收缩,迫使气流高速通过这一收缩部分而产生湍流,就得到清音。清音是由不规则的激励产生的,发清音时声带不振动,其时域波形不具有周期性, 自相关函数没有很强的自相关周期峰,其语音频率集中在较高的范围内,短时能量较低,因而过零率较高。通常,清音信号可由白噪声通过线性滤波器合成。 1.2 语音信号的“短时谱” 对于非平稳信号,它是非周期的,频谱随时间连续变化,因此由傅里叶变换得到的频谱无法获知其在各个时刻的频谱特性。如果利用加窗的方法从语音流中取出其中一个短段,再进行傅里叶变换,就可以得到该语音的短时谱。 1.3 基音周期 浊音信号的周期称为基音周期,它是声带振动频率的倒数,基音周期的估计称为基音检测。基音检测是语音处理中的一项重要技术,它在有调语音辨意、低速率语音编码、说话人识别等方面起着非常关键的作用。但在实现过程中,由于声门激励波形不是一个完全的周期脉冲串,再加上声道影响去除不易、基音周期定位困难、背景噪声影响强烈等一系列因素,基音检测面临着很大的困难。现在已有很多性能优越的基音检测算法,自相关基因检测算法就是一种基于语音时域分析理论较好的算法,在这里基于声音文件比较稳定的基础上,使用观察法获取基音周期。 1.4 短时分析技术 语音信号具有时变特性,但在一个短时间范围内(一般认为在10~30ms的短时间内),其特性基本保持不变,即相对稳定,因而可以将其看作是一个准稳态过程,即语音信号具有短时平稳特性。任何语音信号的分析和处理必须建立在“短时”的基础上。即进行“短时分析”,将语音信号分段来分析其特征参数,其中每一段称为一“帧”,帧长一般取为10~30ms。这样,对于整体的语音信号来讲,分析出的是由每一帧特征参数组成的特征参数时间序列。 2 语音信号的采集及清浊音分析 2.1 语音信号的采集 该设计以本人的声音为分析样本。在MATLAB中使用Wavread函数。可得出声音的采样频率为22050Hz,且声音是单通道的。利用sound函数,可清晰地听到读音为:“电子信息工程”的音频信号。采集数据并画出波形图如下所示,fs 为采样频率,x为采样数据,接下来对采样数据作傅里叶变换y=fft(x)并画出频谱图如图1所示: 图1 原始语音信号波形及频谱图 由频谱图可清楚地看到样本声音主要以低频为主。人的语音信号频率一般集中在200 kHz到4.5 kHz之间,从声音频谱的包络来看,样本声音的能量集中在0.1pi(1 102.5Hz)以内,0.4pi以外的高频部分很少。所以信号宽度近似取为1.1kHz,由采样定理可得fs 2fo=2xl 102.5=2205Hz。 2.2 采样分帧 这里的采样是指从语音信号中选取一段样本, 一般取样点数为帧长的整数倍。 每秒钟的采样样本数叫做采样频率,分帧主要完成将取样模块中获得的语音样值点分为若干个语音帧,语音是不平稳的时变信号,在时间足够短的情况下,可以近似认为是平稳的,短时分析将语音流分为一段一段来处理, 每一段就被称为一帧。分帧时需对语音信号进行加窗操作, 即用一个有限长度的窗序列截取一段语音信号来进行分析,该窗函数可以按时间方向滑动, 以便分析任一时刻附近的信号。常见的窗函数有: 方窗、Hamming 窗及Hannig 窗。如果把窗函数理解成为某个滤波器的单位冲激响应,由于窗函数一般是中间大两头小的光滑函数,因此该滤波器具有低通特性。窗口长
您可能关注的文档
- 十大影响世界文明进程的魅力方程.doc
- 升华和凝华练习题1.doc
- 十组知识理论与战略研究.doc
- 半固态成形能否提高材料的力学性能.doc
- 半实物仿真技术发展综述.doc
- 半导体物理知识点.doc
- 半导体物理第十一章3.doc
- 半导体物理考试范围参考.doc
- 华东师范大学考研体育心理学专业课真题.docx
- 半导体物理复习题二.doc
- GB/T 46622.1-2025液压传动 螺纹插装阀安装连接尺寸 第1部分:米制螺纹.pdf
- 《GB/T 46622.1-2025液压传动 螺纹插装阀安装连接尺寸 第1部分:米制螺纹》.pdf
- 2025重庆渝海物业管理有限责任公司外包岗位招聘7人备考题库必威体育精装版.docx
- 岳池县兴隆镇公开招聘社区网格员的备考题库必威体育精装版.docx
- 2025湖南怀化市靖州县纪委监委选调11人备考题库必威体育精装版.docx
- 2025年镇原县科技局下属事业单位招聘笔试参考题库附答案.docx
- 贵州国企招聘:2025中国人民财产保险股份有限公司贵州省分公笔试参考题库附答案.docx
- 2025年武汉铁路局集团招聘(180人)笔试参考题库必威体育精装版.docx
- 2025重庆市应急管理局遴选公务员7人备考题库附答案.docx
- 赣州市人力资源有限公司公开招聘劳务派遣制工作人员备考题库附答案.docx
有哪些信誉好的足球投注网站
文档评论(0)