- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2.4.3 辐射模型 2.4.4 语音信号的数字模型 Av 周期脉冲 发生器 声门脉冲 模型G(z) 随机噪声 发生器 基音周期TP AN 线性系统 声道V(z) 辐射模型 R(z) 清/浊音开关 传输函数 2.5 语音信号的特性分析 2.5.1 语音信号的时域波形和频谱波形 2.5.2 语音信号的语谱图 2.5.3 语音信号的统计特性 2.5.1语音信号的时域波形和频谱波形 频率/kHz 幅度/dB 2.5.2 语音信号的语谱图 Matlab 命令:specgram Wideband spectrogram:给出共振峰频率 Narrow spectrogram:基音周期及其谐波 specgram computes the windowed discrete-time Fourier transform of a signal using a sliding window. The spectrogram is the magnitude of this function. 欢迎使用微软中国研究院中文语音合成系统 的时域波形和语谱图 “毕业” 2.5.3 语音信号的统计特性 语音信号振幅分布的概率密度有两种逼近方法: 修正伽玛(Gamma)分布概率密度函数: 拉谱拉斯(Laplace)分布概率密度函数: 2.3 语音生成系统和语音感知系统 2.3.1 语音发音系统 2.3.2 语音听觉系统 2.3.1 语音发音系统 人的发音器官包括肺、气管、喉(包括声带)、咽、鼻和口。这些器官共同形成一条形状复杂的管道。喉的部分成为声门。从声门到嘴唇的呼气通道叫做声道。声道的形状主要由嘴唇、颚和舌头的位置来决定,由声道的形状的不断改变,而发出不同的语音。语音是从肺部呼出的气流通过在喉头至嘴唇的器官的各种作用而发出的,产生语音的能量来源于正常呼吸肺部呼出的稳定气流。 喉的生理结构 喉位于气管的上端,实际上是气管末端一圈软骨构成的一个框架,前方稍高处的软骨称为甲状软骨,前后方环成一圈的称为喉部环形软骨,喉中两片肌肉称为声带,声带之间的空隙为声门。 当声带张开时,声门打开,空气可自由呼出,正常呼吸就处于这种情况;当声带闭合,声门关闭。声带每开启和闭合一次的时间(即声带的振动周期)就是音调周期或基因周期。它的倒数称为基音频率,简称基频。 甲状软骨 声门 声带 环形软骨 人的前方 喉 声道由咽、口腔和鼻腔组成,是一根从声门延伸至口唇的非均匀截面的声管,其外形变化是时间的函数。声道有许多自然谐振频率。 c为声速,L为声管长度,n表示谐振频率的序号。 人的发音器官简图 气流从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,期间的传输通道称为声道。气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。 讲话时,由于舌和唇的连续运动,使声道形状改变,随即改变谐振频率,使得发不同的音。声道的不同的形状,对应不同的谐振频率。 声道 当说话时,声带在软骨的作用下相互靠近但不完全闭合,声门变成一条窄缝,当气流通过窄缝时压力减小,外界压力大,从而两片声带完全闭合使得气流不能通过,当气流阻断时压力恢复正常,推开两片声带,声门再次打开,气流再次流过。 声带靠拢 Tp 基音周期 声带的开启和闭合称为振动。这一振动过程周而复始,形成了一串周期性脉冲气流送入声道。这个过程发出的音称为浊音。如汉语发音的[a]、[i]、[u]和[o]等。 发音的三种方式-excitation 浊音(voiced sounds)声带开启和闭合,在声门处产生一个准周期性脉冲序列。(quasi-periodic sequence) 清音(unvoiced sounds)声带完全舒展开来,声道的某个部位发生收缩形成了一个狭窄的通道,当空气流到达此处时被迫以高速冲过收缩区,并在附近产生空气的湍流,类似于白噪声。(white noise) 爆破音(plosive/stop sounds)声带完全舒展开来,声道的某个部位完全闭合在一起,当空气流到达时便在此处建立起空气压力,一旦闭合点突然开启便会让气压快速释放,实际上也是一种空气的湍流。(white noise) ☆ F0 =1/Tp,基音频率,由声带的质量来决 定。 ☆ F0的大小决定了声音的高低,称为音高。 ☆ 男性的F0大致分布在: 50~250Hz ☆ 女性和儿童的F0大致分布在:100~500Hz 基音频率(Fundamental Frequency-pitch)F0 基音频率 输出气流的频率 共振峰频率 女声英文a的频谱 男声汉语拼音声
文档评论(0)