- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
语音信号处理的发展历程及发展趋势
201105028
摘要:文章简要介绍了语音信号处理这一分支学科形成和发展的历史过程.指
出了它在现代信息科学技术中的地位和作用.介绍了语音信号处理在应用领域的
一些重要课题,如语音的低速率编码,语音的规则合成和文-语转换系统,语音识
别和人-机语音对话等,这些仍然是当前研究的热点.文章最后展望了语音信号处
理的发展前景,指出在这个领域还有很多难题等待人们去研究探索.
关键词语音信号处理,语音低速编码,语音识别
发展历程
声学是物理学的一个分支学科,而语言声学又是声学的一个分支学科.它主要的
研究方向是人的发声器官机理,发声器官的类比线路和数学模型,听觉器官的特
性(如听阈、掩蔽、临界带宽、听力损失等),听觉器官的数学模型,语音信号的物
理特性(如频谱特性、声调特性、相关特性、概率分布等),语音的清晰度和可懂
度等.当今通信和广播的发展非常迅速,而语言通信和语言广播仍然是最重要的
部分,语言声学则是这些技术科学的基础.
语言声学的发展和电子学、计算机科学有着非常密切的关系.在它发展的过
程中,有过几次飞跃.第一次飞跃是1907年电子管的发明和1920年无线电广播的
出现.因为有了电子管放大器,很微弱的声音也可以放大,而且可以定量测量.从
而使电声学和语言声学的一些研究成果,扩展到通信和广播部门.第二次飞跃应
该是在20世纪70年代初,由于电子计算机和数字信号处理的发展,人们发现:声
音信号特别是语音信号,可以通过模数转换器(A/D)采样和量化,它们转换为数字
信号后,能够送进计算机.这样就可以用数字计算方法,对语音信号进行处理和加
工.例如频谱分析可以用傅里叶变换或快速傅里叶变换(FFT)实现,数字滤波器可
以用差分方程实现.在这个基础上,逐渐形成了一门新学科)))语音信号处理.它
的发展很快,在通信、自动控制等领域,解决了很多用传统方法难以解决的问题.
在信息科学中占有很重要的地位.
语音信号处理在信息科学中的地位和作用
众所周知,语音在人类社会中起了非常重要的作用.在现代信息社会中,小至
人们的日常生活,大到国家大事、世界新闻、社会舆论和各种重要会议,都离不开
语言和文字.近年来,普通电话、移动电话和互联网已经普及到家庭.在这些先进
的工具中,语音信号处理中的语音编码和语音合成就有很大贡献.再进一步,可以
预料到的口呼打字机(又称听写机,它能把语音转换为文字)、语音翻译机(例如输
入为汉语,输出为英语,或者相反),已经不是梦想而是提到日程上的研究工作了.
人们早就希望用语音指挥机器,机器的执行情况也能用语音回答.这在某些领域
已经部分地实现了.目前计算机芯片的集成度和运算能力,每18个月就提高一倍,
而成本又不断降低,因此,它已经广泛地应用于在社会生产和生活的各个方面.然
而计算机接收信息的外围设备和主机相比,要逊色得多.能说能听的计算机还不
能普遍使用.也就是说:语音识别、语音理解和语音合成等课题,还有很多理论问
题和技术问题没有解决,需要继续深入研究.
科学家们深入研究后认为,要解决人-机语音对话这样的难题,做出真正实用
的语音机器,必须开展跨学科的研究,如声学、语言学、语音学、生理学、数字信
号处理、人工智能和计算机科学等.要真正赋予微电脑以语言功能,必须彻底了解
语言是如何产生、感知,以及人类的语言通信是如何进行的?图1给出了从语言产
生到语音感知全过程中的几个重要环节.从图1可以看到,要使这个问题得到满
意的解决,需要深入研究人类发声器官和听觉器官机理,建立能反映客观真实情
况的物理模型和数学模型.
图1人类语音通信的过程
语音信号所包含的信息量[1,2]
语音信号中到底包含了多少信息量,需要多少比特才能够无失真地表示它们,
这对于语音编码、语音合成和语音识别的研究都是很有用的.但是这也是一个很
复杂的问题,它涉及到对于信号失真的评价.下面列举了三种评价,其中两种是由
弗累雷格(Flanagan)给出的,另一种是由约翰斯登(Johnston)提出的.它们是建
立在下面三种不同的失真评价上:(1)语音信号的信噪比;(2)接收语音信号时,信
号由听觉外围处理以后,人们在主观上能够感觉到的失真;(3)人在接收语音信号
时,不正确接收音素的数目和正确接收音素数目的比值.
在所有的三种情况下,所得到的比特率是首先选择能够接受的失真等级,然
后,
您可能关注的文档
最近下载
- 2023年人教版中考英语复习词汇单选辨析100题(三)(含答案).docx VIP
- 雷克萨斯-Lexus IS-产品使用说明书-IS300-ASE30L-AEZLZC-LEXUS雷克萨斯IS300OM53D87C_01-1705-00.pdf
- 小学心理健康教育 心理高危学生干预方案 (模板).doc VIP
- 癫痫的急救与护理.pptx
- 1971_Monopulse Radar单脉冲雷达分析.pdf
- 清华大学《理论力学》历年期末考试试卷.pdf
- 仁爱英语八年级上册单词默写版.docx VIP
- 新生儿感染性疾病.ppt
- 钢结构功能性涂料—导静电涂料.pptx
- 2024研修《多边形的面积》大单元整体教学设计观评课.doc VIP
文档评论(0)