连续言语的语音学研究.docxVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
连续言语的语音学研究 人工智能时代语音识别的研究和实践 这是一个令人担忧的时期。在语言加工领域工作的研究人员是一个激动人心的时期。很多人确信,我们正面临着研究和理论上的重大突破,许多古老和长期存在的问题有可能在近几年中得到解决。这些问题的解决很可能有一定的实际应用,例如,研制改进的言语识别系统、更实用的助听器和应用言语技术的各种消费品。 对言语加工的日益增长的信心,部分地是由于过去几年中出现了几种不同而又密切相关的进展。 第一,工程和人工智能界认识到,更好地解决语音识别问题只有通过努力改进语音识别器前端的工作性能才能做到。改进音段识别是把工作性能提高到超过现有的商业技术所能达到的水平的一个直接途径。 第二,研究者们认识到,跟有关孤立无意义音节中音位知觉的大量研究文献相比,我们对于人如何感知流畅连续言语的了解是非常贫乏的。而且,从在国防高级研究项目局(DARPA)的言语理解项目下进行的研究可以越来越清楚地看到,我们需要更根本和更细致地理解言语中句子层面的现象。在词的边界产生的声学语音学变化和音系学规则在言语中的作用是语音可变性的根源,对此我们至今还不甚了解。我们认为,关于连续言语的这两个方面的研究对最终解决识别问题具有重要意义。 最后,人们采用了一些新的研究方法和技术来研究言语中声学语音学可变性的不同根源。有的试图使用从多个讲话人采编的自然言语大型数据库,来定量地估计言语中各种现象的出现。人们用这些技术研制用于机器语音识别的新的、大大地改进了的算法和决策方法。其他一些新的研究工作涉及更细致地分析语图和表示言语在外周听觉系统受到的加工的神经编码的新技术。 言语知觉中的单元和认知单位 言语知觉是一个非常广泛的多学科领域。研究者来自多个学科,包括实验心理学、语言学、言语和听觉科学、电子工程学和人工智能。尽管在方法和总体目标上有所不同,对于什么是当今这个领域的基本问题,研究者们却有相当一致的看法。在这一节中,首先要简要地回顾一下看来比较重要的理论问题。 A.缺少声学语音学的不变量和切分问题 研究者们都认为,言语信号中缺少声学语音学不变量是这个领域中最重要的问题;这是在四十年代后期声谱图发明后发现的一个重要问题;它仍然是当今言语研究领域中的一个中心问题。虽然经过三十多年的研究,人们仍不能成功地确定与知觉分析单元唯一相匹配的音段和言语波形的特性。最明显的一个例子是,找不到与语言学分析假定在已知信息中存在的音段或音位相匹配的声学单元。许多研究表明,言语波形的单个声段常常包含了几个相邻的言语段的信息;反之,同一个言语段在言语波形中又常常受周围的语境、讲话速度、讲话者和句法环境的制约,有不同的声学表示方法。与孤立发的词相比,在连续言语中的单个言语声(即音位)的声学特征因周围语音环境的影响显示出更大的可变性。 与声学语音学不变性问题密切相关的是与语音波形切分有关的一系列问题。言语受上下文制约而变化,言语信号和诸如音位或词这样的语言学-知觉单位之间没有任何直接对应,这对把言语切分成心理学上实在的,并且可以在识别中使用的有意义的单元带来了许许多多的问题。研究表明,要把言语切分成声学上确定的单元,这些单元与相邻的音段互不相关,并与句子环境中出现的上下文影响无关,如果并非不可能,也会是极其困难的。在流畅的连续言语中,使用严格的物理(即声学的)标准确定在哪里一个词结束而另一个词开始,一直是十分困难的。虽然某些词按声学标准切分是可能的,人们发现声段的数量一般总是大大地超过话语中音位或词的数目。 B.言语声的内部表征 直到最近,从事言语知觉工作的研究者相当一致地认为,在知觉加工的某些阶段上,言语信号在内部表现为一个离散的语言段或特征系列。但是,关于这些特征的确切描述,看法却不尽一致。多年来,特征系统的建立都是以声学方面或发音方面的区别以及这两方面的组合为基础。最近,人们开始怀疑这些传统的特征描述,特别是关于这些特征和单元在连续言语知觉中的实际作用。这里的问题是,经重新考察,那些引用来支持以特征或音段为基础的知觉加工的证据是很模糊的,并与更参量化的言语信号表征(声学的或听觉的)同样一致,而这些表征都没有预先假定中间的或更抽象的分析层面。根据这些反对切分表征的观点,许多研究者开始更加密切地注意外周听觉系统学不如何加工言语信号和这些更详尽的表征对解决围绕声学语音不变量问题的争议可能起的作用。 C.言语知觉单位 言语知期存在和密切。由于相关的一个问题是选择最小的知觉分析单位。由于听觉系统通道容量的限制,从外周听觉系统输出的以感觉为基础的丰富的神经信息必须重新编码成可在知觉和后面的决策过程中使用的一些更抽象和更持久的形式。许多研究者提出,是否存在一个基本的或“自然的”言语编码单位。多年来,一些研究者主张把特征、音位、音节或词作为基本的言语知觉单位。其他一些研究者,主要基

文档评论(0)

lmzwkyc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档