基于统计的汉语音素类别标识技术及其在语音识别中的应用.PDFVIP

基于统计的汉语音素类别标识技术及其在语音识别中的应用.PDF

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于统计的汉语音素类别标识技术及其在语音识别中的应用.PDF

基于统计的汉语音素类别标识技术及其在语音识别中的应用 张华,唐赟,刘文举 中国科学院自动化所模式识别国家重点实验室,北京 100080 E-mail:{ hzhang ,tangyun,lwj }@nlpr.ia.ac.cn 摘要 音素类别标识,是指将音素分为若干类别,并对语音 信号所属音素类别做出判断的过程。音素类别标识可分为基 本文提出了一种基于统计的汉语音素类别标识方法。 于统计和基于知识两种方法。统计音素类别标识,用数据驱 该方法在将汉语音素划分为若干类的基础上,构建运算速度 动的聚类方式对音素分类,其语音特征采用频域特征。基于 快、准确度高的GMM 音素类别标识器,来判断语音信号的 知识的音素类别标识,按照语音学中的发音器官、发音位置、 音素类别。我们将该标识器成功地融合到基于段模型的大词 发音方法等将音素分类,一般采用语音学特征(Phonetic 汇量连续语音识别系统。对863 连续语音的识别实验表明, Features, PF)或其声学相关参数为特征[5] 。统计音素类别标 根据标识器输出的音素类别信息来缩小识别阶段声学模型 识对各个音素类建模,采用模型匹配的方式判断音素类别。 有哪些信誉好的足球投注网站空间的方法,能够在不影响识别正确率的同时,使语音 而基于知识的音素类别标识,可以由语音学参数直接标识音 识别系统的识别时间减少51.8% 。 素类别[6],也可以通过统计模型如SVM[7]和HMM[8]等标识音 关键词:语音识别; 音素分类; K-均值聚类; 高斯混合模型; 素类别。为了直接使用语音识别系统中的特征数据,并便于 段模型 系统的融合,本文的音素类别标识系统是基于统计方法所设 计,以高斯混合模型((Gaussion Mixture Model, GMM)为分类 1. 引言 器,声学特征采用MFCC 。 目前,汉语连续语音识别系统普遍以音素为识别单元, 汉语语音包括64 个音素,考虑到音调,实验所用音素 以隐马尔科夫模型(Hidden Markov Model, HMM )为声学 集中共有190 个音素。所有音素的声学模型构成语音识别阶 模型。在语音识别阶段,要求计算待识别语音信号在有哪些信誉好的足球投注网站空 段的有哪些信誉好的足球投注网站空间。在前期训练阶段,我们采取K-均值聚类方法 间内所有声学模型的后验概率,这使得识别过程的计算量 [10]将音素划分为若干类别。有哪些信誉好的足球投注网站空间也被分成了若干个子 大,耗时长[1] 。作为HMM 的改进模型,段模型(Segment 空间,每个子空间与一个音素类别相对应,包含且仅包含该 Model, SM )放宽了HMM在给定状态时语音观测矢量相互独 音素类别中全部音素的声学模型。音素类别的个数可以根据 立的假设,采用包含若干语音帧的语音段为基本的建模单 需要调整。随后,我们对每个音素类别建立一个GMM 。在 元,从而获得更精确的声学模型[2][3] 。但这也导致其在语音 识别过程的第一阶段,将以帧为单位的待识别语音信号在已 识别阶段的有哪些信誉好的足球投注网站范围更广,大大增加了计算复杂

文档评论(0)

sunyangbill + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档