语音识别技术及应用研究.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

语音识别技术及应用研究

摘要:智能语音识别是理想的人机交互方式之一,它能够让机器通过识别和理解过程把语音

信号转变为相应的文本或命令。近年来,我国智能语音识别技术发展突飞猛进,取得了许多

显著进步,并开始从实验室走向市场。随着国内智慧建设的大潮,智能语音识别技术与真实

场景的结合应用已成为有价值的研究方向,其在信息化向智能化、智慧化方向发展,在提升

使用降本增效能力等方面将表现出巨大的潜力。鉴于此,文章结合笔者的学习经验,对语音

识别技术及应用研究提出了一些建议,仅供参考。

关键词:语音识别技术;应用现状;研究

引言

至目前为止,我国语音识别技术的研究有了一定的进步,现在大多数应用语音识别技术

的设备是智能手机,如输入法中的语音输入。未来的科技发展将会逐渐高级,需要加强语音

识别技术探索力度,发现未知领域,带动我国系统全面发展。

1、语音识别的发展历程和基本原理概述

1.1语音识别的发展历程

进入20世纪80年代,语音识别技术继续深入发展,人工神经网络进入模式识别的范

畴,出现了利用人工神经网络进行语音识别问题的处理思路,研究不只是在简单词语数字的

识别上,有了连续语音的识别和基于大量词语的识别。20世纪90年代之后,语音识别技术

逐渐进入饱和阶段,基于语音识别的产品开始进入人们的生产生活,随着时代的不断迁移,

大量的语音识别都基于此进行识别系统产品的设计。

1.2语音识别基本原理

首先,对输入的语音信号进行处理;其次,提取相关处理过信号的相关参数;再次与库

中模板进行比对;最后,得到的识别结果是和模板匹配度最高的文字。其中预处理包括预滤

波、采样和量化、加窗、端点检测、预加重等过程。在特征提取时需注意以下事项:(1)

参数要有代表性,能够代表语音特征,且要有一定的区分性;(2)每阶段参数之间要彼此

相互独立;(3)参数计算起来要比较方便,最好有高效的算法,以确保语音识别的实现。

对特征参数进行处理,并为每个词条建立一个模型,并建立一个语音模型数据库,常用的建

模方法有一般有以下几种:动态时间规整法、隐马尔可夫模型法和基于人工神经网络识别

法。在语音识别的阶段,语音信号仍需通过预处理、特征提取等得到语音特征参数,并生成

测试模板,与参考模板进行匹配,将匹配分数最高的参考模板作为识别结果。

2、语音识别当前应用现状

目前语音识别技术已日趋寻常,在其他领域如会议记录听写、客服智能语音助手等都有

所应用。深入研究会发现,目前所谓的人工交互,不过是通过按键或唤醒对机器进行近距离

对话、下达指令,在交互方式及实现的多样性方面比较匮乏。加之国内的一些智能产品还局

限于商业利益和品牌分类的纷争,使得原本可以集中化、综合性的产品被分割,同时售价

高、维修频繁、用户体验低等原因都导致了智能产品未被广泛普及。在未来,语音识别技术

在智能领域的应用有待进一步开发。随着5G技术的发展,会给智能产品的发展提供新的平

台技术,通过语音、手势、人脸识别等交互方式可以实现产品的整体联动交互,提升人民的

幸福感。除此之外,语音技术也会在各个产业发挥更加举足轻重的作用,无论是医药、军

事、商业,在这个全球化和智能化的时代,人工智能已经是不可逆的趋势。

3、语音识别技术及应用研究

3.1语音交互服务系统

语音识别策略主要提供的是语音识别服务,应用在虚拟智能系统中还需要提供对应的接

口进行交互,即各类终端语音采集设备的调用,统称为语音交互服务系统。语音交互服务系

统采用web服务框架实现其核心功能的调用,通过http方式实现语音请求的提交。语音识

别服务功能主要包括三大部分,1)采集与校验语音信息,目前终端的语音采集设备已经将

采集与识别、校验等多种语音服务封装在统一的接口调用中,能够为各类第三方软件提供语

音的交互服务。2)过滤噪声,通过语音识别的预处理策略提取有效的语音序列。3)基于语

音识别算法实现语音控制命令的识别。

3.2语音识别技术的应用-智能电视

将在线语音识别技术应用于智能电视中,是对传统遥控器控制方式的创新,具体包括语

音输入、处理和执行3个方面。在线语音识别技术还没有开发之前,人们主要是通过智能电

视内置传声器、智能电视遥控器、手机APP的方式进行电视节目调节,但上述3种调节方式

都需要连接WiFi,离线状态下无法控制电视。而语音技术的出现,更大程度提高了便利

性,用户只要动动嘴,就能够调节任何遥控器或者手机APP能够调节的内容。将语音技术应

用于智能电视,需要以下必备条件:网络连接、本地识别、通过命令方式执行。也

文档评论(0)

198****2360 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档