人工智能应用概论(第2版) 课件 第5、6章 :智能语音、 自然语言处理.pptx

人工智能应用概论(第2版) 课件 第5、6章 :智能语音、 自然语言处理.pptx

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第五章智能语音《人工智能应用概论(第2版)》RengongZhinengYingyongGailun“十四五”广西壮族自治区职业教育规划教材新编21世纪高等职业教育精品教材·通识课系列

Part0101智能语音介绍Part0202智能语音技术应用Part0303智能语音体验目录content

[课程导入】“智能问答机器人”基于深度学习的自然语言处理(NLP)技术,帮助提升客服体验及服务效率,实现24小时无须等候智能服务,通过上下文多轮问答,实现用户问题解决率超90%;“AI外呼机器人”通过自研语音技术(TTS)的植入,实现个性化拟人声音服务,人机交流更亲切自然;【思考题】机器是如何实现识别人类说话,将语音转换成文字的?

Part01智能语音介绍

5.1智能语音技术概况除了语音导航、智能音箱、语音输入法等我们日常生活中的常见应用场景,只要把语音识别理解成“获取人类语言中的信息”,把语音合成理解成“让人类通过声音获取信息”,再把声纹识别、关键词唤醒等理解成可供选择的“功能”,将它们与不同载体、场景结合,就会形成各种各样的产品。

5.1.1语音识别语音识别让机器识别人说出的话,即将语音转换成相应的文本内容(见图5-1),然后根据内容信息执行人的某种意图。语音识别又称言语识别,这项任务涉及将输入声学信号与存储在计算机内存的词表(语音、音节、词等)相匹配,而匹配个别语词的标准技术则要用输入信号与预存的波形(或波形特征/参数)相比较(模型匹配),相当于给机器装上了“耳朵”。

5.1.1语音识别语音识别让机器识别人说出的话,即将语音转换成相应的文本内容(见图5-1),然后根据内容信息执行人的某种意图。语音识别又称言语识别,这项任务涉及将输入声学信号与存储在计算机内存的词表(语音、音节、词等)相匹配,而匹配个别语词的标准技术则要用输入信号与预存的波形(或波形特征/参数)相比较(模型匹配),相当于给机器装上了“耳朵”。

5.1.1语音识别语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模型库等三个基本单元,它的基本结构如下图所示:

5.1.1语音识别声学模型在进行语音识别之前我们要做不少准备工作。先用大量声音数据训练一个声学模型(见图5-3),用来将声音转换为声学符号。我们将要识别的语音按照一定时间间隔切割成彼此重叠、很小很小的段落,再通过声学模型将这些小片段识别成对应的语音状态。这些语音状态是声母、韵母的组成部分,能很好地对语音进行描述。

5.1.1语音识别语言模型(LanguageModel,简称LM)是一个用于建模自然语言(即人们日常使用的语言)的概率模型。简单来说,语言模型的任务是评估一个给定的词序列(即一个句子)在真实世界中出现的概率。

5.1.2语音合成语音合成(TexttoSpeech,TTS)技术,又称文语转换技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴(见图5-6)。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,即让机器像人一样开口说话。

5.1.3声纹识别人们可以靠声音判断对方是谁,声音同样可以被用来证明“你是你”.和面容、指纹一样,人类的发声器官千差万别,发出的声音也不尽相同(见图5-10)。人声的这种特质被称为声纹(见图5-11)。

5.1.3声纹识别事实上,录制和播放的过程会让声音衰减失真,与真人的声音相差甚远,很容易鉴别。或者干脆从产品设计层面出发,要求用户在规定时间内说出一组随机数字,或者与人脸识别、指纹识别等其他识别手段相结合,从而提升安全性(见图5-15).

Part02智能语音技术应用

5.2智能语音技术应用除了语音导航、智能音箱、语音输入法等我们日常生活中的常见应用场景,只要把语音识别理解成“获取人类语言中的信息”,把语音合成理解成“让人类通过声音获取信息”,再把声纹识别、关键词唤醒等理解成可供选择的“功能”,将它们与不同载体、场景结合,就会形成各种各样的产品。

5.2.1酒店虚拟前台酒店前台工作人员每天都要拨打和接听大量的电话,经常出现接打不及时、处理问题没耐心、影响现场接待和客房周转等问题。基于人工智能技术的酒店虚拟前台可以实现前台电话智能接打,能够自动完成酒店的到店确认、退房确认、咨询和客需服务等工作,可同时接打多人电话,瞬间完成业务处理,实现全程无人化,带来高效智能的前台服务,从而提升前台业务效率,提高客房周转能力,解决人手不足和成本攀升等问题。

5.2.2语音质检考虑到复杂业务

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档