《语音识别技术及应用》 项目一 搭建语音识别开发环境.pptx

《语音识别技术及应用》 项目一 搭建语音识别开发环境.pptx

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

语音识别技术及应用主讲教师:

全书目录搭建语音识别开发环境项目一语音特征提取项目二构建传统声学模型项目三使用深度神经网络构建声学模型项目四训练语言模型项目五构建语音识别系统项目六中文普通话语音识别项目七

项目一搭建语音

识别开发环境

SpeechRecognition1.1语音识别概述1.2语音识别的主流框架1.3语音识别常用语料库1.4常用的语音识别开发工具任务导航

项目目标学习目标技能目标素养目标理解语音识别的概念。了解语音识别的应用领域和发展历程。掌握语音识别的主流框架。了解语音识别的常用语料库。了解常用的语音识别开发工具。能够成功搭建语音识别的开发环境。能够使用JupyterNotebook编写简单程序。学习语音识别基础知识,加强对新技术的了解,培养勇于尝试的精神。了解科技前沿新技术,把握机遇与挑战,提高竞争力。

项目描述与机器进行语音交流,是人类长期以来的梦想。如今,人工智能将这一梦想变为了现实。如今随处可见的语音助手、语音翻译、语音输入、智能客服等应用,其关键技术就是语音识别。因此,越来越多的人开始投身于语音识别的学习和开发中。小旌也关注到了这一点,决定探索这一领域,他先从搭建语音识别开发环境入手。

项目描述Python?语言具有数量庞大且功能相对完善的标准库和第三方库,这使得开发者能够轻松地构建和部署语音识别系统,因此,小旌决定使用?Python语言进行开发。而?Anaconda?是一个开源的?Python?发行版本,集成了包含?NumPy、Matplotlib、HMMlearn、Scikit-learn?等?180?多个科学工具包,使用?Anaconda?可一次性安装Python开发环境及大量的第三方库。于是,小旌决定使用?Anaconda?来完成语音识别开发环境的搭建。

项目描述在语音识别的开发过程中,还需要用到深度学习算法和自然语言处理的相关内容。因此,安装完Anaconda之后,小旌决定再安装深度学习框架TensorFlow和自然语言工具包NLTK,为后续项目的开发做好准备。

项目分析按照项目要求,搭建语音识别开发环境的具体步骤分解如下。第1步:安装Anaconda。从Anaconda的官方网站或国内镜像站点下载Anaconda软件包并根据安装步骤进行安装。第2步:安装TensorFlow。在“AnacondaPrompt”窗口中,利用程序命令安装深度学习框架TensorFlow。第3步:安装NLTK。在“AnacondaPrompt”窗口中,利用程序命令安装自然语言工具包NLTK和对应的NLTK数据包。第4步:使用JupyterNotebook。启动JupyterNotebook,并使用它编辑、运行和调试程序。为更好地进行语音识别的开发,本项目将对相关知识进行介绍,包含语音识别的概念、应用领域和发展历程,语音识别的主流框架,语音识别常用语料库,以及常用的语音识别开发工具。

项目准备全班学生以3~5人为一组进行分组,各组选出组长,组长组织组员扫码观看“语音的产生和感知”视频,讨论并回答下列问题。问题1:语音的四要素是什么?问题2:语音是如何产生的?问题3:人类是如何感知到语音的?语音的产生和感知

1.1语音识别概述

1.1.1语音识别的概念语音识别也称自动语音识别(automaticspeechrecognition,ASR),是计算机科学领域和人工智能领域的一个重要研究方向,是一门融信号处理、计算机科学、语言学、声学等于一体的综合性学科。语音识别是研究如何通过计算机技术将人类的语音信号转换为可被计算机处理的文本信息的技术根本目的:是使机器具有“听觉”功能,能够直接接收人类的语音

1.1.1语音识别的概念理解语音识别的概念,必须明确以下几个方面的内容。(1)语音识别只解决机器“听清”的问题,而不解决机器“听懂”的问题,即语音识别技术只研究如何将语音信号转换为文本信息,而不研究文本信息的具体含义文本信息具体含义的研究属于自然语言处理的范畴(2)语音识别要解决声学与部分语言的混淆问题,即语音识别需要关注识别文字的正确性例如,“草丛中有一只蜜蜂”与“草丛中有一只密封”这两句话的语音完全相同,机器识别出哪句话是正确的呢?语音识别应给出正确的答案,解决部分语义消歧问题(3)语音识别的目标是能够将每个人的语音都识别正确,不会因为不同人在发音、语调、语速等方面的不同而识别错误,即语音识别关注的是“共性”问题

1.1.2语音识别的应用领域近年来,随着计算机性能的提升和深度学习方法的崛起,语音识别逐渐从实验室走向了人们的日常生活,已经成为现代社会不可或缺的一部分。总体来说,语音识别的应用主要集中在以下领域。语音对话系统语音助手语音翻译语音有哪些信誉好的足球投注网站语音控制语音输入智能语音客服

1.1.2语音

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档