《语音识别技术及应用》 项目七 中文普通话语音识别.pptx

《语音识别技术及应用》 项目七 中文普通话语音识别.pptx

  1. 1、本文档共27页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

语音识别

技术及应用

主讲教师:

项目一搭建语音识别开发环境

项目二语音特征提取

全书目录项目三构建传统声学模型

项目四使用深度神经网络构建声学模型

项目五训练语言模型

项目六构建语音识别系统

项目七中文普通话语音识别

项目七

中文普通话

语音识别

项目目标

学习目标技能目标

掌握语音识别项目的实施流程。能够导入中文语音数据集,并对数据集进行

掌握语音识别项目中语音数据和标签数处理。

据的处理方法。能够编写程序,构建中文普通话的语音识别

掌握中文普通话语音识别项目中模型的系统。

构建方法。能够编写程序,使用CTC解码算法进行解码。

进一步掌握CTC解码算法的使用方法。素养目标

培养勇于奋斗、乐观向上的工作态度,提高

自我管理能力。

养成良好的学习习惯,拥有强健的体魄、健

康的心理和健全的人格。

项目描述

智能音箱能够流畅地使用中文与人进行交流;视频剪辑软件能够精准地识别视频中

的语音信息,为视频搭配中文字幕;社交聊天工具能够快速地将输入的语音转换为中文

文字,实现高效、便捷地语音输入。这些功能的实现,主要得益于中文普通话语音识别

技术的发展。中文普通话语音识别技术为这些功能提供了强有力的技术支撑,使得智能

设备能够更加智能化地处理中文语音信息。

小旌了解到,使用现有的语音识别知识

就能训练出一个中文普通话语音识别系统。

于是,他开始尝试。

项目描述

小旌采用的数据集是中文语音数据集(见本书配套素材“item7/data_thchs30”),

该数据集由1000多个语音片段组成,这些语音片段的内容包含新闻、广播、科技等

多种主题。此外,该数据集还提供了一个标签数据文件“data.txt”,该文件介绍了

每个语音片段对应的拼音和中文文字,部分内容如图所示。

小旌打算使用该数据集训练一个中文普通话语音

识别模型,并使用该模型进行中文普通话的语音识别。

项目分析

第1步:数

按照项目要求,中文普通话语音识别的据具准体备步。骤定分解如下。

source_get()

函数,并使

第用2该步函:数标获

第3步:语

签取数语据音处文理件。

音数据处理。

读的取路标径签列数表。

定义一个数

据文件的内

据生成器,

文档评论(0)

1亿VIP精品文档

相关文档