- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
语音识别
技术及应用
主讲教师:
项目一搭建语音识别开发环境
项目二语音特征提取
全书目录项目三构建传统声学模型
项目四使用深度神经网络构建声学模型
项目五训练语言模型
项目六构建语音识别系统
项目七中文普通话语音识别
项目七
中文普通话
语音识别
项目目标
学习目标技能目标
掌握语音识别项目的实施流程。能够导入中文语音数据集,并对数据集进行
掌握语音识别项目中语音数据和标签数处理。
据的处理方法。能够编写程序,构建中文普通话的语音识别
掌握中文普通话语音识别项目中模型的系统。
构建方法。能够编写程序,使用CTC解码算法进行解码。
进一步掌握CTC解码算法的使用方法。素养目标
培养勇于奋斗、乐观向上的工作态度,提高
自我管理能力。
养成良好的学习习惯,拥有强健的体魄、健
康的心理和健全的人格。
项目描述
智能音箱能够流畅地使用中文与人进行交流;视频剪辑软件能够精准地识别视频中
的语音信息,为视频搭配中文字幕;社交聊天工具能够快速地将输入的语音转换为中文
文字,实现高效、便捷地语音输入。这些功能的实现,主要得益于中文普通话语音识别
技术的发展。中文普通话语音识别技术为这些功能提供了强有力的技术支撑,使得智能
设备能够更加智能化地处理中文语音信息。
小旌了解到,使用现有的语音识别知识
就能训练出一个中文普通话语音识别系统。
于是,他开始尝试。
项目描述
小旌采用的数据集是中文语音数据集(见本书配套素材“item7/data_thchs30”),
该数据集由1000多个语音片段组成,这些语音片段的内容包含新闻、广播、科技等
多种主题。此外,该数据集还提供了一个标签数据文件“data.txt”,该文件介绍了
每个语音片段对应的拼音和中文文字,部分内容如图所示。
小旌打算使用该数据集训练一个中文普通话语音
识别模型,并使用该模型进行中文普通话的语音识别。
项目分析
第1步:数
按照项目要求,中文普通话语音识别的据具准体备步。骤定分解如下。
义
source_get()
函数,并使
第用2该步函:数标获
第3步:语
签取数语据音处文理件。
音数据处理。
读的取路标径签列数表。
定义一个数
据文件的内
据生成器,
文档评论(0)