《语音识别技术及应用》 项目五 训练语言模型.pptx

《语音识别技术及应用》 项目五 训练语言模型.pptx

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

语音识别

技术及应用;全书目录;;SpeechRecognition;能够编写程序,使用N-gram语言模型解决实际问题。

能够编写程序,使用循环神经网络训练语言模型。;;;项目分析;项目准备;;5.1语言模型概述;在语音识别系统中,通过声学模型能够将语音特征映射为音素序列,而音素序列相同的词可能有多个,那么,语音识别系统应该将这个音素序列识别为哪个词呢?

这就需要语言模型对句子出现的概率进行计算。;5.1语言模型概述;5.1语言模型概述;课堂检测;课堂小结;;5.2.1N-gram语言模型的基本原理;5.2.1N-gram语言模型的基本原理;当时,该语言模型称为一元模型(unigram模型)。此时每个词都相互独立,即每个词出现的概率都与前面的词无关。可见,一元模型没有引入“语境”,对句子的约束最小。一元模型中句子概率的计算方法为。其中,每个词的概率的计算方法为“该词在语料库中出现的次数与语料库总词数的比值”。;当时,该语言模型称为二元模型(bigram模型)。此时当前词出现的概率仅与前一个词有关,即一个词的出现仅依赖于它前面出现的一个词,与其他词无关,故二元模型中句子概率的计算方为。;5.2.1N-gram语言模型的基本原理 2.二元模型;5.2.1N-gram语言模型的基本原理 3.三元模型;5.2.1N-gram语言模型的基本原理 3.三元模型;5.2.2平滑算法;5.2.2平滑算法;5.2.2平滑算法;5.2.2平滑算法 1.拉普拉斯平滑;;5.2.2平滑算法 2.Good-Turing平滑;5.2.2平滑算法 2.Good-Turing平滑;5.2.2平滑算法 2.Good-Turing平滑;5.2.2平滑算法 2.Good-Turing平滑;5.2.2平滑算法 3.Katz平滑;5.2.2平滑算法 4.Kneser-Ney平滑;5.2.3语言模型的评价指标 1.困惑度;5.2.3语言模型的评价指标 2.双语互译质量评估辅助工具;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型??编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;课堂检测;课堂小结;;5.3循环神经网络语言模型;5.3.1循环神经网络的基本原理;5.3.1循环神经网络的基本原理;5.3.1循环神经网络的基本原理;5.3.2循环神经网络语言模型的基本原理;5.3.2循环神经网络语言模型的基本原理;5.3.2循环神经网络语言模型的基本原理;5.3.2循环神经网络语言模型的基本原理;5.3.2循环神经网络语言模型的基本原理;5.3.2循环神经网络语言模型的基本原理;Keras的顺序模型中预制了简单循环层,可通过在顺序模型中添加简单循环层来构建简单的循环神经网络语言模型。创建简单循环层的函数为tf.keras.layers.SimpleRNN(),其语法格式如下。;5.3.3循环神经网络语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;5.2.4N-gram语言模型的编程实现;课堂检测;课堂小结;项目实施;项目实施;项目实施;项目实训;(1)启动JupyterNotebook,以Python3工作方式新建JupyterNotebook文档,并重命名为“lyricsitem5.ipynb”。

(2)数据准备。

①导入本实训需要的框架和库。

②读取中文歌词数据并对数据进行相应处理。

③输出数据处理结果。

④定义一个能够

文档评论(0)

1亿VIP精品文档

相关文档