- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章循环神经网络-神经网络与深度学习
第七章 循环神经网络 前馈神经网络假设每次输入都是独立的,也就是说每次网络的输出只依赖 于当前的输入。但是在很多现实任务中,不同时刻的输入可以相互影响,比如 视频、语音、文本等序列结构数据。某个时刻的输出可能和前面时刻的输入相 关。此外,这些序列结构数据的长度一般是不固定的。而前馈神经网络要求输 入和输出的维数都是固定的,不能任意改变。当处理序列数据时,前馈神经网 络就无能力为了。 ( , ),也叫 。 循环神经网络 递归神经网络 这里为了区别与另外一种递归神经网络( ),我们称 为循环神经网络。在前馈神经网络模型中,连接存在层与层之间,每层的节点 之间是无连接的。 循环神经网络通过使用带自反馈的神经元,能够处理任意长度的序列。循 环神经网络比前馈神经网络更加符合生物神经网络的结构。循环神经网络已经 被广泛应用在语音识别、语言模型以及自然语言生成等任务上。 给定一个输入序列x = (x , x , . . . , x , . . . , x ),循环神经网络通过下面 1:T 1 2 t T 公式更新带反馈边的隐藏层的活性值h : t 0 t = 0 ht = f (h , x ) t1 t 从数学上讲,公式可以看成一个动态系统。动态系统是指系统的状态按 照一定的规律随时间变化的系统。因此,活性值h 在很多文献上也称为状态或 t 隐状态。但这里的状态是数学上的概念,区别与我们在前馈网络中定义的神经 元的状态。理论上循环神经网络可以近似任意的动态系统。图给出了循环神 经网络的示例。 第七章 循环神经网络 输出层 h h 隐藏层 延迟器 x 输入层 h 图 循环神经网络 循环神经网络的参数训练可以通过时序反向传播( , )算法 来学习。时序反向传播即按照时间的逆序将 错误信息一步步地往前传递。这样,当输入序列比较长时,会存在梯度爆炸和 消失问题 ,也称为长期依赖问题。为了解决这个问题,人们对循环神经网络 进行了很多的改进,其中最有效的一个改进版本是长短时记忆神经网络 ( , ) 。 在本章中,我们先介绍循环神经网络的基本
文档评论(0)