- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
机器学习读书笔记〔一〕
机器学习的根本概念和学习系统的设计
最近在看机器学习的书和视频,我的感觉是机器学习是很用的东西,而且是很多学科交叉形成的领域。最相关的几个领域要属人工智能、概率统计、计算复杂性理论、计算智能。
机器学习的定义
《机器学习》ByM.Mitchell第一章中和斯坦福机器学习公开课第一课都提到了一个这样定义:
对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序从经验E中学习。
并举了一个例子,西洋跳棋学习问题:
任务T:下西洋跳棋
性能标准P:比赛中击败对手的百分比
训练经验E:和自己进行对弈
这个例子很清楚的解释了上面的定义,后面会以这个例子来说明机器学习的根本设计方法。
设计学习系统
选择任务
根据上面的定义,我们就选择任务是学习下西洋跳棋。
选择性能标准
在世界锦标赛中的获胜百分比
训练经验选择
相比上面两个,这个选择要考虑的东西要麻烦得多,因为给学习器提供的训练经验对它的成败有重大的影响。
一个关键的选择准那么是训练经验必须要能对学习器的决策提供直接或间接的反应。
以下西洋跳棋为例子,
提供直接反应的训练样例,即各种棋盘状态和相应的正确走子。
提供间接反应的训练样例,很多过去对弈序列和最终结局。对于这种情况,存在着一个信用分配的问题,也就是考虑每一次走子对最终结果的奉献程度。这个问题很难解决,以后再来谈。(为什么?只要你下过棋,你就应该明白,就算一开始的走子是最正确的,后面下的很差一盘棋也会输掉,反之,一开始走得不是最正确的,但是也有可能反败为胜)
第二个重要的准那么是学习期多大程度上可以控制训练样例序列。
我的理解是获得训练样例的自动程度
还是以下西洋跳棋为例子,
1.训练样例全是“手工”获得的,即学习器需要的训练样例是人工选取的棋盘状态和该棋盘状态下的一次正确走子。
2.训练样例是“半自动”获得的,即学习器需要的训练样例是它本身自己选取的棋盘状态〔它对这些棋盘状态感到困惑〕,然后由人工指导它该如何正确走子。
3.训练样例是“全自动”获得的,学习器跟自己对弈来进行学习。这种情况下,又有两种情形:
(1)试验它还未考虑过的全新棋局;
(2)在它目前发现的最有效的路线的微小变化上对弈,来磨砺它的技能。
第三个重要的准那么是训练样例的分布能多好地表示实例分布,而最终系统的性能P是通过后者来衡量的。
一般而言,当训练样例的分布和将来的测试样例的分布相似时,学习具有最大的可信度。
比方,西洋跳棋学习中性能指标P是该系统在世界锦标赛上获胜的百分比。假设说世界锦标赛上的选手都是万里挑一的高手,如果你给的训练样例都是一些初学者下的棋局,那么可想而知,学习器最终会在世界锦标赛上败得很惨。
不幸的是,通常情况下学习的样例与最终学习系统被评估时使用的样例有一定的差异,比方世界级的西洋跳棋冠军可能不会有有兴趣和一个程序下棋。然而,目前许多机器学习理论都依赖于训练样例与测试样例分布一致这一假设,但在实践中这个假设经常是不成立的。
假设我们决定系统将通过和自己对弈来训练。这个好处是不需要人工干预,只要时间允许,可以让系统产生无限多的训练数据。
学习系统的具体设计步骤
上面我们确定了学习框架:
任务T:下西洋跳棋
性能标准P:比赛中击败对手的百分比
训练经验E:和自己进行对弈
现在,有三个具体的内容要确定:
(1)要学习的知识确实切类型
(2)对于这个目标知识的表示
(3)一种学习机制
选择目标函数
在机器学习中,要学习的知识确实切类型通常是一个函数,我们把它称为目标函数(TargetFunction)。
在学习西洋跳棋中,我们要给出一个函数,它对任何给定的器具能选出最好的走法,假设记这个函数为ChooseMove,那么它的形式如下:
ChooseMove:B-M
其中B是合法棋局集合中的某一棋盘状态,M是走子的方法。
这样,我们可以把提高任务T的性能P的问题简化为学习像ChooseMove这样某个特定的目标函数的问题。所以目标函数的选择是关键性的问题。
事实上,直接学习ChooseMove是非常困难的。所以一般情况下,我们把一个评估函数作为目标函数。令这个函数为V,并用
V:B-R
来表示把任何合法的棋局映射到某一个实数值(R表示实数集合)。我们让这个V给好的棋局赋予较高的评分。如果这个V被成功学习,那么系统就很容易找到当前棋局的最正确走法。方法是,
先产生每一个合法走子对应的所有后继棋局,然后用V来选取分值最高的后继棋局,从而选择最正确走子。
现在一个重要问题是,目标函数V的准确值是多少?
我们可以如下定义V(b):
(1)如果b是一最终的胜局,V(b)=100
(2)如果b是一最终的败局,V(b)=–100
(3)如果b是以
您可能关注的文档
最近下载
- 中国石油油气田地面建设标准化施工技术手册-第二册安全文明施工管理20160427.doc VIP
- 第三册工艺安装工程中国石油油气田地面建设标准化施工技术手册标准化施工手册.pdf VIP
- elrow电音主题派对招商方案【音乐节】【招商方案】.pdf VIP
- 老年护理便秘课件.pptx
- 食材配送运输方案.pdf VIP
- 信号与系统第2版奥本海姆课后习题答案详解.pdf
- 食材的装卸质量保障措施.docx VIP
- 2022年第六次全国幽门螺杆菌感染处理共识报告(非根除治疗部分)推荐要点(全文).pdf VIP
- 工程机械维修知识培训课件.pptx VIP
- 外墙悬挑脚手架搭设方案设计与实施指南.docx VIP
有哪些信誉好的足球投注网站
文档评论(0)