人工智能入门课件第4章 博弈与有哪些信誉好的足球投注网站.pptVIP

人工智能入门课件第4章 博弈与有哪些信誉好的足球投注网站.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
作者 朱福喜 朱三元 α-β过程的剪枝规则 (1)α剪枝:若任一极小值层节点的β值小于或等于它任一先辈极大值层节点的α值,即α(先辈层)≥β(后继层),则可中止该极小值层中这个节点以下的有哪些信誉好的足球投注网站。该节点最终的倒推值就确定为这个β值。 (2)β剪枝:若任一极大值层节点的α值大于或等于它任一先辈极小值层节点的β值,即α(后继层)≥β(先辈层),则可以中止该极大值层中这个节点以下的有哪些信誉好的足球投注网站。这个MAX节点的最终倒推值就确定为这个α值。 演示 作者 朱福喜 朱三元 4.4 AlphaGo有哪些信誉好的足球投注网站策略 为什么20年前AI就已经打败国际象棋的人类世界冠军,而直到现在围棋AI才取得成功呢? 其一,围棋棋盘是19?19,因此每一步可以选的合法走法远远大于象棋(围棋的分支因数Branching Factor是250,象棋只有35),也就是说围棋有哪些信誉好的足球投注网站空间相对于国际象棋来说大得多。 其二,围棋的估值函数很难设计。象棋尚能用简单的统计棋子个数和子力来推断,围棋棋局千变万化,可能看似风平浪静其实暗藏杀机。 这两个主要原因导致了围棋AI长久以来一直很难有大的进展。 4.4.1 围棋博弈程序的发展 直到2006年前后,发现了一种新的捜索策略,叫蒙特卡罗树有哪些信誉好的足球投注网站(MCTS,Monte Carlo Tree Search),它是一种最佳优先有哪些信誉好的足球投注网站(Best- first search)算法,更适合于分支因子很大的博弈树有哪些信誉好的足球投注网站。前面提到,状态空间有哪些信誉好的足球投注网站都要有评估函数指导有哪些信誉好的足球投注网站。蒙特卡罗树有哪些信誉好的足球投注网站作为一种有哪些信誉好的足球投注网站策略,它的评估函数要可以达到判断盘终胜负这个最低要求,这恰好弥补了围棋程序在评估函数上的缺陷。 蒙特卡罗树有哪些信誉好的足球投注网站策略加围棋专业知识的组合,经过近10年的发展,仍然无法挑战职业棋手,直到AlphaGo横空出世。AlphaGo完整继承了深蓝时代沿袭下来的“暴力有哪些信誉好的足球投注网站” 算法框架,在状态空间有哪些信誉好的足球投注网站中使用的信息汇总策略也与传统蒙特卡罗树有哪些信誉好的足球投注网站完全一样,而且在其选择策略中也同样使用大量手工编写的人门级围棋专业知识。 “一鸣惊人”的AlphaGo,其实是从一个基本具备一流开源围棋软件水平的传统蒙特卡罗树有哪些信誉好的足球投注网站程序改造升级而来。 4.4.1 围棋博弈程序的发展 4.4.1 围棋博弈程序的发展 图4.8 围棋博弈程序的分类 4.4.2 AlphaGo博弈树有哪些信誉好的足球投注网站算法的改进 MCTS算法大致思想可类比MinMax算法:对于给定的当前根节点(某一棋局),通过计算机模拟推演以当前根节点出发的各种可能的走法,配合高效的“剪枝”算法来控制有哪些信誉好的足球投注网站空间大小,并用演算到最后一步的结果来反过来影响当前节点下一步棋的选择。 针对围棋相对于传统棋类AI的设计难点: 1)可能的走法太多(即Branching Factor较大)导致有哪些信誉好的足球投注网站空间非常大 ; 2)没有一个好的估值函数对进行中的围棋棋局计算一个静态得分。 4.4.2 AlphaGo博弈树有哪些信誉好的足球投注网站算法的改进 MCTS提出解决方案:有哪些信誉好的足球投注网站空间更大,采取比Alpha-beta剪枝更激进的剪枝策略,只把有限的计算资源留给最最有希望的走法(即后面要讨论的选择(Selection)、扩展(Expansion)步骤要做的事情);对于中间棋局好坏很难估计,那就干脆模拟到最后分出胜负为止(即后面要讨论的模拟Simulation)。 4.4.2 AlphaGo博弈树有哪些信誉好的足球投注网站算法的改进 MCTS算法的基本思想和特点是: 将可能出现的状态转移过程用状态树表示; 从初始状态开始重复抽样,逐步扩展树中的节点; 在某个状态再次被访问时,可以利用已有的结果,提高效率; 在抽样过程中可以随时得到行为的评价。 4.4.3 MCTS算法的四个基本步骤 MCTS算法是一个多轮迭代算法,每一轮迭代都会以此经历四个阶段:选择(Selection),扩展(Expansion),模拟(Simulation)和回溯(Back Propagation)。 图4.9 MCTS某一时刻有哪些信誉好的足球投注网站空间的情形 4.4.3 MCTS算法的四个基本步骤 1) 选择(Selection):从根节点出发,自上而下地选择一个“最最需要展开”的子节点,比如图4.9中选择(Selection)步骤当中,沿着粗线一路走到底的最下方的叶子节点。这个节点被选中,意味着当前状态下,系统认为沿着这个节点的这条路径,最有可能取胜。 2) 扩展(Expansion):对于上面被选中的节点,从它的子节点中挑选出一个最有希望的子节点,将它的子节点加入到博弈树的结构中,扩展的策略主要是逐次扩展的策略,该策略并非一次性将全部的字节点添加到树结构之中,而是设置一个窗口值,随这遍历次数的增加,逐次添加子节点到对应博弈树节点之下。 4.4.3 MCTS算法的四个基本步骤 3) 模拟(Simulation

文档评论(0)

酱酱 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档