基于UCT的围棋引擎的研究与实现.docVIP

下载本文档

54
0
约2.75万字
约 49页
2017-09-26 发布于广西
举报
版权申诉

基于UCT的围棋引擎的研究与实现.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于UCT的围棋引擎的研究与实现.doc

摘要棋类博弈是人工智能的重要研究主题之一。而在围棋方面，由于围棋的有哪些信誉好的足球投注网站空间太大、计算机难于处理模糊概念且难于设计学习算法，目前最优秀的围棋程序的水平还处于业余低段水平。计算机围棋被认为是在继国际象棋之后人工智能领域中最困难的新挑战之一。围棋是检验人工智能发展水平的良好环境，如何提高围棋程序的棋力是人工智能领域的一大难题。所以计算机围棋研究具有重要的理论意义和实用价值。介绍了Monte Carlo方法和UCT算法的理论。阐明了基于UCT算法的围棋引擎的设计，围棋引擎、具体设计。探讨了基于UCT算法的围棋引擎的实现，在分析引擎核心模块UCT算法实现的基础上，详细说明了候选步的产生及管理机制，节点的UCT选择，展开节点和棋局模拟，分析指出不同的因素和策略对计算机围棋的影响，其中棋局模拟的着手库模式匹配和其它围棋知识对加强程序棋力有至关重要的作用。基于上述内容，实现了一个基于UCT算法的围棋引擎Tao Go，支持GMP、GTP围棋协议，SGF文件调试输出和统计UCT模拟棋局的数据目前关键词：人工智能计算机围棋 UCT算法模式匹配 1 绪论 1 1.1 研究背景及意义 1 1.2 研究状况 1 1.3 关键技术 2 1.3.1 Monte Carlo方法 2 1.3.2 UCT算法 2 2 基于UCT的围棋引擎的概述 5 2.1 围棋引擎的总体概述 5 2.2 围棋引擎的总体功能模块 5 2.3 交替下子流程模块 7 2.4 棋步产生(UCT)模块 8 2.5 棋步合法性判断模块 9 2.6 算气模块 9 2.7 更新棋盘(提子)模块 10 2.8 胜负计算模块 10 3 基于UCT的围棋引擎的设计 11 3.1 围棋引擎总体流程设计 11 3.2 UCT算法具体流程设计 12 3.3 棋步合法性判断模块设计 14 3.4 算气模块设计 16 3.5 更新棋盘(提子)模块设计 17 3.6 胜负计算模块设计 18 4 基于UCT的围棋引擎的实现 20 4.1 软硬件开发环境 20 4.2 围棋引擎的数据结构 20 4.2.1 棋局数据 20 4.2.2 UCT Tree数据 21 4.3 围棋引擎的UCT算法实现 21 4.3.1 UCT算法的核心实现 21 4.3.2 候选步的产生方式及管理机制 23 4.3.3 选择节点(UCT选择) 25 4.3.4 展开节点 27 4.3.5 棋局模拟 29 4.4 围棋引擎运行效果 36 4.4.1 围棋协议对弈测试 36 4.4.2 调试模式的SGF文件 37 4.4.3 UCT模拟棋局数据统计 38 5 工作总结及未来展望 39 5.1 工作总结 39 5.2 未来展望 39 致谢 40 参考文献 41 英文摘要 43 博弈是人工智能的重要研究主题，人工智能的发展在很大程度上得益于博弈研究的发展。1997年著名的深蓝战胜国际象棋世界冠军卡斯帕罗夫成为轰动一时的新闻事件[l]。可以说，作为博弈研究的主要内容之一，棋类博弈得到了满意的解决，唯一的例外的是围棋，目前最优秀的围棋程序还处于业余低段水平。围棋是博弈的一种，属双人零和博弈[2]。它起源于3000多年前的中国，充分体现了东方人的智慧，盛行于中日韩，逐渐在欧美流行。它比国际象棋复杂得多，正因为此，很多人工智能学家、心理学家和数学家也投入到了计算机围棋研究领域。计算机围棋这个名称来自于Computer Go的直译，略显生硬。简单地说，计算机围棋就是结合人工智能技术教计算机下围棋，以达到与人类棋手相抗衡的目的。由于围棋的有哪些信誉好的足球投注网站空间太大、计算机难于处理模糊概念且难于设计学习算法，造成了计算机围棋程序的棋力难提高。围棋是检验人工智能发展水平的良好环境，如何提高围棋程序的棋力是人工智能领域的一大难题。同时，开发出与人类棋手水平相当的围棋程序也有助于对人类认知能力的理解。所以计算机围棋研究具有重要的理论意义和实用价值。计算机围棋自Zobrist在1970年设计出第一个可与人对弈的程序以来[]，至今已有约四十年的历史。由于围棋本身的特质，使得计算机围棋在继西洋棋、象棋之后，成为人工智能中一个相当引人注目的新挑战。然而计算机围棋的难点之一，便在于缺乏良好的局面评估函数[]，使其不能国际象棋一样，运用设计良好的局面评估函数、搜寻树以及优秀的剪枝法，即可获得不错的棋力；计算机围棋大多借鉴一些经验法则，以静态的评估为主，而动态的搜寻则仅用于局部的、目标明确的棋串攻杀，较少的全局搜寻。因此，人类的经验如何应运用于计算机围棋，就成了设计的重点。自2003年起，Bouzy试图打破这种情况[]。他运用蒙特卡罗(Monte Carlo)方法作为评估函数，并且试图运用这一评估函数，作全局性的有哪些信誉好的足球投注网站，然而在棋力上始终没有大的突破。直到