- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人机打牌游戏.ppt
* * 博弈论 (机器打牌) 主讲:廖枝平 2009程序设计竞赛培训 目录 2 牌类游戏树有哪些信誉好的足球投注网站算法 1 牌类游戏概述 3 发牌策略 4 牌类致胜策略 牌类游戏概述 多人非零和不完全信息游戏 人工智能的发展促进了棋牌类游戏计算机程序的飞速进步。目前的棋类计算机程序已经达到了专家的水平,完全可以战胜人类棋手。同样作为人工智能的研究热门方向,牌类游戏的进展比较缓慢。 这主要是因为牌类游戏基本上都是多人游戏,并且牌手相互问的信息具有隐蔽性。牌类游戏属于不完令信息决策问题,相关的研究没有棋类这种完全信息游戏的深入和成熟。另外,多人参加游戏使得打牌决策的有哪些信誉好的足球投注网站空间不断膨胀,甚至达到了无法表示的地步。 信息不完整和信息不对称,使得对棋类问题有效的深度优先有哪些信誉好的足球投注网站策略在牌类问题上优势不明显;同时,也使得牌类游戏在求解时增加了概率推断、风险评估等运算。 计算机桥牌已经成为世界性的研究课题。 尽管关于桥牌的研究工作不断的进行着,但现有桥牌软件的能力有限,只能达到一般桥牌选手的水平。 目前的桥牌软件都是国外研制和开发的,在国内基本没有关于计算机桥牌的研究。 2 牌类游戏树有哪些信誉好的足球投注网站算法 Maxn算法 Expectiminimax算法 Monte Carlo采样 IMP-minimax算法 多人游戏、包含机会的游戏和信息不完全这三种类型的游戏都需要对游戏树的结构作一些改变,有哪些信誉好的足球投注网站算法是对Minimax算法的直接扩展。 Maxn算法 在多人游戏中,每位玩家都是选取所有孩子节点中使自身分量值最大的那一个。 需要指出的是,这些有哪些信誉好的足球投注网站算法在实际游戏问题中由于受到问题本质的局限,现阶段还没有取得类似于alpha-beta算法在两人零和完全信息游戏中取得的成功,值得进一步研究的地方有很多。 牌类游戏树有哪些信誉好的足球投注网站算法 Expectiminimax算法 机会游戏中包含按一定概率发生的随机事件,这些随机事件往往发生在游戏的特定时刻,例如发牌的时候和掷色子的时候,可以在游戏树中包含几率节点代表随机事件的产生。 与极大、极小值节点不同,几率节点的每一个孩子节点是一个随机发生的事件,它的值是子节点的值按出现概率的一个平均,即期望。 这种综合了极大极小值(Minimax)规则和期望(Expect)的几率游戏的有哪些信誉好的足球投注网站算法被称作: Expectiminimax算法。 IMP-minimax算法 包含有隐藏信息的游戏被称作不完全信息游戏。 大多数不完全信息游戏在游戏开始的时候由随机事件产生游戏的初始状态,这个初始状态的一部分对玩家是隐蔽的,例如纸牌游戏中的发牌,每位玩家只可见自己手中的牌。 这个过程在游戏树中可以用根节点处的几率节点表示。这种游戏树即使很小,找到最优策略也可能是不可行的,例如当隐藏信息非常多时。因此,我们需要一些启发算法来寻找近似算法。 Monte Carlo采样是最常用的启发算法。 Monte Carlo采样 它挑选可能游戏状态的样本,将某一行动在每个样本下的结果进行平均得到该行动的值。 当游戏中隐藏信息较多时,可能的世界会有很多种,Monte Carlo采样可有效地控制总的有哪些信誉好的足球投注网站量。 当样本数量越大时节点值的计算过程考虑得越周全(考虑了游戏中更多的可能情况对节点值的影响),通常得到的策略也更合理。 但这也会带来一种被称作策略模糊的问题,一个好的策略可能会被其他世界中的坏策略掩盖住因而得不到发现。 3 发牌策略 3.1 直接随机分发 3.2 先随机均匀洗牌,再分发 3.1 直接随机分发 (1) 定义 整型发牌数组 a[52], 进行如下赋值: a[0]=0,a[1]=1,…,a[51]=51。设数组a的长度为length。 (2) 产生一个0~length-1之间的随机数i,把a[i]发给玩家,并把a[i]删除。 (3) 检测数组a的长度length的值,当length为0时,把a[0]发给玩家,并结束发牌,否则继续进行第(2)步。 3.2 先随机均匀洗牌,再分发 int a[52];//设一副牌共有52张 for(int i=0;i52;i++) a[i]=i;//牌面值为0~51 int t, x; for(i=0;i52;i++)//均匀洗牌 { t=random(52); x=a[i]; a[i]=a[t];a[t]=x; } 最后,只需用for循环依次把数组a[52]中的元素发给玩家。 洗牌程序 4 牌类致胜策略 4.2 桥牌策略 4.3 拱猪策略 4.1 仿真的方法 4.4 一个“牌类决策子系统”的功能设计 假定一种未知信息的可能情形(叫做原问题的一个采样),将不完全信息有哪些信誉好的足球投注网站转化为完全信息有哪些信誉好的足球投注网站。 对这种情形进行有哪些信誉好的足球投注网站得到该样本下的结果。重复该过程,直到得到给定数量的样本下的结果。 将这些
文档评论(0)