數学行为中的人工智能游戏.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
數学行为中的人工智能游戏

本科毕业设计(论文)外文翻译译文 学生姓名: 王淑晶 院 (系): 计算机学院 专业班级: 计0702 指导教师: 黄全舟 完成日期: 2011 年 3 月 15 日 数学行为中的人工智能游戏 Behavioral Mathematics for Game AI 作者:DAVE MARK 起止页码:—92页 出版日期:March 5, 2009 出版单位:Course Technology PTR 外文翻译译文: 理性与非理性行为 冯·诺依曼其中的一个问题,和其他人期望的对博弈论的应用,在这样做时人们有着合理的行为举止。并且总是试图选择最好的结果。我们可以在第5章中,从一些例子可以看出,这并非总是如此。通常,人们要么无法选择到最佳的选择,要么甚至不以任何理由来选择。结果导致地就是这样一个规范性决策理论和决策理论的描述有差别的原因。而这种有着一大截的差距在于非理性行为。 当然,试图找出那些行为是一个棘手的问题。而计算机只善于计算出理性行为的答案。一个非理性的想法但有合理的前瞻性的答案却完全是另一种伎俩。我们大多数人习惯于这样的概念,不合理的东西是需要避免的,甚至回避。然而,正如我们已经深入看到的那样,并且会继续探讨下去,非理性不仅仅是非常真实的,并且它是对行为的性质赋予了深度。 试图与非理性的行为走一起是一个重大的问题。无论如何,通常一个问题都只有一个正确的(即理性的)回答。但在非理性行为的解集中往往是很宽松的。这一切并不是说是否是“正确”的答案是需要看一切是不是很合理。但有些事情是完全错误的。 如果你记得在第1章,我。虽然我猪写照不够完美这piggishness” 的范围内是很好。它没有第五伸出其像。虽然不是十全十美,它是合理的猪。,,人们可以途径描绘出猪,但只有他们数目会属于可接受的范围内,观察员接受看猪当然,其中有些可能是归类为古怪的猪,但仍是合理的,,比如说,,鬣鳞蜥,或鸭嘴兽(虽然鸭嘴兽本身是混)糊涂思想。 最后,在规范决策理论和效用最大化的算法,我们提供应该做的答案我们需要研究的理性与理性的基础上再作补充,完全理性 由于是如此难以界定,它实际上是从理性更容易开始。代理商说,有完善的理性行为,如果他们总是以最好的方式,这样做即使他们必须进行广泛而难以计算。如果,,我们要降低到一个简单的游戏空间,我们可以利用游戏。正如我们在第1章指出,我们是否想要赢选择在游戏中的任何一点可用缩小到一的决定。如果我们想赢,有一个明显的选择。如果我们不想赢,有一个同样显而易见的选择。因此,我们在成功是完全基于我们是否想获胜。将始终发挥一个完全合理的正确的举措。如果我们选择甚至错误地发挥这些举措之一,我们将不再被认为是完全合理的。 完理性的其他例子可以应用到第5章游戏。,没有任何其他信息,选择以出卖他的囚徒困境的合作伙伴是展示完美的合理性。在最后游戏通牒最和独裁者完全理性的行事方式。正在切割,以减少预期暴露的贪婪(而且完全理性的)其他玩家是完全合理的。即使是扮演一个匹配几个便士混合策略,以防止他的对手通风报信模式是完全合理的。 海盗游戏 最后通牒博弈是指两个人以其“要么接受,要么拉倒” 的有趣的像鸡那样的冲突的游戏。正如我们上面提到的,它也是一个多么完美的合理性,但可能也会导致一个极端的例子。以优良的解决方案来说,在这种情况下,需要给其他人提供最低限度的支付的可能性变得更加有趣。它可以推广到许多人,而海盗游戏确实就是这样的。 在海盗游戏中,我们将有一个合理的海盗号(在本例中,我们将使用五)。尽管我所希望的是要拿出真的很酷的海盗名字。我们将制定它们为A,B,C,D和E。字母绰号是可以真正帮助我们进行下一个问题,即海盗有严格的资历顺序:A优于B,谁又优于C,谁又优于D,而谁又优于E。 作为一个群体,5个海盗找到100金币,正试图决定如何分发。在海盗的世界分布的规则如下。1、是完全合理的。 2、要生存下去。 3、要最大限度地利用他所接受的金币数量。 4、除非所有其他的结果宁愿选择抛出另一个极端,否则一律平等。 乍看之下,这似乎是在说海盗A,寡不敌众于其他的同级人。可能要尽量减少自己的分配,以避免被开除了。毕竟,如果其他四个海盗认为他是接受过多,他们会下降从中的受益。否决他的建议,并在甲板上送他下来。在这一点上,总是只会分给他们四个人,而不是五个。然而,这不是解决办法,并且能够惊奇地发现不同于他的最佳方法。 完全理性的决定的申明 如果我们的工作落后,纯策略的解决方案变得更加明显。如果要做到这一点,让我们假设,我们不知道怎么设法使最后两个海盗D

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档