博弈论中的几个经典问题.pdfVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

几个博弈论中的经典问题

博弈论(GameTheory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博

弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、

政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间

的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学

科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使

用博弈理论来理解和预测进化论的某些结果。

几个重要的概念

1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案,

即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个

可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一

个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博

弈”。

2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时

的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策

略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组

策略的函数,通常称为支付(payoff)函数。

3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策

选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。

在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买

到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。

5、纳什均衡(NashEquilibrium):在一策略组合中,所有的参与者面临这样一种情况,

当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略

他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略

的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡

偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优

策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A

的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

经典的博弈问题

1、“囚徒困境”

“囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警

察抓住察抓住,,隔离审讯;警隔离审讯;警方的政策是方的政策是坦白从宽坦白从宽,,抗拒从严抗拒从严,如果两人都坦白则各判8年;如

果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足

各判1年。

在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白

和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、

A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。

这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;

假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。

即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是

抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)

这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离

这个组合,因此这个组合是纳什均衡。

囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显

然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个攻守同

盟盟,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。

2、海盗分金币问题

在一座座荒岛上,有5个强盗掘出了100块非常珍贵的金币。他们商定了一个分配金币

的规则:首先抽签决定每个人的次序,排列成强盗一至五。然后由强盗一先提出分配方案,

经5人表决,如多数人同意,方案就被通过,否

文档评论(0)

175****1116 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档