3-博弈论.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3-博弈论

第三章 博弈论简介 一、博弈论的产生与发展 二、博弈论及基本要素 三、博弈的分类 四、完全信息静态博弈 五、完全信息动态博弈 六、不完全信息静态博弈 七、不完全信息动态博弈 一、博弈论的产生与发展 通常,人们将数学家冯? 诺依曼(von Neumann)于1928年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。 1944年,数学家冯? 诺依曼(von Neumann)和经济学家摩根斯坦(Morgenstern)合作发表了《博弈论和经济行为》一书,被认为是应用博弈论进行经济分析的开始。 20世纪50-60年代,博弈论确立了发展的基础。1950-1951年,Nash发表了两篇关于非合作博弈的重要论文。1950年,Tucker定义了“囚犯难题”(prisoners’ dilemma)。Nash和Tucker的工作基本奠定了现代博弈论的基础。 20世纪60年代,泽尔腾( Selten )将纳什均衡的概念引入了动态分析。1967-1968年,海萨尼(Harsanyi)发表了《具有不完全信息的由Bayesian局中人所进行的博弈》。此后,他们两人长期合作,发展了非合作博弈理论。 2005年诺贝尔经济学奖获得者: 以色列希伯莱大学的罗伯特.奥曼和美国马里兰大学的托马斯.谢林,因为他们“通过博弈论分析,促进了人们对冲突和合作的理解”。 谢林从经济学的角度,指出许多人们所熟知的社会交互作用可以从非合作博弈的角度来加以理解;奥曼从数学的角度也发现一些长期的社会交互作用可以利用正式的非合作博弈理论来进行深入分析。 二、博弈论及基本要素 1、参与人 (players) 参与人(players):独立决策、独立承担博弈结果的个人或组织。每个局中人的目标都是通过选择行动来使自己的效用最大化。 虚拟参与人(pseudo-players):指以一种纯机械的方式来采取行动的个体。“自然”是一种虚拟局中人,它在博弈的特定时点上以特定的概率随机选择行动。 2、行动 (action) 参与人在博弈的某个时点的决策变量。 N个参与人的行动的有序集称为行动组合。如,(坦白,抵赖)。 参与人的行动可能是离散的,也可能是连续的;而且参与人的行动往往是有顺序的,行动顺序对博弈结果很重要,有关静态博弈和动态博弈的区分就是基于行动顺序做出的。同样的参与人,同样的行动组合,由于行动顺序不同,会导致每个参与人的最优选择不同,从而得到不同的博弈结果。 3、信息 (information) 参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识。 完全信息(complete information):指参与人完全了解其他参与人的收益或收益函数。通俗地说,参与人完全了解其他参与人的特征、战略空间及支付函数。 不完全信息(incomplete information):指至少有一个参与人不完全了解其他参与人的收益或收益函数。 完美信息(perfect information):指一个参与人对其他参与人的行动选择有准确的了解。 不完美信息(Imperfect information):指博弈中至少有一个参与人不了解其他参与人的行动选择。 4、战略(strategies) 参与人在给定信息集的情况下的行动规则,是参与人完整的一套行动计划,它规定参与人在什么时候选择什么行动。 战略与行动是两个不同的概念,战略是行动的规则而不是行动本身。战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择。 在静态博弈中,战略和行动是相同的。 5、收益或支付(pay off) 参与人从各种策略组合中获得的收益。收益往往采用效用(utility)概念。 它或者是一个特定策略组合下某个参与人得到的确定效用水平,或者是期望效用水平。 博弈的一个基本特征就是,参与人的收益不仅取决于自己的战略选择,而且也取决于所有其他人的战略选择。因此,一个参与人的收益是所有参与人战略组合的函数,也称收益函数(payoff function)。 6、均衡(equilibrium) 指所有参与人的最优战略组合或行动组合。一个博弈可能出现多个均衡,或者没有均衡。 在博弈论中,均衡策略组合,均衡行动组合,均衡收益组合都可以叫做结果。如,在囚犯困境中,(坦白,坦白)和(U1,U2)=(-5,-5)就是博弈的结果, (坦白,坦白)是一种均衡策略组合(或者是均衡行动组合), (U1,U2)=(-

文档评论(0)

skvdnd51 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档