博弈均衡模型和其举例.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈均衡模型和其举例

博弈联均衡模型 博弈论模型图示 博弈可划分为合作博弈和非合作博弈, 这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 人们一般讲到的都是指非合作博弈,它有四种不同类型的博弈,即完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈,与上述相对应的是纳什均衡、子博弈精炼纳什均衡、贝叶斯纳什均衡、精炼贝叶斯纳什均衡。这四种均衡中最为基本的是纳什均衡。 这两者的区别主要在于人们的行为相互作用时,当事人能否达成一个有约束力的协议:如能达成就是合作博弈;反之就是非合作博弈。合作博弈强调团体理性,强调效率和公平,非合作博弈强调理性个人的最优决策,其结果是否有效率则是不确定的。 所谓纳什均衡,指的是所有参与人最优选择的一种组合,在这种组合下,给定其他人的选择,没有任何人有积极性做出新的选择。纳什均衡的哲学思想是:给定别人遵守协议的情况下,没有人有积极性偏离协议规定的自己的行为规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。当博弈中的所有参与人事先达成一项协议,给出每个人的行为规则。在没有外在强制力约束时,当事人是否会自觉地遵守这个协议?或者说这个协议是否可以自动实施?如果当事人会自觉遵守这个协议,等于说这个协议构成一个纳什均衡。参见张维迎:“经济学家看法律、文化与历史”,载张维迎《产权、政府与信誉》,三联书店2001年版。 完全信息静态博弈——纳什均衡、 完全信息动态博弈——子博弈精炼纳什均衡 不完全信息静态博弈——贝叶斯纳什均衡、、 不完全信息动态博弈——精炼贝叶斯纳什均衡, 与上述相对应的是、、、。这四种均衡中最为基本的是纳什均衡。 完全信息静态博弈(纳什均衡) 债务人 强硬 妥协 债 权 人 强硬 -200 -100 100 0 妥协 0 100 90 10 债务人 债 权 人 妥协 强硬 妥协 90 10 0 100 强硬 100 0 -200 -100 囚徒困境 □ 文/柯华庆 “囚徒困境”最早是由美国普林斯顿大学数学家曾克1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论。这个故事后来成为博弈论最经典的案例。故事的内容如下: 两个犯罪嫌疑人被捕并受到指控,但除非至少其中至少有一个人供认犯罪,警方缺乏足够的证据指证他们所犯的罪行,从而将他们按罪判刑。为了得到所需的口供,警察将这两名罪犯关押在不同牢房以防止他们串供或结成攻守联盟,并给他们同样的选择机会:如果他们两人都拒不认罪,则根据已经掌握的证据他们会被判以 1 年徒刑;如果双方都坦白招认,都将被判入狱 5 年(比事实上的罪行要轻);如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放(信息费用),而另一人则重判 8 年徒刑。支付(得益)矩阵如下: 囚徒甲 囚徒乙 沉默 坦白 沉默 -1 -1 -8 0 坦白 0 -8 -5 -5 第一,“囚徒困境”时有广义和狭义之分。狭义的“囚徒困境”是特指囚徒的困境。广义的“囚徒困境”是指个人追求收益最大化的策略由于策略的相互依赖性最后得到的结果违背了自身的利益。在市场竞争的各个领域、在资源利用和环境保护,以及政治、军事上大量存在“囚徒困境”。例如两个寡头的降价(反垄断法),“沉默现象”(两个乘客在遇到一个歹徒抢劫财物)、当事人向法官行贿。广义的“囚徒困境”的决策特点:其中任何一人在选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否相同,我们可以把他们的决策看作是同时作出的;每一方都知道对方的得益情况;这两个决定了是完全信息静态博弈。另外,两个博弈方同有两种相同的可选策略,策略和得益都对称的博弈。 合作 背叛 合作 B ? B D ? A 背叛 A ? D C ? ??????????????????? C 一般性囚徒困境代数图(其中,ABC且2 BA+D ) 第二,根据个体理性行为准则和完全理性行为准则,两个博弈方的目标都想要实现也有能力判断自身的最大利益。实际上对双方来说最佳结果是(-

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档