28中级微观经济学的笔记、博弈论.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CH28 博弈论 博弈的收益矩阵:用各方的收益来表示。影响的也是博弈的收益方面。 一、占优策略均衡、纳什均衡: 1、占优策略均衡:不管对手选择哪个策略,你都选择最有利的策略,唯一的最优策略。即“以不变应万变”。 如果,每个选手选择的都是占优策略,那么,此时的均衡,叫占优策略均衡。 在现实中,不总是这样。 2、纳什均衡:根据对方的选择,你的选择作相应调整;均衡时,双方都不会再改变。 A的最优选择,取决于对B的选择的预期;A的选择,对于B的最优选择是最优的。 古诺均衡,是在产量博弈中,纳什均衡的别名。 题:如果对手选择的不是他的纳什均衡策略,那么,你还继续选择你的纳什均衡策略吗? 答:一般不会继续选择纳什均衡策略。原因如下: 对手采取纳什均衡策略时,你也应采取纳什策略。 纳什均衡要求双方的决策是相互依赖的。如果两选手都是理性的,纳什均衡结果就是“势均力敌的”= 给定对方的最优选择,你的选择也是最优的。 如果对方选择的不是纳什均衡策略,那么,你会有更好的选择,也就是说你不会继续选择纳什均衡策略。 3、占优策略均衡、纳什均衡的关系: 占优策略均衡,一定是纳什均衡;纳什均衡,不总是占优策略均衡。 占优策略均衡:对于B的所有选择,A 的选择是最优的。 纳什均衡:对于B的最优选择,A 的选择是最优的。 K:纳什均衡未必是占优策略均衡,比如:在“剪刀石头布”游戏中,不存在占优策略均衡,但存在纳什(混合策略)均衡。 K:那么,什么样的纳什均衡,一定是占优策略均衡?一个博弈,如果只有唯一的纳什“纯策略”均衡解,在此情形下,纳什均衡一定是占优策略均衡。 4、K:纳什均衡的缺点: (1)最近证明:即使纳什均衡点存在,但找到它是几乎不可能的事。 (2)一个博弈,可能不存在纳什均衡;可能存在多个的纳什均衡。 (3)纳什均衡,不总是帕累托有效率的。 二、博弈的策略 1、纯策略:只选择一种策略,并坚持这个策略,不再变化,“一劳永逸”。 2、混合策略:给每个选择一个概率,然后,按概率分布,选择纯策略。 例如,A以概率 50%选择上、50%选择下;B以概率 50%选择左、 50%右。这种情形下,每个选手的策略都为一个混合策略。 如果 A、B 都用混合策略,那么,收益矩阵每个小方格中的收益,出现的概率=1/4。因此,A的平均收益= 0,B的平均收益= 1/2。 混合策略中的纳什均衡:均衡时,当对手策略的概率一定时,每个选手选择的含有概率的策略都是最优的。混合策略的纳什均衡解,总是存在的。 3、以牙还牙(tit for tat)——最可靠的基本策略。 以牙还牙策略运行方式:第一轮,你合作。在以后的每一轮,如果,对方在前一轮合作,你也合作。如果,对方在上一轮背叛,你也背叛。即,每人的策略,是选择对方在上一轮的策略。 以牙还牙策略,收益最高,因为它对背叛立即惩罚;同时,也是一种宽恕的策略:发现一次背叛,只惩罚一次。如果,对方改邪归正,开始合作,那么,以牙还牙策略将以合作回报对方。在无限次囚犯困境的博弈中,以牙还牙策略,似乎是实现有效率结果的一种非常好的机制。 题:重复的囚犯两难博弈,选手的策略是“以牙还牙”。某选手的本意是合作,却不慎犯错——他背叛了。在接下来的博弈中,两选手仍以牙还牙,结果将如何? 答:如果,选手A 不慎背叛,即使不是出自其本意,但,B 无法了解这些信息,会认为A的行为是真正的背叛。按照以牙还牙,B在第二轮中,选择A在上一轮中的策略——背叛。A 和B不断地以背叛策略作为对对方背叛的反应。 如果,选手不慎犯错,他应及时沟通,否则,会一直背叛到底,这样的结果显然不是帕累托有效率的,在这种情形下,以牙还牙不再是一个好策略。 4、K:串谋 条件:(1)行业中只有很少几个厂商,相互之间非常了解;   (2)有一个主导厂商;生产的产品相似,   (3)容易在价格上达成一致;   (4)有相似的生产方法和平均成本,→ 他们愿意在相同的时间以相同的比例改变价格;   (5)在生产成本、生产技术上,彼此没有秘密;   (6)存在有效的进入障碍;   (7)市场是稳定的;   (8)政府没有控制厂商之间的串谋。 分类:公开的串谋:卡特尔 隐蔽的串谋:价格领导 三、囚徒困境 1、囚徒困境:均衡时,都选择背叛,总体利益却比合作低——“困境”。若囚徒不合作,则无法脱离困境。 囚徒困境:—— \o 非零和博弈 非零和博弈,是个人最佳选择,而非团体最佳选择。 纳什均衡,不是帕累托最优。 2、重复的囚徒困境:有限次的重复,与一次的结果一样,最佳策略→背叛; 无限次的重复,均衡才有可能是合作, \o 纳什均衡点 纳什均衡→ \o 帕累托最优 帕累托最优。 表中的数字是服刑期限的负数。 A:坦白要比抵赖好; B:坦白要比抵赖好; (

文档评论(0)

liushuhua007 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7054124121000035

1亿VIP精品文档

相关文档