第四章(重复博弈).pptVIP

下载本文档

55
0
约1.57万字
约 65页
2018-06-13 发布于浙江
举报
版权申诉

第四章(重复博弈).ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四章重复博弈重复博弈引论；有限次重复博弈；无限次重复博弈。第一节重复博弈引论 2、无限次重复某个重复博弈没有可以预见的结束时间，各博弈方主观上认为博弈会不断进行下去，那么就可以看作是无限次重复博弈。 3、随机结束博弈重复博弈的次数虽然是有限的，但重复的次数或博弈结束的时间却是不确定的。这种重复博弈可以称为“随机结束的重复博弈”。二、重复博弈的策略、子博弈和均衡路径重复博弈中博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行为的完整计划。重复博弈的子博弈就是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。重复博弈也是动态博弈，也有路径概念。但重复博弈的所有博弈方在每个阶段都必须行为，因此重复博弈的路径是由每个阶段各博弈方的行为组合串联而成的。如果原博弈有m种策略组合，那么重复两次就有条博弈路径，重复T次就有条博弈路径；当T或m较大时，重复博弈的路径数是很大的。三、重复博弈的得益与博弈方的行为选择 1、要从整体上把握博弈的得益重复博弈的得益与一次性博弈有所不同，因为它们的每个阶段本身就是一个博弈，各个博弈方都有得益，而不是整个博弈结束后有一个总的得益，如果博弈方是根据当前阶段得益选择，那么等于把重复博弈割裂成了一个个基本博弈，重复博弈就失去了意义。因此重复博弈中，博弈方的行为、策略选择不能只考虑本阶段的得益，必须兼顾其他阶段的得益，或者说要考虑整个重复博弈过程得益的总体情况。 2、各阶段的时间间隔对博弈方行为的影响重复博弈每个阶段的得益有时间上的先后之分，这在只有少数几次重复且每次重复间隔时间并不很长的情况下可能并不重要。但对于重复次数很多且每次重复间隔时间又较长的有限次重复博弈，或者是无限次重复博弈时，得益的时间先后就不能不考虑。因为由于心理作用和资金有时间价值的原因，不同时间获得的单位利益对人们的价值是有差别的，忽略这一点就不可能得出符合实际的分析结论。那么如何处理未来得益对当前决策的影响呢？解决这个问题的方法是引进将后一阶段得益折算成当前阶段得益的贴现系数。有了贴现系数　，如果一个T 次重复博弈的某博弈方某一均衡下各阶段得益分别为　　　　，则考虑时间价值的重复博弈总得益现在值为: 四、随机停止和贴现率可理解为通过抽签来决定是否停止重复，设抽到停止的概率是　，重复下去的概率为　　。设某博弈方的阶段得益为　，利率为　，因为在第一次博弈以后能继续下一次重复的可能性是　，第二阶段的期望得益为　　　，进一步第三阶段的期望得益为　　　　，……，所以该博弈方在该重复博弈中期望得益的现在值为：第二节有限次重复博弈（一）有限次重复囚徒的困境博弈（二）一般结论原博弈有惟一的纯策略纳什均衡的博弈，则有限次重复博弈的惟一均衡即各博弈方在每阶段（即每次重复）中都采用原博弈的纳什均衡策略。定理设原博弈G有惟一的纯策略纳什均衡，则对任意正整数T，重复博弈G（T）有惟一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G（T）中的总得益为在G中得益的T倍，平均得益等于原博弈G中的得益。（三）有限次重复削价竞争博弈（四）重复囚徒困境悖论和连锁店悖论在重复囚徒困境博弈的大量实验研究中，重复次数较大时的实验结果通常会与上述结论不同，包含合作的情况非常普遍。其实，有限次重复囚徒困境类博弈问题与蜈蚣博弈很相似，问题都在于在较多阶段的动态博弈中逆推归纳法的适用性受到了怀疑。合作是可能的吗？在什么条件下才能从没有集权的利己主义者中产生合作？这个问题已经困扰人们很长时间。三、多个纯策略纳什均衡博弈的有限次重复博弈（一）三价博弈的重复博弈　　设一市场有两个生产同质产品的厂商，他们的策略及对应得益如图4．4所示。该博弈有两个纯策略纳什均衡（M，M）和（L，L）。而策略组合（H，H）并不是纳什均衡，一次性博弈不可能出现这个效率最高的策略组合。那么，两次重复这个博弈情况会如何呢？证明：首先，第二阶段的策略组合（M,M）是一个原博弈的纳什均衡，因此不会有哪一方会愿意单独偏离；其次，第一阶段的（H，H）虽然不是原博弈的纳什均衡，一方单独偏离该策略而采用M能增加1单位得益，但这样做的后果是在第二阶段对方会采用有“报复机制”的L策略，从而使偏离一方至少损失2单位的得益，因此偏离（H，H）是得不偿失的，合理的选择是坚持