《09博弈》-课件.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中南财经政法大学信息学院 第二节 有限次重复博弈 (一)有限次重复囚徒的困境博弈 (二)一般结论 原博弈有惟一的纯策略纳什均衡的博弈,则有限次重复博弈的惟一均衡即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。 定理 设原博弈G有惟一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。 (三)有限次重复削价竞争博弈 (四)重复囚徒困境悖论和连锁店悖论 在重复囚徒的困境博弈的大量实验研究中,重复次数较大时的实验结果通常也与上述理论结论不同,包含合作的情况非常普遍。 其实,有限次重复囚徒的困境博弈的问题,与蜈蚣博弈都是相似的,问题的症结都在于在较多阶段的动态博弈中逆推归纳法的适用性受到了怀疑。 例一: 诚信博弈 G如图: 问题一:求此两阶重复博弈: 根据逆向归纳法知道: 在第二个阶段,信用困境的纳什均衡为(欺骗,欺骗); 逆推到第一阶段,唯一的Nash均衡还是(欺骗,欺骗)。 从而,两个阶段信用困境唯一的完美均衡的第一阶段的(欺骗,欺骗)和随后第二阶段的(欺骗,欺骗)。 问题二(进一步考察阶段博弈G存在多个Nash均衡情形) 其中存在三个Nash均衡: (诚信,诚信)(欺骗,欺骗)(中,中) 其中Nash均衡与完美均衡关系为: (诚信,诚信)——((诚信,诚信) (中,中)) (欺骗,欺骗)——((欺骗,欺骗) (欺骗,欺骗)) (中,中)——((中,中) (欺骗,欺骗)) 完美均衡的结构: ((欺骗,欺骗) (欺骗,欺骗)),((欺骗,欺骗) (欺骗,欺骗))这两个完美博弈均衡都简单地由两个阶段博弈的Nash均衡组成; ((诚信,诚信) (中,中))这个完美均衡与前两个完美均衡由一个非Nash均衡(第一阶段)和一个Nash均衡(中,中)(第二阶段)组成。 第二节 无限次重复博弈 虽然无限次重复博弈与有限次重复博弈一样,也是基本博弈的重复进行,但两者还是有重要区别的。因为无限次重复博弈没有结束重复的确定时间,也就是最后一次重复。根据我们对有限次重复博弈的分析可知,存在最后一次重复正是破坏重复博弈中博弈方利益和行为的相互制约关系。使重复博弈无法实现更高效率均衡的关键问题。 重复无穷次,结果如何? 证明得出,如果博弈方有足够的耐心,(抵赖,抵赖)是一个子博弈精练纳什均衡结果。 如果博弈重复无穷次而且每个人有足够的耐心,任何短期机会主义行为的所得都是微不足道的,博弈方都有积极性为自己建立一个乐于合作的声誉,同时也有积极性惩罚对方的机会主义的行为。 3、无限次重复古诺模型 4、信用困境无限重复博弈分析 设每一博弈方的贴现因子都为δ, 每一博弈方在重复博弈中得到的收益等于各自在所有阶段博弈中得到的收益的现值。 每一阶段都是相互合作——(诚信,诚信)? 如果当前博弈方选择合作,那么将来(下一阶段)将得到好报(选择高收益的均衡结果); 如果当前博弈方选择欺骗,那么将得到报应(选择低收益的均衡结果)。 策略: 触发策略(trigger strategies )--冷酷策略 开始选合作,选择合作直到有一方选择了坦白 一报还一报策略(tit-for-tat) 博弈方甲、乙的这一策略的表述为: 在第一阶段选择诚信,且在第t阶段,如果所有前面t-1阶段的结果都是(诚信,诚信),则选择诚信,否则就永远选择欺骗。 如果博弈方甲、乙都采取这种触发策略,则此无限重复博弈的结果就是每一阶段选择(诚信,诚信)。 问题: 每一阶段选择(诚信,诚信)是无限重复的Nash均衡吗? 这一Nash均衡是子博弈完美均衡吗? 第一、策略分析 如果某阶段的结果偏离(诚信,诚信),博弈方甲将在其后永远选择欺骗;如果某阶段的结果偏离了(诚信,诚信),博弈方乙的最优反应同样是在其后永远选择欺骗。这表明(欺骗,欺骗)是无限重复信用博弈中博弈双方的最优反应。 第二、收益分析 若乙选择欺骗 当期收益为5,但却会触发甲的永远不合作策略。 收益现值为 若乙选择合作而不是欺骗 当期的收益为4 令V表示博弈方乙在无限次选择中重选择最优策略时收益的现值。 如果选择诚信,则 如果选择欺骗,则 有,当且仅当 ,诚信才是最优反应。 亦即,贴现因子δ1/4时,选择诚信为最优反应。 在第一阶段,或在前面结果都是(诚信,诚信)的 下一阶段,博弈方乙的最优反应为诚信。 一旦某一阶段的结果偏离了(诚信,诚信),乙的 最优反应就是永远选择欺骗。 由博弈方甲与乙收益的对称性,博弈方甲会有 相同的结论成

文档评论(0)

夏天 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档