- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章 重复博弈 重复博弈引论; 有限次重复博弈; 无限次重复博弈。 第一节 重复博弈引论 2、无限次重复 某个重复博弈没有可以预见的结束时间,各博弈 方主观上认为博弈会不断进行下去,那么就可以看作 是无限次重复博弈。 3、随机结束博弈 重复博弈的次数虽然是有限的,但重复的次数或 博弈结束的时间却是不确定的。这种重复博弈可以称 为“随机结束的重复博弈”。 二、重复博弈的策略、子博弈和均衡路径 重复博弈中博弈方的一个策略就是在每个阶段(即每次重复),针对每种情况(以前阶段的结果)如何行为的完整计划。 重复博弈的子博弈就是从某个阶段(不包括第一阶段)开始,包括此后所有阶段的重复博弈部分。 重复博弈也是动态博弈,也有路径概念。但重复博弈的所有博弈方在每个阶段都必须行为,因此重复博弈的路径是由每个阶段各博弈方的行为组合串联而成的。 如果原博弈有m种策略组合,那么重复两次就有 条博弈路径,重复T次就有 条博弈路径;当T或m较大时,重复博弈的路径数是很大的。 三、重复博弈的得益与博弈方的行为选择 1、要从整体上把握博弈的得益 重复博弈的得益与一次性博弈有所不同,因为它 们的每个阶段本身就是一个博弈,各个博弈方都有得 益,而不是整个博弈结束后有一个总的得益,如果博 弈方是根据当前阶段得益选择,那么等于把重复博弈 割裂成了一个个基本博弈,重复博弈就失去了意义。 因此重复博弈中,博弈方的行为、策略选择不能只考 虑本阶段的得益,必须兼顾其他阶段的得益,或者说 要考虑整个重复博弈过程得益的总体情况。 2、各阶段的时间间隔对博弈方行为的影响 重复博弈每个阶段的得益有时间上的先后之分, 这在只有少数几次重复且每次重复间隔时间并不很长 的情况下可能并不重要。但对于重复次数很多且每次 重复间隔时间又较长的有限次重复博弈,或者是无限 次重复博弈时,得益的时间先后就不能不考虑。因为 由于心理作用和资金有时间价值的原因,不同时间获 得的单位利益对人们的价值是有差别的,忽略这一点 就不可能得出符合实际的分析结论。 那么如何处理未来得益对当前决策的影响呢? 解决这个问题的方法是引进将后一阶段得益折算 成当前阶段得益的贴现系数 。有了贴现系数 ,如 果一个T 次重复博弈的某博弈方某一均衡下各阶段得 益分别为 ,则考虑时间价值的重复博弈总 得益现在值为: 四、随机停止和贴现率 可理解为通过抽签来决定是否停止重复,设抽 到停止的概率是 ,重复下去的概率为 。 设某博弈方的阶段得益为 ,利率为 ,因 为在第一次博弈以后能继续下一次重复的可能性是 ,第二阶段的期望得益为 ,进一步第三 阶段的期望得益为 ,……,所以该博弈方 在该重复博弈中期望得益的现在值为: 第二节 有限次重复博弈 (一)有限次重复囚徒的困境博弈 (二)一般结论 原博弈有惟一的纯策略纳什均衡的博弈,则有限次重复博弈的惟一均衡即各博弈方在每阶段(即每次重复)中都采用原博弈的纳什均衡策略。 定理 设原博弈G有惟一的纯策略纳什均衡,则对任意正整数T,重复博弈G(T)有惟一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。 (三)有限次重复削价竞争博弈 (四)重复囚徒困境悖论和连锁店悖论 在重复囚徒困境博弈的大量实验研究中,重复次数较大时的实验结果通常会与上述结论不同,包含合作的情况非常普遍。 其实,有限次重复囚徒困境类博弈问题与蜈蚣博弈很相似,问题都在于在较多阶段的动态博弈中逆推归纳法的适用性受到了怀疑。 合作是可能的吗?在什么条件下才能从没有集 权的利己主义者中产生合作?这个问题已经困扰人们很长时间。 三、多个纯策略纳什均衡博弈的有限次重复博弈 (一)三价博弈的重复博弈 设一市场有两个生产同质产品的厂商,他们的策 略及对应得益如图4.4所示。该博弈有两个纯策略纳 什均衡(M,M)和(L,L)。而策略组合(H,H) 并不是纳什均衡,一 次性博弈不可能出现 这个效率最高的策略 组合。那么,两次重 复这个博弈情况会如 何呢? 证明:首先,第二阶段的策略组合(M,M)是一个原博弈的纳什均衡,因此不会有哪一方会愿意单独偏离;其次,第一阶段的(H,H)虽然不是原博弈的纳什均衡,一方单独偏离该策略而采用M能增加1单位得益,但这样做的后果是在第二阶段对方会采用有“报复机制”的L策略,从而使偏离一方至少损失2单位的得益,因此偏离(H,H)是得不偿失的,合理的选择是坚持
您可能关注的文档
最近下载
- 想象与真实:网络玄幻小说《诡秘之主》的空间叙事研究.pdf VIP
- GB 1499.2-2024 钢筋混凝土用钢 第2部分:热轧带肋钢筋.pdf VIP
- 2024~2025学年10月山东青岛城阳区青岛实验高中高一上学期月考数学试卷(详解版).pdf VIP
- 《中国重症肌无力诊断和治疗指南(2025版)》解读PPT课件.pptx VIP
- 国庆双节小区物业安全温馨提示.doc VIP
- 《强制性条文实施计划》.docx VIP
- 长春易加科技-数字化互联化智能工厂解决方案.pdf VIP
- 23CJ87-1 采光、通风、消防排烟天窗(一)参考图集.docx VIP
- 车辆GPS动态监控管理制度完整.doc VIP
- 2-2《TIPS操作手册(公共代码管理子系统)》.pdf
文档评论(0)