- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第6章博弈论概论第6章博弈论概论
第6章 博弈论概论 6.1 几个概念 参与人 参与人的行动 参与人的信息 参与人的策略 参与人的支付 结果 均衡 博弈论 6.2 同时博弈:纯策略均衡 6.2.1 基本理论 同时博弈 , 局中人的策略 , 局中人的策略集 所有局中人的策略组合 所有局中人的策略组合集 , 局中人的支付; 该支付取决于所有局中人的策略组合 所有局中人的支付向量 严格占优策略 如果,则是局中人的严格占优策略。 严格占劣策略 如果,则局中人的策略严格占优于他的另外一个策略。在这种情况下,我们也可以说,局中人的策略在中是严格占劣的。 删除严格占劣策略 从局中人的策略集中删除一个严格占劣策略之后得到的结果记为;重复进行轮这样的删除得到的结果记为(注意:删除严格占劣策略不影响最后的均衡) 重复删除后的严格不占劣策略 如果,对于一切的,则为重复删除后的严格不占劣策略。 弱占劣策略 如果,且至少有一个严格不等式成立,则局中人的策略弱占优于他的另外一个策略。在这种情况下,我们也可以说,局中人的策略在中是弱占劣的。 删除弱占劣策略 从局中人的策略集中删除一个弱占劣策略之后得到的结果记为;重复进行轮这样的删除得到的结果记为(注意:删除弱占劣策略也不影响最后的均衡) 重复删除后的弱不占劣策略 如果,对于一切的,则为重复删除后的弱不占劣策略。 纳什均衡 如果,则是一个纯策略纳什均衡。 寻找纳什均衡的方法 条件策略下划线法 纳什均衡的存在性 纳什均衡的唯一性 纳什均衡的最优性 6.2.2 二人同时博弈的一般理论 二个同时博弈的一般模型 二人同时博弈的一般模型 参与人B的策略 策略1 策略2 参与人A的策略 策略1 , , 策略2 , , A与B的支付矩阵 A的支付矩阵、B的支付矩阵 A的带下划线的支付矩阵: ①、②、③ ④、⑤、⑥ ⑦、⑧、⑨ B的带下划线的支付矩阵 ①′、②′、③′ ④′、⑤′、⑥′ ⑦′、⑧′、⑨′ 纳什均衡 可分为如下的五种类型。第一种是四个均衡。包括1种情况,即①+①′——它表示,A的带下划线的支付矩阵为①、B的带下划线的支付矩阵为①′。此时,总的支付矩阵中所有四个单元格的两个数字均有下划线,因而,总共有四个纳什均衡。第二种是三个均衡。包括12种情况。如①+②′、①+③′等等。第三种是两个均衡。包括38种情况。如①+⑥′、①+⑦′等等。第四种是一个均衡。包括28种情况。如②+⑦′、②+⑧′等等。第五种是零个均衡。包括2种情况,即⑧+⑨′和⑨+⑧′。 6.3 同时博弈:混合策略均衡 6.3.1 基本理论 , 局中人的混合策略;其中,是局中人的纯策略;是指派给的概率。 , 局中人的混合策略集 所有局中人的混合策略组合 所有局中人的混合策略组合集 局中人的支付; 该支付取决于所有局中人的混合策略组合 所有局中人的支付向量 纳什均衡 如果,则是一个(混合)策略纳什均衡。 纳什均衡定理(定理7.1) 纳什均衡的存在性(定理7.2) 6.3.2 混合策略 策略1 策略2 参与人A的策略 策略1 , , 策略2 , , 混合策略和混合策略组合 A的全部混合策略可表示为:,它包括了两个纯策略在内。 B的全部混合策略可表示为:,它也包括了两个纯策略在内。 A与B的全部的混合策略组合可以表示为: ,、,、 期望支付 A的期望支付可以表示为: 将代入上式并整理得: ⑸ 这里, ⑹ 是参与人A的判别式。 B的期望支付可表示为: 将代入上式并整理得: ⑺ 这里, ⑻ 是参与人B的判别式。 A的条件混合策略 A的条件混合策略可以表示为: 由此可见,A的条件混合策略完全取决于其判别式的符号,具体分为9种情况。 ① 、。此时,A的条件混合策略可表示为: ② 、。此时,A的条件混合策略可以表示为: ③ 、。此时,A的条件混合策略可以表示为: ④ 、。此时,A的条件混合策略可以表示为: ⑤ 、。此时,A的条件混合策略可以表示为: ⑥ 、。此时,A的条件混合策略可表示为: ⑦ 、。此时,A的条件混合策略可表示为: ⑧ 、。此时,A的条件混合策略可表示为: ⑨ 、。此时,A的条件混合策略可表示为: B的条件混合策略 B的条件混合策略与其判别式之间的关系可表示为: 具体情况如下。 ①′、。此时,条件混合策略可表示为: ②′、。此时,条件混合策略可表示为: ③′、。此时,条件混合策略可表示为: ④′、。此时,条件混合策略可表示为: ⑤′、。此时,条件混合策略可表示为: ⑥′、。此时,条件混
您可能关注的文档
最近下载
- 2025电动航空器电推进系统动力电机技术规范.docx VIP
- DB37╱T 3655-2019 化工园区大气环境风险监控预警系统技术指南(试行).pdf VIP
- 百灵达FLOW-8快速使用说明书.pptx VIP
- 化工园区危险品运输车辆停车场建设标准.pdf VIP
- 《党政机关厉行节约反对浪费条例》专题党课PPT课件模板.pptx VIP
- T/HGJ 10600-2019 烧碱装置安全设计标准.docx VIP
- 必威体育精装版清晰版ISO50001(中word版).docx VIP
- 临床医学 《门静脉高压症》教学课件.ppt VIP
- 必威体育精装版:机械通气患者转运课件.pptx VIP
- (高清版)DB44∕T 2598-2024 《省级体育社会团体建设规范》.pdf VIP
文档评论(0)