- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论 主讲人:燕志雄 第1章 策略式博弈和纳什均衡 1、卢梭博弈 参与人:猎人 策略:猎兔与猎鹿; 收益:猎鹿(2)或猎兔(1) 结果:合作与非合作; 2、收益矩阵: 策略 猎鹿 猎兔 猎鹿 (2,2) (0,1) 猎兔 (1,0) (1,1) 1.1 策略式博弈和重复严格优势 1 .1.1 策略式(或标准式)博弈 1、策略式的三种组成元素: (1)参与人集合i∈{1,2,…,I}; (2)每个参与人i的纯策略空间Si; (3)效用函数ui(s),s=(s1,s2,..,sI)。 2、双人零和博弈:Σiui(s)=0,对于所有s。 3、关键假设 假定所有参与人知道策略式的结构,知道他们的对手知道这一结构,知道他们的对手了解他们知道,如此直至无穷。博弈的结构是共同知识。 4、有限博弈 (1)纯策略式博弈,如图1-1; (2)混合策略式博弈; ——混合策略σi指纯策略上的一种概率分布; ——每个参与人的随机化和他的对手的随机化是统计独立的; ——混合策略组合的收益是映射纯策略收益的期望值。 (3)数学描述 ——参与人i混合策略的空间为Σi,其中σi(si)是σi赋予si的概率;混合策略组合的空间记为Σ= xiΣi,它的元素是σ; ——参与人i在组合下的收益为ΣS(Π σj(sj))ui(s); ——例子,计算参与人i混合策略组合的收益。 图1-1 策略 L M R U 4,3 5,1 6,2 M 2,1 8,4 3,6 D 3,0 9,6 2,8 1.1.2 占优策略 1、图1-1博弈的均衡结果是什么? ——分析逻辑:理性的参与人2,R占优M;参与人1,U占优M或D;最后,参与人2知道如此,只会选择L。 ——剔除过程被称为重复占优或重复严格占优。剩下的策略集合不取决于策略被剔除的次序,关键在于si严格劣于策略s′i。 ——图1-2博弈:混合策略σ1=(1/2,0,1/2)占优纯策略,也就是说,一种纯策略可能严格劣于一个混合策略,即便它不劣于任何纯策略; 图1-2 L R U 2,0 -1,0 M 0,0 0,0 D -1,0 2,0 定义:严格劣势 定义1.1 ——纯策略si对于参与人i来说是严格劣势的,如果存在σ′i∈Σi,使 ui(σ′i,s-i)ui(si,s-i),s-i∈s-i (1.1)。 ——策略si是弱劣势的,如果上面(1.1)的不等式以弱不等式形式成立。 ——注意,对于给定的si,策略σ′i对于对手的所有纯策略s-i满足不等式(l.1)当且仅当它对于对手的所有混合策略σ-i也满足不等式(l.1),原因是,对手采用混合策略时参与人i的收益是他在对手采用纯策略时参与人i收益的凸组合。 注意事项 ——对劣势纯策略赋予正概率的混合策略是劣势的; ——即便它仅对非劣势的纯策略赋予正概率,一个混合策略也有可能是严格劣势的,如图1-3。 σ1=(1/2,1/2,0)D。 图1-3 L R U 1,3 -2,0 M -2,0 1,3 D 0,1 0,1 “稳健性”检验 ——在某些极端情况下,通过重复严格优势获得的唯一策略组合(U,L)与现实中的结果(D,L)并不吻合,如图1-4。 ——这个例子说明了,收益、策略空间与理性是共同知识的假设是有作用的。图1-4说明了参与人的行为对于不确定性是非常敏感的。 图1-4 L R U 8,10 -100,9 D 7,6 6,5 博弈论与决策论的区别 ——在决策中,单个决策者,他的行动决策取决于他对于自然行动概率的外生信念; ——在博弈中,多个决策者对于他们对手的行动预期并不是外生的。 ——如图1-5的博弈转变为如图1-6的博弈。决策论认为,如此一个变化不会对参与人1有利,因为其他外生条件是给定的; ——博弈论认为,这对参与人1是有利的,结果从(U,L)转变为(D,R)。 ——结论:变化对决策与博弈的不同影响。 图1-5 L R U 1,3 4,1 D 0,2 3,4 图1-6 L R U -1,3 2,1 D 0,2 3,4 1.1.3 剔除劣势策略的应用 例子1.1 囚徒困境 ——在著名的“囚徒困境”博弈中,剔除劣势策略可以提供唯一答案,如图1-7。 ——故事:两个人因为一桩罪行而被捕。警方缺乏足够的证据来对两个嫌疑犯定罪,因此,需要他们彼此提供证词。警方让两个嫌疑犯处于不同房间以防止他们彼此交流,。。。 ——另一版本的例子是团队道德风险。假定两个工人i=1,2,每个人可以工作(si=1)或偷懒(si=0)。团队的总产出是4(s1+s2),并在两个工人中平均分配。每个工人在工作时承担私人成本3,在偷懒时私人成本为0。 图1-7 C D C 1,1 -1,2 D 2,-1 0,0 例1.2 二级价格拍卖 1、博弈的构成要素 ——参与人;策略;
文档评论(0)