完全信息静态博弈-纳什均衡.pptVIP

下载本文档

6
0
约1.36万字
约 89页
2018-05-15 发布于四川
举报
版权申诉

完全信息静态博弈-纳什均衡.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

* * * 遵斗鸡博弈的混合策略设A方以概率pA（进）+pA（退）=1 设B方以概率pB（进）+pB（退）=1 A、B 如何选择 PA，PB？对A方来说，他设计的概率要使B方在选择每一种策略时无差异： EB进=pA进·（-3）+pA退 · （2） EB退=pA进·（0）+pA退 · （0） -3，-3 2，0 0，2 0，0 进退 B 进退 A 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦令 EB进 =EB退 -3pA进+2pA退=0 pA进+pA退=1 则pA进=0.6， pA退=0.4 同理，pB进=0.6，pB退=0.4 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦随机策略决策的基本原则第一个原则不能让对方知道或猜到自己的选择，因而必须在决策时利用随机性。第二个原则他们选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦斗鸡博弈的随机策略均衡在纯策略中，NE是一组最优策略组合S*=（S1*…Si*…Sn*) 如囚徒困境中，（坦白，坦白）是一个纳什均衡，其支付为（-5，-5）。在随机策略中，NE也是一组策略组合，但是以概率大小来选择相应最优策略。以斗鸡博弈来看，A方以(0.6、0.4)分别选择进和退，B方也(0.6、0.4)概率分别选择进和退，这就是混合策略的NE。其支付分别为各自期望收益（EA、EB）（-0.6,-0.6): 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦监督博弈博弈方：代理人A、委托人P 代理商的可选策略：工作W，偷懒S 工资w,工作的花费g,且wg 委托人的可选策略：检查I，不检查N 委托人检查的费用h, 增加的价值为v（vw）假定gh0 其支付矩阵如图所示 0，-h w, -w w-g , v-w-h w-g , v-w 检查不检查偷懒工作代理商委托人 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦监督博弈的随机策略均衡用下划线求解，可知本博弈无纯策略NE。设代理商: 偷懒的概率为x , 工作概率为1-x p1 =(x ,1-x ) 设委托人: 检查的概率为 y, 不检查的概率为1-y p2=(y,1-y) 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦对代理商来说他设计的概率p1 =(x ,1-x )，应该使委托人在不同策略选择下的期望收益相等，即EUPI=EUPN EUPI=x(-h)+(1-x)(v-w-h) EUPN=x(-w)+(1-x)(v-w) 令EUPI=EUPN，则求出x=h/w 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦同理对委托人他的概率p2=(y,1-y)，也使EUAW=EUAS，则y=g/w 因此,本博弈混合策略的NE为（ h/w ,1-h/w),(g/w ,1-g/w) 均衡时的期望收益为（EUA，EUP） 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦另一种求解法设代理商的密度函数为:p1 =(x ,1-x ) 设委托人的密度函数为:p2=(y,1-y) 先求代理商的期望收益 EUA=x {0 · y + w(1-y)}+(1-x) {(w-g)y + (w-g)(1-y)} =xw(1-y)+(1-x)(w-g) 再求MaxEUA，即dEUA/dx=0, 即w(1-y) = (w-g) ------(1) 这样可以求出y=g/w 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦同理可以求出委托人的期望收益EUP MaxEUP, dEUB/dy=0, 则有h+x (v-w)=xv --------(2) 由此得到x=h/w. 注意（1）、（2）的特点。 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系劉琦监督博弈的经济应用