完全信息静态博弈-纳什均衡.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * 遵 斗鸡博弈的混合策略 设A方以概率pA(进)+pA(退)=1 设B方以概率pB(进)+pB(退)=1 A、B 如何选择 PA,PB? 对A方来说,他设计的概率要 使B方在选择每一种策略时无差异: EB进=pA进·(-3)+pA退 · (2) EB退=pA进·(0)+pA退 · (0) -3,-3 2,0 0,2 0,0 进 退 B 进 退 A 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 令 EB进 =EB退 -3pA进+2pA退=0 pA进+pA退=1 则pA进=0.6, pA退=0.4 同理,pB进=0.6,pB退=0.4 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 随机策略决策的基本原则 第一个原则 不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。 第二个原则 他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 斗鸡博弈的随机策略均衡 在纯策略中,NE是一组最优策略组合S*=(S1*…Si*…Sn*) 如囚徒困境中,(坦白,坦白)是一个纳什均衡,其支付为(-5,-5)。 在随机策略中,NE也是一组策略组合,但是以概率大小来选择相应最优策略。 以斗鸡博弈来看,A方以(0.6、0.4)分别选择进和退,B方也(0.6、0.4)概率分别选择进和退,这就是混合策略的NE。 其支付分别为各自期望收益(EA、EB)(-0.6,-0.6): 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 监督博弈 博弈方:代理人A、委托人P 代理商的可选策略: 工作W,偷懒S 工资w,工作的花费g,且wg 委托人的可选策略: 检查I,不检查N 委托人检查的费用h, 增加的价值为v(vw) 假定gh0 其支付矩阵如图所示 0,-h w, -w w-g , v-w-h w-g , v-w 检查 不检查 偷懒 工作 代理商 委托人 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 监督博弈的随机策略均衡 用下划线求解,可知本博弈无纯策略NE。 设代理商: 偷懒的概率为x , 工作概率为1-x p1 =(x ,1-x ) 设委托人: 检查的概率为 y, 不检查的概率为1-y p2=(y,1-y) 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 对代理商来说 他设计的概率p1 =(x ,1-x ),应该使委托人在不同策略选择下的期望收益相等,即EUPI=EUPN EUPI=x(-h)+(1-x)(v-w-h) EUPN=x(-w)+(1-x)(v-w) 令EUPI=EUPN,则求出x=h/w 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 同理对委托人 他的概率p2=(y,1-y),也使EUAW=EUAS,则y=g/w 因此,本博弈混合策略的NE为 ( h/w ,1-h/w),(g/w ,1-g/w) 均衡时的期望收益为(EUA,EUP) 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 另一种求解法 设代理商的密度函数为:p1 =(x ,1-x ) 设委托人的密度函数为:p2=(y,1-y) 先求代理商的期望收益 EUA=x {0 · y + w(1-y)}+(1-x) {(w-g)y + (w-g)(1-y)} =xw(1-y)+(1-x)(w-g) 再求MaxEUA,即dEUA/dx=0, 即w(1-y) = (w-g) ------(1) 这样可以求出y=g/w 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 同理 可以求出委托人的期望收益EUP MaxEUP, dEUB/dy=0, 则有h+x (v-w)=xv --------(2) 由此得到x=h/w. 注意(1)、(2)的特点。 2009.10.16-2009.11.11 * 南京理工大学经管院应用经济系 劉琦 监督博弈的经济应用

文档评论(0)

wxc6688 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档