- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十二章 精炼贝叶斯Nash均衡 主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较 在完全信息动态博弈中,假设s*为一子博弈精炼Nash均衡,那么在参与人采用均衡战略s*的情况下,不管博弈的进程如何或是否发生,每个参与人的战略对从任一决策结开始的子博弈(或在其后轮着他采取的行动)都是最优的。 子博弈精炼Nash均衡中的这种“均衡精炼”的思想,也可应用到不完全信息扩展式博弈中。 作为上述“均衡精炼”思想的自然应用,必然要求每个参与人的均衡战略在其每个信息集上都为最优。 例如 不仅要求参与人2的均衡战略在由单决策结构成的信息集上最优,而且还要求参与人3的均衡战略在由多决策结构成的信息集和上最优。 但对于位于由多决策结构成的信息集(I3({x4,x5})或I3({x6,x7}))上的参与人3,当轮到他行动时,由于对已发生的历史即参与人2是选择了L’还是R’并不清楚,因此也就不知道自己是位于决策结x4 (或x6)还是决策结x5 (或x7)上。 在这种情况下,参与人3对信息集 (I3({x4,x5})或I3({x6,x7}))后的博弈进程就不清楚,因而对自己的选择所导致的博弈结果也就不清楚,从而使得参与人3无法确定自己的最优行动。 虽然位于多决策结信息集上的参与人,对自己到底位于信息集中哪一个决策结上不能给出一个明确的判断,但一般情况下还是能够对自己位于哪一个决策结,给出一个“大概的估计”。 当位于多决策结信息集上的参与人能够用一个定义在该信息集上的概率分布,来对自己位于哪一个决策结进行描述时,就称参与人在该信息集上具有了关于自己位于哪一个决策结的信念(或推断)。而当参与人具有了关于自己位于哪一个决策结的信念(或推断)时,就可借助这种信念(或推断)来指导自己的决策(或选择)。 考察如下完全但不完美信息动态博弈: 如果参与人1选择R,则博弈结束(参与人2没有行动)。 如果参与人1选择了L或M,则参与人2就会知道1没有选择R(但不清楚1是选择了L还是M),并在L’和R’两个行动中进行选择,博弈随之结束。 给出了上述博弈的战略式描述 在两个子博弈精炼Nash均衡中,均衡(R, R’ ) 明显要依赖于一个不可信的威胁,因此,该博弈只有一个合理的纯战略子博弈精炼Nash均衡——(L, L’ ) 根据Selten所给出的子博弈精炼Nash均衡的定义,是无法将不合理的子博弈精炼Nash均衡(R, R’ )排除掉的。 如果能将子博弈精炼Nash均衡的思想推广到多决策结信息集,并在每个信息集上给出一个参与人关于自己位于该信息集中哪一个决策结的信念(或推断),则可以将某些不合理均衡剔除掉。 给定参与人2的一个推断,[p]表示参与人2位于左边决策结的概率为p,[1-p]表示参与人2位于右边决策结的概率为1-p。 参与人2选择L’的期望收益为: 而参与人2选择R’的期望收益为: 由于对任意的p,都有2-p1-p,这就排除了参与人2选择R’的可能性。 因此,在上述博弈中,简单要求参与人2持有一个推断,并且在此推断下选择最优行动,就足以使我们排除不合理的均衡(R,R’)。 考察更一般情形的博弈: 在该博弈中,战略组合(R,R’ )也是参与人2的信息集未能达到的一个子博弈精炼Nash均衡。 如果参与人2的信息集一旦能够达到,参与人2的最优选择就依赖于他关于已发生历史的信念,即一旦博弈进入参与人2的信息集,参与人2关于自己位于哪一个决策结的推断。 参与人2选择L’与R’的期望收益分别为2-p和1+p,因此,如果p1/2,则最优战略为R’;如果p1/2 ,则最优战略为L’。 要将子博弈精炼Nash均衡中“均衡精炼”的思想应用到不完全信息扩展式博弈中,就必须做到: 对每个参与人i,在其信息集上给出关于自己位于该信息集中哪一个决策结的信念(或推断); 对参与人i的每个信息集,在给定参与人i在该信息集上的信念(或推断)情况下,参与人的战略是对其他参与人战略的一个最优反应,即参与人的选择必须满足序惯理性(sequential rationality)。 主要内容: 一、均衡的精炼与信念 二、信念设定 三、精炼贝叶斯Nash均衡 四、几种均衡概念的比较 精炼贝叶斯Nash均衡既包含了一个战略组合,又包含一个信念系统。 这里信念系统对每个信息集都确定了位于该信息集上的参与人所持有的信念。 这种信念是信念持有人对已发生历史的一个推断,也可理解为他对自己位于信息集上哪一个决策结的“一种估计”。 通过给定参与人在信息集上的信念,来对不完全信息扩展式博弈的均衡进行精炼,是Selten子博弈精炼Nash均衡中“均衡精炼”的思想在不完全信息扩展式博弈中的自然应用。 给定参与人的均衡战略,参与人的信念必须满足: 与战略的一致性(co
有哪些信誉好的足球投注网站
文档评论(0)