逆向归纳法的认知基础.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
逆向归纳法的认知基础

逆向归纳法的认知基础 崔晓红 1. 引言 逆向归纳法是博弈论中一个比较古老的概念,它的提出最早可以追溯到泽梅罗(1913) 针对国际象棋有最优策略解的证明,后来人们将其推广到了更广泛的博弈中,例如,在有限 完美信息扩展型博弈中,就是用逆向归纳法(BI )来证明子博弈完美均衡(SPE)的存在以 及求解 SPE,其基本思路是从动态博弈中的最后一个阶段开始,局中人都遵循效用最大化原 则选择行动,然后逐步倒推至前一个阶段,一直到博弈开始局中人的行动选择,其逻辑严密 性毋庸置疑。然而,当从终点往前推到某一决策点时,BI 完全忽略了到达该决策点的以往 历史行动,而这一历史行动当然会影响处于该决策点的局中人有关其对手将来如何采取行动 的信念,例如,一个局中人如果观察到对手在过去没有按照 BI 进行行动选择,那么他就有 理由相信他的对手仍会采取同样的模式进行下去,但是通过这种信念修正以后所做的选择就 会与 BI 矛盾。为了达到均衡解,为了能按 BI 进行推理求解,我们需要对局中人的信念或者 说知识增加一些限制性条件,也就是说在什么样的前提下,BI 是合理的,显然,仅仅要求 每个局中人都理性是不够的,所有的局中人都必须知道所有的局中人都是理性的,所有的局 中人都必须知道所有局中人都知道所有局中人都是理性的……等等以至无穷,在这样的认知 条件基础下,我们就不会偏离 BI ,即,“在完美信息扩展型博弈中,理性的公共知识蕴含了 BI ”(Aumann 1995 )。本文旨在通过构造完美信息扩展型博弈的认知模型来考察 BI 的这一 认知条件。文章第二部分先通过一些简单例子对一些问题进行非形式上的讨论;第三部分介 绍 Aumann 结构如何表达知识和信念;第四部分给出完美信息扩展型博弈的认知模型并用形 式化的方给出 BI 的认知条件。 2. 实例分析 2.1 蜈蚣博弈 图 1 是一个长度为 3 的蜈蚣博弈,博弈每前进一个阶段,桌子上就增加一美元,局中 人 1,2 轮流采取行动,轮到某个局中人采取行动时,他可以拿走桌子上的钱,博弈结束, 或者钱留在桌子上继续博弈,另外,局中人都是理性的,也就是说都遵循期望效用最大化原 则。如图所示: 1 2 1 L1 L2 L3 0 3 T1 T2 T3 1 0 3 0 2 0 图 1 蜈蚣博弈 1 根据 BI ,此博弈有唯一子博弈完美均衡,那就是局中人 1 采取行动 T1,拿走桌子上的 一美元博弈结束。假设局中人 1 采取的行动是 L1 ,并且桌子上又增加了一美元,此时由局 中人2 开始行动,这时的局中人 2 会觉得很奇怪,他最初是确定局中人 1 会根据 BI 进行推 理拿走桌上的钱的,但局中人 1 并没有那样做,局中人 2 就想局中人 1 可能不理性,如果再 来一次的话,说不定会给他留下三美元,如此盘算之后,局中人 2 就会理性地选择行动 L2 , 希望继续博弈。现假设局中人 1 非常理性,并且认为局中人 2 也是理性人而且知道局中人 2 会对自己采取行动 L1 有如上分析的信念,那么局中人 1 一开始没有拿走那一美元是为了下 一步行动能得到三美元。 那么在随后的博弈阶段即局中人 1 采取行动 L1 之后我们能不能假设存在有理性的公共 信念,从而得到 BI 解呢?不可以。局中人 1 行动 L1 之后理性的公共信念是不可能的:如 果局中人 2 相信局中人 1 是理性的,行动 L1 之后,他会拿走桌上的二美元;如果局中人

您可能关注的文档

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档