chap12_对策论.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chap12_对策论

认罪博弈 罗格、贝瑞和德福是布鲁查德学校三个出名的捣蛋鬼,最近他们又聚到一起,趁万圣节砸坏了校长的房子。学校里所有人都认定这件事情是他们干的,如果他们拒不承认,就将被处以重罚。如果他们中有人认罪,认罪的人将被轻罚,其它人则免于受罚。 认罪博弈 贝瑞 认罪 不认罪 德福 德福 认罪 不认罪 认罪 不认罪 罗格 认罪 -1, -1, -1 -1, -1, 0 -1, 0, -1 -1, 0, 0 不认罪 0, -1, -1 0, -1, 0 0, 0, -1 -2, -2, -2 博弈存在三个纳什均衡解,属协调博弈问题。除非他们能够根据某些线索找到谢林点,否则难以实现有效率的协调。 为降低风险,根据最小最大原则,每个人都会选择认罪,如果三个人都这样做,结果将是无效率的。 三个纳什均衡有失公平,三个人共同做的坏事却只惩罚一个人。 认罪博弈---集体战略 三个淘气的男孩想出了一个办法:通过抽签决定谁去认罪。 抽签之前每个人的期望收益都是-1/3,比他们主动认罪的收益好,并且是没有风险的。 抽签完成后就找到一个谢林点。 由于每个人面临同样的认罪概率,并且有相同的期望收益值,因此抽签的结果是公平的,纯战略的纳什均衡反而是不公平的。 相关均衡 一般而言,集体战略总是对着纳什均衡,相关均衡就是决定集体战略概率的一种制度安排,是非合作博弈的一种新的形式。 选择集体战略的概率之和必须是1。 如果只存在一个均衡(囚犯困境),或只有一个均衡优于其它所有的均衡(推与不推博弈)时,被占优的纳什均衡根本不可能实现,该均衡是相关均衡的特例。 认罪博弈中三个男孩在博弈中形成联盟,从而避免了协调博弈中胡乱猜测的风险。 相关均衡解是没有风险的,并且明显地优于最大最小解。 金发女郎问题的对称非合作均衡解 男士们可以向“认罪博弈”中淘气的男孩们学习,通过抽签的方式选出“幸运儿”。 由“幸运儿”去追求金发女郎,别的男士则追求其他女士。 这样,他们的期望收益可以达到1.5,明显优于最大最小解,且不存在风险。 序贯博弈 现实世界中,有时候人们只能按一定的顺序选择战略,只有在特定的条件下或一段过间过后,才能实施他们承诺的战略,这类博弈就称为序贯博弈。 遏制进入的战略性投资 施佩泽拉(spizella 是一家生产工作站专用计算机处理芯片的公司。其工厂芯片的年产量为300万个,总成本10亿美元。 施佩泽拉公司的管理者了解到,旅行者 Passer 公司正考虑建造相近规模的工厂以生产同类芯片。 施佩泽拉公司考虑投资建立另一家工厂。 芯片需求 产量(万个) 单价(美元) 300 700 600 400 900 200 遏制进入的战略性投资分析 工厂数 产量 (万个) 单价(美元) 总成本 (亿美元) 行业总利润 (亿美元) 1 300 700 10 11 2 600 400 20 4 3 900 200 30 -12 芯片需求 产量(万个) 单价(美元) 300 700 600 400 900 200 遏制进入的战略性投资决策树 施佩泽拉 旅行者 旅行者 不建立 不建立 建立 建立 不建立 建立 -8,-4 4,0 2,2 11,0 遏制进入的战略性投资 在商业世界中,新竞争者的进入会减少现有公司的利润,可以预期,现有公司将不惜血本,想方设法地阻止或吓退新竞争者的进入。 重复博弈 当一个博弈可以重复多次,博弈结果会有怎么不同呢? 露营者难题 阿曼达和巴菲是夏日露营的管理员,她们一起住在有电视和DVD的房间里。DVD碟片可以从露营商店租借,每周末5美元。阿曼达和巴菲在周末看一部DVD的收益都是4美元。 露营者难题 巴菲 租借 不租借 阿曼达 租借 3,3 -1,4 不租借 4,-1 0,0 社会两难问题,一次博弈的结果应该是都不租借。 重复露营者难题 夏天才刚刚开始,她们10周后才会返回位于不同州的校园开始她们的秋季课程,那么情况会怎样呢? 看上去她们应该会选择合作,至少在开始几周。 如果阿曼达在本周选择租借,巴菲将在下周租借,以此回报她。 如果阿曼达在本周选择不租借,巴菲将在下周甚至随后几周都不租借,以此来惩罚她。 这是理性的最佳反应战略吗? 重复露营者难题分析 应用反向归纳法: 第10周,因为是最后一周,最佳反应当然是不租借,此时的选择既不会得到回报,也不会遭到制裁。 第9周,已经知道第10周将是都不租借,因此第9周的战略选择在第10周及以后不会有附加的回报或制裁,最佳反应当然还是不租借。 第8周,。。。 … 第1周,。。。 重复性社会两难:当一个社会两难博弈有限次地重复时,子博弈完美均衡与最初的社会两难一样,必定是两个参与者相互背叛。 不确定重复露营者问题 假设露营的第1天,阿曼达和巴菲通过交谈发现: 秋季开学后,她们将入读同一所学校,而且还是舍友。甚至她们正和来自同一个城镇

文档评论(0)

cj80011 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档