向传统智猪博弈理论发起挑战.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
向传统智猪博弈理论发起挑战.doc

向传统智猪博弈理论发起挑战 张天瑞    本文摘要: 本文认为,传统的智猪博弈理论有偏颇和不详尽之处,在其中所描述的对于均衡唯一性的看法只能在博弈是一次性或者虽然重复进行但是双方共同追求的唯一的收益不可以分割或者收益可以分割的某些情况下存在,事实上在传统智猪博弈理论的描述中丝毫看不出为了生存双方的博弈是一次性的。倘非如此,即在重复进行的收益可以分割的智猪博弈中,对于大猪一方总存在出让食物的激励,因为凭借此策略他最终所获得的净收益至少不会比他在传统策略下所获得的净收益更少,并且这一切的实现由纳什均衡保证。 关键词:   一次性 重复博弈 收益可分割 纳什均衡 正文: 本文为传统智猪博弈理论掘墓。   在本文中我选取美国艾里克.拉斯谬森先生所著的《博弈与信息》一书中所描述的智猪博弈作为我要批判的靶子,我将要说明为什么在大多数情况下面对同样的博弈经典看法给出的均衡是错误的以及什么时候它给出的均衡又是正确的,当然我的一系列论证是建立在我所选取的该智猪博弈的案例本是就是对智猪博弈的经典描述,并且它给出的均衡从未在前人的思考中得到任何的质疑。 这一描述是这样的:“两头猪被关在同一个猪圈里,猪圈的一头安装着一个特制的按键,另一头安装着一个食槽。当一头猪按下按键时,会有10单位的食物进入槽中,但按键的猪会付出2单位的成本。这两头猪中,有一头身强力壮(我们不妨假定他是头大猪)。如果大猪先到食槽,则小猪只能吃到相当于1单位的残羹冷炙,但若小猪先到的话,则它能吃到4单位的食物。若两头猪同时到,则小猪可吃到3单位食物。”可以看出,该博弈是一个完全信息静态博弈,由此我们给出支付矩阵,见下图: 小猪 按键 等待 大 猪 按 键 (5,1) (4,4) 等 待 (9,-1) (0,0) (经典支付矩阵) 并且,作者认为(大猪选择按键,小猪选择等待)是本博弈唯一的纳什均衡,这一点显然已经在所有知道该博弈的前人的头脑中形成共识。   所谓结论往往是我们懒得再思考下去的地方,我的质疑就在此开始。粗略的一看,博弈中大猪的策略空间是{如果小猪选择等待我将选择按键,如果小猪选择按键我将选择等待},但也正是这一粗略的看法,我们的思维被蒙骗了。如果我们细心一点,就会发现,传统的智猪博弈理论隐含着这样一个事实——大猪对于他该吃多少食物是力所能及的。如我后文将要指出,倘若这一假设是正确的话,传统的结论还情有可原,但事实上假如大猪聪明一点的话这条假设根本就是不能成立的。在传统智猪博弈理论的描述中我无法想象大猪和小猪为了生存他们之间的博弈是一次性的,我的分析就此展开。难道我们可怜的大猪就没有发现正是他贪得无厌的策略使得小猪认为自己去按键的话根本无利可图才选择每次都等待吗?况且贪得无厌的收益也不过只是他的想法罢了,他并没有得到他当初想得到的9单位的净收益,得到只是来回奔波和小于9单位的4单位的净收益。大猪应该思考,有什么办法能让他得到的比4单位多一点,而小猪也不得不去按键,即这是一种均衡呢?我们再思考原博弈,小猪之所以不选择按键是因为他知道,大猪是贪得无厌的,留给他的只有1单位食物,而他却要为此付出两单位成本。既然是博弈,大猪就应该也站在小猪的角度思考,如果自己付出两单位成本后所得的净收益为正,自己还是有利可图的,所以会选择按键。那么,大猪现在要思考的一件事情就是,他是否应该不那么贪得无厌,即能否在每次博弈中为小猪出让点食物,使得最后自己得到的净收益大于因为他贪得无厌而最终只能得到的4单位的净收益,并且当然,这是一种均衡,谁也没有激励打破它。   我们假设出让的食物的单位为x,用数学来表示上述想法就应该是如下所展示的:   -1+x0,且9-x4, =1x5 我们试任选一个x的值,带入原博弈中看看均衡是否会发生变化。比如我们选取x=2,此时得到如下支付矩阵(这一系列由x的值得到的新的支付矩阵不妨称之为叛逆支付矩阵): 小猪 按键 等待 大 猪 按 键 (5,1) (4,4) 等 待 (7,1) (0,0) (叛逆支付矩阵) 现在我们来重新考察博弈,此时无论大猪还是小猪都没有严格优势策略,不管用什么方法,最终我们看到在这一给定的支付矩阵下存在两个纯策略纳什均衡:(大猪等待,小猪按键)或者(大猪按键,小猪等待),在后者中,大猪的福利和传统智猪博弈理论中描绘的一样好,但是在前者中,大猪的福利显然优于传统智猪博弈理论中的描绘,也即是说,当大猪愿意在和小猪反复的博弈中总是出让两个单位的食物时,他最终所得至少和他凭借“能吃就吃”的传统策略所得一样好。 但是x=2

文档评论(0)

scuqiranh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档