- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
囚徒的困境
囚徒困境 若囚徒们不互相合作,则无法脱离困境。囚徒困境是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇。雖然困境本身只屬模型性質,但現實中的價格競爭、環境保護等方面,也會頻繁出現類似情況。 單次發生的囚徒困境,和多次重複的囚徒困境結果不會一樣。 在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。 囚徒困境的主旨為,囚徒們雖然彼此合作,堅不吐實,可為全體帶來最佳利益(無罪開釋),但在資訊不明的情況下,因為出賣同伙可為自己帶來利益(縮短刑期),也因為同伙把自己招出來可為他帶來利益,因此彼此出賣雖違反最佳共同利益,反而是自己最大利益所在。但實際上,執法機構不可能設立如此情境來誘使所有囚徒招供,因為囚徒們必須考慮刑期以外之因素(出賣同伙會受到報復等),而無法完全以執法者所設立之利益(刑期)作考量。 目录 ?1 经典的囚徒困境 ?1.1 解說 ?2 固定局數的囚徒困境 ?3 一般形式 ?4 现实的例子 ?4.1 政治学例子:军备竞赛 ?4.2 经济学例子:关税战 ?4.3 商业例子:广告战 ?4.4 自行车赛例子 ?5 与囚徒困境相关的各事件 ?5.1 异想 ?5.2 “認罪減刑”不可行 ?5.3 公用品悲劇 ?6 重复的囚徒困境 ?6.1 学习心理学和博弈论 ?7 相关的博弈 ?7.1 封闭袋子交易 ?7.2 是敌是友? ?8 参见 ?9 注释 ?10 参看文献 ?11 外部链接 [编辑] 经典的囚徒困境 1950年,由就職於兰德公司的梅里尔·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式阐述,並命名为「囚徒困境」。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但沒有足够证据指控二人有罪。於是警方分开囚禁嫌疑犯,分别和二人见面,并向雙方提供以下相同的选择: ?若一人認罪並作证检控對方(相關術語稱「背叛」對方),而對方保持沉默,此人将即時獲释,沉默者将判監10年。 ?若二人都保持沉默(相關術語稱互相「合作」),则二人同樣判监半年。 ?若二人都互相检举(互相「背叛」),則二人同樣判監2年。 用表格概述如下: 甲沉默(合作) 甲認罪(背叛) 乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年 乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年 [编辑] 解說 如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方选择;而即使他们能交谈,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇: ?若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。 ?若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。 二人面對的情況一樣,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此,这場博弈中唯一可能達到的纳什均衡,就是雙方参与者都背叛對方,結果二人同樣服刑2年。 这場博弈的纳什均衡,顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,兩人都只會被判刑半年,总体利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛,结果二人判监均比合作為高,總體利益較合作為低。这就是“困境”所在。例子華麗地证明了:非零和博弈中,帕累托最优和纳什均衡是互相冲突的。 [编辑] 固定局數的囚徒困境 此条目或章节的语调或风格可能不適合百科全書的寫作方式。(2010年2月27日) 您可以通过改写来協助改善这篇条目。 请前往讨论页获取进一步的信息。 概括而言囚徒困境進行第一次后会出现以下两种情况: 甲在第一次中被乙指控,即會在第二次指乙,最终导致,甲即时获释,乙服刑10年或二人同服刑2年 双方均保持沉默,即会建立互信的關係,最终导致,二人同服刑半年。 但互信的关系并非牢不可破,这一点也可以被利用,即甲,
文档评论(0)