囚徒的困境.docVIP

下载本文档

14
0
约1.07万字
约 10页
2017-09-03 发布于江苏
举报
版权申诉

囚徒的困境.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

囚徒的困境

囚徒困境若囚徒们不互相合作，则无法脱离困境。囚徒困境是博弈论的非零和博弈中具代表性的例子，反映個人最佳選擇並非团体最佳選擇。雖然困境本身只屬模型性質，但現實中的價格競爭、環境保護等方面，也會頻繁出現類似情況。單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。囚徒困境的主旨為，囚徒們雖然彼此合作，堅不吐實，可為全體帶來最佳利益（無罪開釋），但在資訊不明的情況下，因為出賣同伙可為自己帶來利益（縮短刑期），也因為同伙把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。但實際上，執法機構不可能設立如此情境來誘使所有囚徒招供，因為囚徒們必須考慮刑期以外之因素（出賣同伙會受到報復等），而無法完全以執法者所設立之利益（刑期）作考量。目录 ?1 经典的囚徒困境 ?1.1 解說 ?2 固定局數的囚徒困境 ?3 一般形式 ?4 现实的例子 ?4.1 政治学例子：军备竞赛 ?4.2 经济学例子：关税战 ?4.3 商业例子：广告战 ?4.4 自行车赛例子 ?5 与囚徒困境相关的各事件 ?5.1 异想 ?5.2 “認罪減刑”不可行 ?5.3 公用品悲劇 ?6 重复的囚徒困境 ?6.1 学习心理学和博弈论 ?7 相关的博弈 ?7.1 封闭袋子交易 ?7.2 是敌是友? ?8 参见 ?9 注释 ?10 参看文献 ?11 外部链接 [编辑] 经典的囚徒困境 1950年，由就職於兰德公司的梅里尔·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式阐述，並命名为「囚徒困境」。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但沒有足够证据指控二人有罪。於是警方分开囚禁嫌疑犯，分别和二人见面，并向雙方提供以下相同的选择： ?若一人認罪並作证检控對方（相關術語稱「背叛」對方），而對方保持沉默，此人将即時獲释，沉默者将判監10年。 ?若二人都保持沉默（相關術語稱互相「合作」），则二人同樣判监半年。 ?若二人都互相检举（互相「背叛」），則二人同樣判監2年。用表格概述如下：甲沉默（合作）甲認罪（背叛）乙沉默（合作）二人同服刑半年甲即時獲釋；乙服刑10年乙認罪（背叛）甲服刑10年；乙即時獲釋二人同服刑2年 [编辑] 解說如同博弈論的其他例證，囚徒困境假定每個參與者（即「囚徒」）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為「嚴格劣勢」，理性的參與者絕不會選擇。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方选择；而即使他们能交谈，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇： ?若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。 ?若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。二人面對的情況一樣，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此，这場博弈中唯一可能達到的纳什均衡，就是雙方参与者都背叛對方，結果二人同樣服刑2年。这場博弈的纳什均衡，顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，兩人都只會被判刑半年，总体利益更高，結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛，结果二人判监均比合作為高，總體利益較合作為低。这就是“困境”所在。例子華麗地证明了：非零和博弈中，帕累托最优和纳什均衡是互相冲突的。 [编辑] 固定局數的囚徒困境此条目或章节的语调或风格可能不適合百科全書的寫作方式。（2010年2月27日）您可以通过改写来協助改善这篇条目。请前往讨论页获取进一步的信息。概括而言囚徒困境進行第一次后会出现以下两种情况：甲在第一次中被乙指控，即會在第二次指乙，最终导致，甲即时获释，乙服刑10年或二人同服刑2年双方均保持沉默，即会建立互信的關係，最终导致，二人同服刑半年。但互信的关系并非牢不可破，这一点也可以被利用，即甲，