- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
经典的囚徒困境 1950年,由就職於兰德公司的梅里尔·弗勒德(Merrill Flood)和梅爾文·德雷希爾(Melvin Dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(Albert Tucker)以囚徒方式阐述,並命名为「囚徒困境」。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但沒有足够证据指控二人入罪。於是警方分开囚禁嫌疑犯,分别和二人见面,并向雙方提供以下相同的选择: 若一人認罪並作证检控對方(相關術語稱「背叛」對方),而對方保持沉默,此人将即時獲释,沉默者将判監10年。 若二人都保持沉默(相關術語稱互相「合作」),则二人同樣判监半年。 若二人都互相检举(互相「背叛」),則二人同樣判監2年。 用表格概述如下: 甲沉默(合作) 甲認罪(背叛) 乙沉默(合作) 二人同服刑半年 甲即時獲釋;乙服刑10年 乙認罪(背叛) 甲服刑10年;乙即時獲釋 二人同服刑2年 解說 如同博弈論的其他例證,囚徒困境假定每個參與者(即「囚徒」)都是利己的,即都尋求最大自身利益,而不關心另一參與者的利益。參與者某一策略所得利益,如果在任何情況下都比其他策略要低的話,此策略稱為「嚴格劣勢」,理性的參與者絕不會選擇。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方选择;而即使他们能交谈,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇: 若對方沉默、我背叛會讓我獲釋,所以會選擇背叛。 若對方背叛指控我,我也要指控對方才能得到較低的刑期,所以也是會選擇背叛。 二人面對的情況一樣,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此,这場博弈中唯一可能达到的纳什均衡,就是雙方参与者都背叛對方,結果二人同樣服刑2年。 这場博弈的纳什均衡,顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,兩人都只會被判刑半年,总体利益更高,結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設,二人均為理性的個人,且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛,结果二人判监均比合作為高,總體利益較合作為低。这就是“困境”所在。例子華麗地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 固定局數的囚徒困境 試想像囚徒困境的情況進行十次。我們可以合理地設想,如果囚徒第一次被對方指控,第二次這個囚徒也會指控對方。相反,如果第一次別人保持沉默,建立了互信的關係,你也會保持沉默,達致帕累托最优。當然,兩個囚徒都會有相似的想法,在第一局保持沉默,以期望建立互信關係,所以雙方都會保持沉默。第二局時,雙方亦應有相似的想法,繼續保持沉默,以期繼續在互信的情況下進行第三局,以致餘下的八局。 這種想法合理嗎?在第十局時,互信的關係明顯是没有意義的,因為十局已經完結,囚徒没有必要為維持互信的關係而沉默(没有第十一局),所以第十局囚徒一定會背叛對方的,理由和只有一局囚徒困境一樣。問題是,既然大家都知道在第十局,無論如何對方都會背叛自己的,你在第九局保持沉默也是没有意思的,要知道,保持沉默(友好關係)的原因是為了希望下一局別人保持沉默。所以第九局雙方都一定會背叛對方的。下一個問題是,雙方都有相同的想法,明知第九局對方會背叛自己,所以第八局保持沉默也是没有意思的,第七局亦然,如此類推,纳什均衡是十局都會互相背叛,建立互信關係是没有可能的。只有在囚徒困境的局數大家都不肯定的情況下,上述的推論才不會發生,才會出現互相保持沉默的現象。 一般形式 整理囚徒困境的基本博弈结构,可更清楚地分析囚徒困境。实验经济学常用這種博弈的一般形式分析各种论题。以下是實現一般形式的其中一例: 有两个参与者和一个庄家。参与者每人有一式两张卡片,各印有“合作”和“背叛”。参与者各把一张卡片文字面朝下,放在庄家面前。文字面朝下排除了參與者知道對方選擇的可能性1。然后,庄家翻开兩個参与者卡片,根據以下規則支付利益: 一人背叛、一人合作:背叛者得5分(背叛诱惑),合作者0分(受骗支付)。 二人都合作:各得3分(合作报酬)。 二人都背叛:各得1分(背叛惩罚)。 用支付矩阵表格展示支付如下(以红和蓝分别表示二参与者): 一般形式囚徒困境的支付矩阵 合作 背叛 合作 3, 3 0, 5 背叛 5, 0 1, 1 以“T、R、P、S”符号表示 合作 背叛 合作 R, R S, T 背叛 T, S P, P 以“胜-负”术语表示 合作 背叛 合作 胜-胜 大负-大胜 背叛 大胜-大负
有哪些信誉好的足球投注网站
文档评论(0)