- 1、本文档共105页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高 级 运 筹 学 周 晶 Tel jzhou@nju.edu.cn 博弈论 决策无处不在 工作,即便只是社交生活,也可以看做是一个永无止息的决策过程; 通常人们的决策面临两种决策环境:比较伐木工人和一个将军的决策会有什么区别: 伐木工人的工作环境是中立的,没有对抗; 而将军的任何一种行动都会遭遇对手的抵抗; 研究前者的方法是决策论 研究后者的是博弈论 失火了,你往哪个门跑? 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而受困;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择? 失火了,你往哪个门跑? 这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你选择结果的代价或收益——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 什么叫博弈? 博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。 在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。 GAMES Prisoner’s Dilemma 囚徒困境 Game Setup The Game: Two people have been arrested separately, and are held in separate cells. They are not allowed to communicate with each other at all. Each prisoner is told the following: We have arrested you and another person for committing this crime together. If you both confess, we will reward your assistance to us, by sentencing you both lightly: 8 years in prison. If you confess, and the other person does not, we will show our appreciation to you by letting you go. We will then use your testimony (证词)to put the other person in prison for 10 years. If you both don’t confess, we will not be able to convict you, but we will be able to hold you here and make you as uncomfortable as we can for 1 year. If you don‘t confess, and the other person does, that person’s testimony (证词)will be used to put you in prison for 10 years; your accomplice (同谋)will go free in exchange for the testimony. Each of you is being given the same deal. Think about it. GAMES -- an example Prisoner’s Dilemma 囚徒困境的例子 A. W. Tucker的囚犯困境(Prisoner‘s Dilemma): 囚徒B 囚徒困境说明了什么 在(坦白、坦白)这个组合中,两囚徒A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡。 囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个攻守
文档评论(0)