- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
博弈论及其应用-混合策略纳什均衡
博弈论及其应用 ——完全信息静态博弈: 混合策略纳什均衡 混合策略纳什均衡 混合策略 混合策略纳什均衡 混合策略纳什均衡 混合策略 混合策略纳什均衡 混合策略 混合策略 混合策略:把不确定性引入纯战略,即参与者以一定的概率选择他的战略,比如网球比赛中,运动员以60%的概率发正手球,40%的概率发反手球。 混合策略 为什么采用“混合策略”? 考虑下面的博弈:扑克牌对色游戏 两个人参与这个游戏,从自己的扑克牌中抽出一张,一起翻开,如果颜色一样,甲输给乙一根火柴;如果颜色不一样,甲赢得乙一根火柴。不允许出大小鬼。描述这个博弈,寻找纳什均衡。 混合策略 混合策略 这个博弈“不存在”我们前面所讲的纳什均衡 在这个游戏中,重要的是猜测对方的出牌规律,同时避免对方猜到自己的出牌规律。也就是说,要尽量让对手迷失。这种随机化自己可选策略的做法,就是采取“混合策略”的思想。 局中人以一定的概率p选择红,以一定的概率1-p选择黑,则(p,1-p)概括了某个局中人所有的混合策略。可知这样的混合策略有无穷多个。两个局中人的策略组合有无穷多个 混合策略 混合策略 当参与人可以选择的策略比较多时(3个,4个,…),用一个字母就不够用了,需要用多个字母表示其混合策略 可以想象,混合策略情况下,参与人的支付不再是确定性的。需要用期望支付的概念 混合策略 混合策略 混合策略 举例 扑克牌对色游戏中,假设p=0.5,q=0.5,写出双方在这种情况下的期望支付 混合策略 举例:两人博弈的情况 混合策略 举例:两人博弈的情况 混合策略 举例:两人博弈的情况 类似的,可以写出参与人2的期望效用 混合战略 混合战略纳什均衡 纯战略纳什均衡 混合战略纳什均衡 对于某个参与人来说,最优混合战略是指期望效用最大化的混合战略 对于前面的例子:二人博弈来说: 混合战略纳什均衡 混合战略纳什均衡 混合战略纳什均衡 混合战略纳什均衡 混合战略纳什均衡 混合战略纳什均衡 报案(reporting a crime) n个人目睹一桩罪行,每个人都希望报警,但是都倾向于其他人打电话。特别的,假定能从报警中得到v单位的收益,而打电话的人需要付出c单位的成本,vc0。分析这个问题的纯战略NE和混合战略NE。 混合战略纳什均衡 分析: 参与人:n个 每个参与人的战略集:{打电话,不打电话} 效用:没有任何人打,所有人0支付; 打,v-c; 不打,但其他人至少有一个人打,v 纯战略NE 当只有两个参与人的时候(公共产品提供的斗鸡博弈)——两个NE n个人的时候:假设有m个人提供,m1 or m=1 n个NE 混合战略纳什均衡 混合战略NE 任何一个参与人i的期望效用函数: 假设i提供的概率为pi, 第i个参与人最大化自己的期望效用,得到 混合战略纳什均衡 由此, c/v1,因此,随着人数n的增加,p减小,即人越多,每个人选择报案的概率就会越小,如果n=1,则p=1 社会心理学与博弈分析 混合战略纳什均衡 几乎所有有限博弈都有有限奇数个纳什均衡 对每个参与人来讲,在构成混合战略均衡纯战略之间是无差异的,即带来的支付是无差异的 因此,寻找混合战略纳什均衡的方法除了优化方法,还有等值法 案例分析 有人要打网球吗?? 小结 混合策略的定义,含义 期望效用 混合策略纳什均衡: 定义 求解 含义 案例 Homework 1. Find all “mixed” strategy NE to a Prisoners’ Dilemma. Comment on any connection with dominant strategies. Homework 2. Find all mixed strategy NE to the football game shown below. * 张红霞 国民经济管理系 * The cliffhanger… 混合策略 期望效用 NE和最优反应 案例 混合策略博弈的性质 红 红 黑 黑 -1,1 1,-1 -1,1 1,-1 乙 甲 红 p 红 q 黑 1-q 黑 1-p -1,1 1,-1 -1,1 1,-1 乙 甲 硬币博弈 a1 b1 a2 b2 1,-1 -1, 1 1, -1 -1, 1 p (1-p) q (1-q) 各种战略组合及其概率 (a1,a2) (a1,b2) (b1,a2) (b1,b2) pq p(1-q) (1-p)(1-q) (1-p)q 期望效用 由上述混合战略纳什均衡的定义,以及混合战略的定义,可以得到: a1 b1 a2 b2 3,2 -1, 3 0, 0 -1, 1 社会福利博弈 q (1-
文档评论(0)