第四章_对策论.pptVIP

下载本文档

16
0
约8.72千字
约 81页
2016-04-01 发布于湖北
举报
版权申诉

第四章_对策论.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四章_对策论.ppt

方法3：方程组法由定理3知，求矩阵对策的解等价于求解不等式方程组（1），（2）。又由定理4和5知，若最优策略中的均不为0，则可将以上的两个不等式组的求解问题转化为下面两个方程组的求解问题：注：此方法要求均不为0，所以，当最优策略的某些分量实际为0时，以上两个方程组可能无解。这说明此方法在实际应用中有一定的局限性。特别：对2×2的矩阵，若局中人的赢得矩阵没有鞍点时，各局中人的最优策略中的都大于0。即对于这种问题，是可以采用方程组法求解的。例：求解矩阵对策G，其中A为解：利用优势原则，化简矩阵：因为a4优超于a1，a3优超于a2，所以化简为又因为b1优超于b3，b2优超于b4,b5，所以化简为又因为a1优超于a3，化简为容易看出矩阵A3没有鞍点，所以可以用方程组法解之。对应的方程组为：求解，得所以，以矩阵A为赢得矩阵的对策的一个解为例（齐王与田忌赛马）这个问题中齐王和田忌各自拥有的策略为： S1={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} S2={(上中下),(上下中),(中上下),(中下上),(下中上),(下上中)} 则对应的齐王的赢得矩阵为解：易知齐王的赢得矩阵没有鞍点，即没有最优纯策略设齐王和田忌的最优混合策略分别为由于齐王和田忌对策略集中的所有策略都有可能选择，所以，可设求解方程组和得方法4：线性规划方法由定理4知，求解矩阵对策可等价于求解互为对偶的线性规划问题（P）和（D）。在问题（P）中，令则问题（P）变为上述问题等价于同理，若令问题（D）等价于算例解得，最优策略为（1/3，0，2/3）和（1/3，0，2/3），最优值为7/3。 Nash 均衡对前面所述的二人有限零和博弈，其中的均衡解就是Nash 均衡。下面，针对一般的n人博弈，给出Nash均衡的定义。博弈的标准式：称叫做博弈的标准式，其中，Si为第i个局中人的策略集；是每个局中人选定某一策略时形成的局势；是相应于该局势的第i个局中人的支付函数； Nash均衡：在有n个局中人的标准式中，如果局势满足：对每一个局中人i，是至少不劣于他针对其他n-1个局中人所选策略的最优反应策略，则称局势是该博弈的一个 Nash均衡，即对任意的，有或是最优化问题的解。结论：在任何非合作有限博弈中，都至少存在一个Nash均衡。定理2: 则为对策G的解的充要条件为：对任意的i=1,2,…,m;j=1,2,…,n,有证明：设为对策G的解，则由定理1，成立因为纯策略是混合策略的特例，所以，（*）成立。反之，若（*）成立，则定理2说明：要验证为对策G的解时，只需要对上式给出的有限个（m×n）不等式进行验证即可，大大简化了验证过程。如此，便有了下面的等价定理－定理3 定理2得证。定理3: 则为：存在数v，使得为对策G的解的充要条件分别为不等式组(1),(2)的解, 且v=VG 定理4:任一矩阵对策G，一定存在混和策略意义下的解。证明:由定理2知，只需证明存在使得（*）式成立。所以，考虑如下规划问题易知，规划问题（P）和（D）互为对偶问题，且分别为（P）和（D）的一个可行解。由对偶定理知，他们都存在最优解，且最优目标值相等。即，存在和使得对任意的i=1,2,…,m;j=1,2,…,n有或又由得所以,(*)得证。定理5:设是矩阵对策G的解，v=VG，则证明:由有又因为所以，当时，必有当时，必有同理，可证（2），（4）。优超（优势原则）算例简化简化第四节混和策略的解法方法1：图解法　　以　　分别表示局中人　的第1、2纯策略；　　　表示局中人　的第1、2、3个纯策略。　　设局中人　采用混合策略　　　　　　，这里　　　　，当　　　代表纯策略　；　　代表纯策略　。　　若局中人采用纯策略　，当　　时，局中上人A获得的期望支付为　，当时，局中人A获得的期望支付为，连接直线　，则线段上点的纵坐标表示局中人　采用混合策略　　，而局中人　采用纯策略　时的期望支付。　同样 ,　和　上点的纵坐标分别表示局中人　采用混合策略，而局中人　采用纯策略　和　时的期望支付。 a b c d f e x 1-x 局中人A 局中人B 图　4-1 　　对于局中人　的每一个混合策略　，他至少得到三条直线在处纵坐标的最小值，即图4-1中的粗折线表示这个最小值函数。　　局中人　希望选择一个　，使上面这个最小值