博弈论复习分析和总结.docxVIP

下载本文档

0
0
约1.08万字
约 11页
2023-07-29 发布于四川
举报
版权申诉

博弈论复习分析和总结.docx

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第2章扩展式博弈与标准式博弈标准式：博弈过程以数字矩阵表示，矩阵两侧为参与者的不同的战略选择扩展式：博弈过程以树形图表示，树形图的每一树枝节代表了一种战略选择不确定事件：可能发生也可能不发生的事件相机战略：仅在不确定事件发生时才会采取的战略。在扩展式博弈中，只要博弈的一方在不知情的情况下决策，或者同时决策，我们就将其所有的选择都列在从一个节点出发的分支中，以此表示信息的不充分（标准式：博弈过程以数字矩阵表示，矩阵两侧为参与者的不同的战略选择，往往用于表达静态博弈扩展式：博弈过程以树形图表示,树形图的每一树枝节代丧了一种战略选择,往往用广表达动态博弈任何一个博介都可以表小成为标准式,也可以表小为扩展式）第3章占优战略与社会两难占优战略：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。占优战略均衡：如果博弈中的每位参与者都有占优战略，并且也实施其占优战略，我们就可以获得一个占优战略均衡。合作解：不管是通过协议还是其他形式的强制手段，只要博弈中的参与者能够保证自己履行协调后的战略，那么他们选择的战略及其收益就被称作合作解非合作解：占优战略均衡是一种非合作解，也就是说每位参与者都独立行动，而不是一起协商其战略。在非合作解中，每位参与者都会根据对方的战略选择自己的最优战略假定所有人都这样做那么每一位参方的战略选择自己的最优战略，假定所有人都这样做，那么每位参与者所选的战略就都是针对他人最优战略的最优反应式参与者在行动选择时无法达成约束性的协议的解集。）社会两难：社会两难是一种存在占优战略均衡的博弈，并且参与者采用这种均衡的战略收益比采用非均衡战略的收益要差。（当一个博弈存在占优战略时，人们就会理所当然地选择该战略而不是另一个。囚徒困境与垃圾处理博弈非常相似这些博弈都属于社会两难理博弈非常相似，这些博弈都属于社会两难。）第4章纳什均衡纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略, 即双方在给定的战略上不愿意改变自己的策略。 13、博弈有哪些分类方法，有哪些主要的类型？首先，可根据博弈方的行为逻辑，是否允许存在有约束力协议，分为非合作博弈和合作博弈两大类。其次，可以根据博弈方的理性层次，分为完全理性博弈和有限理性博弈两大类，有限理性博弈就是进化博弈。第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。第四是根据博弈问题的信息结构，根据博弈方是否都有关于得益和博弈过程的充分信息，分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信自、动态博弈和不完全信息动态博弈几类。第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。第六是根据博弈中博弈方的数量，可将博弈分为单人博弈、两人博弈和多人博弈。第七是根据博弈方策略的数量，分为有限博弈和无限博弈两类。 14、纯策略纳什均衡与混合策略纳什均衡的计算纯策略纳什均衡：划线法、箭头法混合策略纳什均衡：自己的策略选择不能被另一方预知或猜到，即在决策时利用随机性。选择每种策略的概率一定要恰好使对方无机可乘，即让对方无法通过有针对性的倾向某一策略而占上风。三、分析题：案例分析一一囚徒困境案例：警察把甲乙分开关押，并在提审时分别告之，如果你坦白而他不坦白，那么你将只判0 年，他将被判8年；如果你不坦白而他坦白，那么你判8年，他判。年；如果你们两人都坦白了，各判5年；如果你们两人都不坦白了，各判1年。分析：每个博弈方选择自己的策略时，虽然无法知道另一方的实际选择，但他却不能忽视另一方的选择对他自己的得益的影响，因此他应该考虑到另一方有两种可能的选择，并分别考虑自己相应的最佳策略。对囚徒A来说，囚徒B有坦白和不坦白两种可能的选择，假设囚徒B的选择是不坦白，则对囚徒A来说，不坦白得益为坦白得益为0,他应该选择坦白；假设囚徒B选择的是坦白，则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此，在此博弈中，无论囚徒B采取何种策略囚徒A的选择只有一种，即坦白，因为在另一方两种可能的情况下，坦白给自己带来的得益都是较大的。同样的道理，囚徒B 的唯一的选择也是坦白。所以最可能的结局：该博弈的最终结果是两博弈方同选择坦白策略。其支付矩阵如下：市E甲 S6 崛2乙 5, 5 0, 8 8, 0 1, 1 2、“囚徒的困境”的内在根源是什么？举出现实中囚徒的困境的具体例子。 “囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整体、个体利益共同的最优。简单地说，“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。现实中“囚