不完备知识的博弈问题和博弈自动机的研究.pdfVIP

下载本文档

4
0
约5.33千字
约 4页
2017-08-14 发布于安徽
举报
版权申诉

不完备知识的博弈问题和博弈自动机的研究.pdf

1、本文档共4页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

2002中国控制与丧策学术年会论文集不完备知识的博弈问题及博弈自动机的研究林元庆，陈融生 (梧州大学管理学院．福建福州350002) 捕要：首先讨论两十著名的学习摸型，赫詹提出一十新的学习模型——自连直博彝学习模型，并建立了博彝自耐机，在一十计算机{匕曲博弈环境中确定博彝曲均衡解．博弈自甘机的实驻结果表明该学习模型的学习能力极强，具有广阚的应用前量．关键词，纳什墙衡；不完备知识的博齐}博弈学习模型 I标准博弈理论的基本假设与方法纳什均衡的概念是现代博弈论的基础和核心，基于纳什均衡定义建立起来的纳什均衡分析方法获得了广泛的应用。纳什均衡理论即标准的博弈理论一般要对博弈舶参与者作两个基本假设：他们都是理性的和他们都是智能的“。。所谓博弈参与者是理性的，是指参与者应按使自已的期望得益最大化的方式进行决策；所谓博弈参与者是智能的，是指博弈参与者拥有关于博弈结构以及其它参与者的策略和得益的共同知识。由于参与者拥有完备的博弈知识，因而博弈的参与者可以具备完美的理性思维能力，决策者能相互了解所有可能的选择并且理解这些选择的后果，从而成为一个智能的博弈参与者。总之，参与者的行动理性和知识完备性是标准博弈论最重要的两个假设。基于上述两个基本假设而发展起来的博奔均衡分析，可以采用内省式或一次性的推理方法求出博弈的均衡解n]。博奔分析中经常使用的反应函数法集中体现了这一处理方法的特征，基于行动理性的假设，对其他参与者的任意一种行动选择，他使用最优化方法确定出自已的最优荣略反应关系；基于共同知识的假设，每一方完全相互了解其他方的最优反应策略。因此，他可以直接将其他方的最优反应策略关系代人自己的最优反应策略关系中，通过联立求出博弈的均衡解，完成博弈分析。可见，标准的博奔分析采用的是演绎推理的分析方法，这种分析方法在各种博弈问题的研究中获得了巨大的成功。 2不完备知识的博弈问题的特征及其研究方法在纳什均衡论获得极大成功之时，人们开始思考作为纳什均衡概念的基本假设的合理性问题。从现实上考虑这两个基本假设常常不会得到满足，尤其是关于共同知识(或智能性)的假设更是难以实现。所谓不完备知识的博弈，是指博弈中的参与者是理性的但非智能性的，亦即参与者具有优化自己得益的能力，能够采取使自己得益极大化的理性行动，但是他在选择行动时并不了解其他参与者的得益函数及其策略的选择机制。也可以说，不完备知识的博奔是参与者之间关于搏弈结构知识不对称的博弈问题，不完备知识博弈的参与者进行决策时，缺乏关于基金项目：国家自然科学基金项目；福建省教育厅基金项日(JA00070S) 727 其他参与者得益函数的知识，无法使用这些知识来辅助自己的决策，与不完全信息的博弈问题相比，求解不完备知识博弈问题时能使用的知识更少，难度更大。因此必须探索新的研究思路，采用新的研究方法。对于不完备知识的博弈问题，分析方法上存在的最大障碍是：决策者岿须在无法拥有对其他参与者行动的一致预期条件下选择自己的行动。在这种情况下，博弈参与者关于策略调整的规则不可能简单地沿用完备知识情况下的最优性原则，也不可能采用演绎推理方式一次性地将自已的均衡策略调整到位。不完备知识博奔分析的基本特征是：博奔参与者不需要了解其他博弈方得益函数的结构及其策略调整规律，只通过观察其他方实际的策略行动来构造自己策略的动态调整关系，在决策知识不完备的条件下通过学习实现完备知识意义下的纳什均衡。不完备知识博弈问题的研究目标是：发展出一个由认知能力的学习机制所支持的策略动态演化规律，研究该策略演变结果与完备知识条件下纳什均衡的一致性问题。从上面讨论可知，不完备知识的博弈分析要运用动态的而非静态的数学模型进行研究。由于经济博弈问题的复杂性，相应的动态模型往往是非线性的，对于非线性动态的经济模型，必须更多地采用计算机模拟实验的研究方法。综上所述，对于不完备知识博弈问题的研究可采用如下的研究路线和方法：根据博弈问题的背景和条件，设计不同的策略行为的调整模式，用计算机模拟方法，观察策略演化过程的特征，分析和比较其策略学习能力的高低，从而探求一种可以普遍使用的