采用多智能体强化学习的交通信号优化控制.pdfVIP

采用多智能体强化学习的交通信号优化控制.pdf

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
采用多智能体强化学习的交通信号优化控制

学兔兔 务I 訇 出 采用多智能体强化学习的交通信号优化控制 Implementing traffic signal optimal control by multiagent reinforcement learning 宋 炯。。金 钊 SONG Jiong。.JIN Zhao (1.云南交通职业技术学院。昆明6501 01;2.云南大学。昆明650091) 摘 要:在城市交通环境,交通流的正确预测是比较困难,因为多个十字路口,这使得预设的交通控制 模型之间的相互作用和纠缠在一起,不能在所有的交通情况下始终保持高性能的预测。考虑 到的强化学习的所具有的自主学习能力,本文提出了基于多智能体强化学习的交通信号控制方 法。没有预设的控制模型,多协作代理可以学习相应的实时交通状况下的最优控制策略。通过 实验结果证明了这种方法的可行性和有效性。 关键词:交通信号控制;多智能体强化学习;自主学习;多十字路口的城市交通;交通流量 中图分类号:TP1 81 文献标识码:A 文章编号:1 009-01 84(201 2)09(上)-001 3-04 Doi:1 0.3969/J.issn.1 009-01 34.201 2.9(I-).05 0 引言 实现智能交通信号控制是一种减少交通拥堵 和提高交通效率的低成本方法…。因为交通流量 具有随时变化和随机性的特点,尤其是在多十字 路口的城市交通环境,因此流量建模仍然是非常 困难的。一个预设的交通控制模型是不可能符合 所有的交通情况。所以有更多研究关注机器学习 的实时交通流量控制[2 。在所有机器学习的方法 中,强化学习受到更多的关注,因为其自主学习 的能力,使得能够智能感知不同的条件和自我自适 应调整控制策略,以符合交通条件。 虽然在参考文献[2]中提出了自适应减少时间 延迟的交通信号控制的Q学习方法,但只考虑了 一 个十字路口的情况。A.Salkham【3 提供了一个强 图1 由六个十字路口的城市交通网络构建的仿真环境 化学习交通控制优化框架,但对硬件基础设施依 赖较大。Li T【4 等学者提出了一种自适应动态规 然这些问题都受到关注,但都没有进一步详细讨 划方案实施多十字路口的交通信号智能控制,但 论和研究。 针对相互作用和相互影响的多交叉路口的情况却 在本文中,作者提出了一种多智能体强化学 没有进一步探讨。在参考文献[5~7]中,可以看到 习的多十字路口的交通信号控制模型。 到一些类似的研究。这些研究表明使用自主学习 首先,作者定义多十字路口的交通信号控制 的强化学习解决随时变化和随机性交通流量问题, 问题的多智能体的强化学习模型,其中包括状态 一 直是智能交通信号控制研究的重点之一 】。虽 空间、目标状态、行动和培训的事件,完整描述 收稿日期:2012-02-13 基金项目:云南省教育厅自然科学基金 (2010Y249) 作者简介:宋炯 (1967一),男,云南昆明人,高级工程师,副教授,硕士,研究方向为计算机软件工程、计算机网 络、人工智能、机器学习、智能交通和车载网络。

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档