- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
基于安全强化学习的自动发电控制
AmrS.Mohamed,EmilyNguyen,andDeepaKundur
TheEdwardS.RogersSr.DepartmentofElectricalComputerEngineering,UniversityofToronto
Toronto,Ontario,Canada,M5S3G4
{{amr.mohamed,emily.nguyen}@mail.,dkundur@}utoronto.ca
摘要—随着对实施高级控制和决策算法以增强电力系统可RL有望通过采用一种结合了多种系统数据(如可
靠性、弹性和稳定性的需求日益增长,出现了一个关于使用机器再生能源预测)的数据驱动控制策略,为AGC动态
学习技术的安全性的重要问题。虽然这些方法可以应用于推导出优化提供益处,并能够对电力扰动做出动态响应[19],
更优的控制决策,但它们往往缺乏安全保证。本文提出了一种基[20]。它减少了对难以获得的精确系统模型的依赖[17],
于控制障碍函数的框架,以促进在电力系统控制应用中(特别是
在自动发电控制的背景下)强化学习代理的安全学习和部署。我[20],并支持复杂的安全约束条件[19]和高级调节支
们开发了必要的安全屏障和强化学习框架,以便建立对强化学习付结构[18]。本文重点讨论了一种基于集中式RL的
作为自动发电控制安全选项的信任|为未来的详细验证和应用研AGC方法,在这种方法中,RL代理可以补充或取代传
究奠定基础。统的集中式AGC控制器,并为未来应用多智能体RL
IndexTerms—安全强化学习,自适应通用控制,控制屏基分散式AGC系统提供了潜力。
障函数,CBF,深度强化学习在我们设计安全RL的方法中,我们引入了一种新
本的控制障碍函数(CBFs)的表述形式来保证AGC的安
译I.介绍全性,有效缓解了潜在的不安全的RL动作。我们通过
实验证明这种基于CBF的方法能够有效地防止学习过
中电网优化是电力系统研究的一个基本领域,由日益程中AGC故障,并使代理收敛到一个高度高效的AGC
1复杂的电力网络和对增强效率及可靠性的需求推动。不策略。据我们所知,这项研究是首次将具有正式安全性
v断推进电网优化方法的进展对于应对电力系统运行中保证的安全RL应用于AGC。下面,我们将制定障碍函
8的新兴挑战至关重要。机器学习领域的必威体育精装版进展促进了数,开发一种演员-评论家深度RL代理,并在两个区域
6电网优化的研究[1]。一种突出的机器学习方法是强化的线性化电力系统上实证验证该方法的安全性。我们在
8学习(RL),它涉及通过迭代试错交互训练智能体以学第五部分简要讨论了未来工作的必要计划。
7习最优行为。在电力系统的领域中,RL已被应用于多论文结构如下:第二节介绍了CBFs的背景。第三
1.个方面,包括需求响应、运行控制、经济调度、拥塞管节概述了在AGC的安全RL框架内整合CBFs和RL
7理[2],[3]以及网络安全[2],[4]。的方法论。第四节展示了结果,随后第五节给出了结论
0强化学习的一个关键优势是其能够适应动态、不确以及未来研究的方向。
5
2定的环境,使其成为不断变化的能源领域(包括需求响II.背景
:应引起的负荷转移、电气化和可再生能源整合)的理想
v选择。它在优化传统方法难以建模的复杂非线性系统的CBFs旨在建立一个安全集,该集合代表系统被认
i
x决策方面表现出色。为是安全的
您可能关注的文档
- 具有共享权重和注意力机制的 RESNET-CONFORMER 网络用于声音事件定位、检测和距离估计-计算机科学-声事件定位与检测-注意力机制-机器学习.pdf
- SmartAPS:用于运营管理的工具增强型 LLM-计算机科学-机器学习-人工智能-运筹学-人机交互.pdf
- 一语定级万物-计算机科学-自动语音评估-计算机辅助语言学习.pdf
- 分层扩散框架用于伪健康脑 MRI 修复以增强三维一致性-计算机科学-机器学习-扩散模型-健康图像修复.pdf
- 大型云机器人操作的联邦学习:机遇与挑战-计算机科学-机器学习-云计算机器人.pdf
- 多模态循环集成用于预测对自然电影的脑反应-计算机科学-机器学习-算法.pdf
- VeriMinder:缓解 NL2SQL 中的分析漏洞-计算机科学-机器学习-大语言模型-自然语言处理.pdf
- I2I - STRADA – 通过结构化推理代理从信息到洞见的数据分析-计算机科学-多智能体-代理系统.pdf
- 与物交谈:将大语言模型集成到物联网网络中-计算机科学-大语言模型-物联网-边缘计算.pdf
- ARCADE:一种混合 AI 环境下的 6G 网络 RAN 诊断方法论-计算机科学-人工智能-6G 网络.pdf
- 通过基于生成式人工智能的图像合成实现基于人工智能的皮肤病变分类器的公平性评估优化-计算机科学-深度学习-可信赖的人工智能-医疗影像.pdf
- TIPPY 的技术实现:药物发现实验室自动化的多代理架构和系统设计-计算机科学-AI 代理- 多智能体系统-微服务.pdf
- PinchBot:长周期可变形操作的引导扩散策略-计算机科学-人工智能-机器人.pdf
- 通过增强型用户面功能和分析优化超越 5G 网络中的边缘游戏切片-计算机科学-人工智能-云计算.pdf
- GenSelect: 一种生成最佳之 N 的方法-计算机科学-机器学习-生成奖励模型-数学推理.pdf
- CHAMP:一种用于自适应生物识别任务的可配置、热插拔边缘架构-计算机科学-自定义操作系统-人工智能.pdf
- 自适应重复以减轻 LLM 基础排序中的位置偏见-计算机科学-人工智能-大语言模型.pdf
- 共同的沉思:与机器合作者十年的数学发现-计算机科学-自动化猜想系统-数学思维-人工智能.pdf
文档评论(0)