- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
多智能体强化学习在自主网络安全中的通信学习
FAIZANCONTRACTOR,LILI,RANWAALMALLAH
ElectricalandComputerEngineeringDepartment,RoyalMilitaryCollegeofCanada,Kingston,Ontario,Canada
DefenceResearchandDevelopmentCanada,Ottawa,Ontario,Canada
E-MAIL:faizan.contractor@,li.li2@ecn.forces.gc.ca,ranwa.al-mallah@polymtl.ca
本Abstract:(MARL)训练的合作代理人可以通过协调其行动并共同应
译在部分可观察环境中的合作多智能体强化学习中,流行对多阶段网络防御操作中的威胁来提高网络安全效果。然
中的方法通常允许代理在执行过程中独立行动,这可能会限制而,在网络环境中,可能需要大量的信息以确保有效的决
1训练策略的协调效果。然而,通过共享已知或疑似正在进行策制定。事实上,人类蓝队进行检测分析和对策所需的信
v的威胁等信息,有效的沟通可以改善网络战空间中的决策制息量往往受到网络运营中心的严格限制,以防信息过载。
8
5定。我们提出了一种游戏设计,在这种设计中,防御代理通过因此,在训练MARLACD代理人时,减少代理人在观测
6
4在网络操作研究健身房中玩训练游戏来学习交流并防御迫在空间中所需的大量信息至关重要,这有助于促进培训、提
1眉睫的网络威胁,使用了适应于网络作战环境的可微互代理高培训速度,并在执行过程中降低信息成本。在这项工作
.
7学习算法。这些自主智能体所学得的战术策略类似于人类专中,我们应用了智能体间的通信以避免所有智能体拥有一
0
5家在应对事件以避免网络威胁时的策略。此外,代理在学习个单一的大观察空间。这使得问题空间可以被分解为多个
2其防御战术策略的同时也同时学会了成本最小化的通信信息。ACD智能体各自负责的小区域。此外,在MARL中实现的
:
vKeywords:智能体间通信允许代理人在训练和执行阶段共享信息,从
i
x而形成更为稳健和协调的防御策略[5]。这种情况类似于人
r
a协调;沟通;学习沟通;网络安全;网络防御;自主网络防御类专家在应对事件响应时尝试避免网络威胁所做的工作。
这项工作的贡献包括:
1.介绍
•具有代理间通信能力的MARL算法在ACD中的一种
新应用,使用了为网络操作适应的可微分代理间学习
近年来,自主代理技术在各种应用领域[1]的迅速发
(DIAL)算法[6]
展推动了对自主网络防御(ACD)代理人的实验研究,旨
在实现机器速度下的网络安全操作扩展性。ACD代理人•使用最少的单比特代理间通信消息的首个MARL
采用了深度强化学习(DRL)技术,类似于为其他应用程序ACD代理,其表现优于需要全局状态信息的代理。
开发的代理人[2][7]。他们是预期能够自动学会及时应对
网络系统中敌对活动采取适当战术行动的决策代理人,如•在日益复杂的场景中对通信代理的行为和性能进行评
企业网络和联网工业系统[3]。鉴于网络安全的复杂性,通估,并在一个模拟的真实环境中,即网络作战研究健
常会考虑多个合作防御代理人的使用,这些被称为蓝队代身房(CybORG)的企业网络中展示这种方法的实际
理人。
您可能关注的文档
- Dvoř 阿克—戴尔—格罗赫—拉坦定理通过渐近论证-计算机科学-机器学习-线性代数-算法.pdf
- 2024结构工程师过关检测试卷推荐附答案详解.docx
- 2024结构工程师过关检测试卷含答案详解(满分必刷).docx
- 培训公司教师备课规章.doc
- 2025年青海省西宁市行政职业能力测验题库一套.docx
- 2025年青海省西宁市行政职业能力测验模拟试题必考题.docx
- 2024结构工程师过关检测试卷含完整答案详解(网校专用).docx
- 2024结构工程师过关检测试卷及答案详解【考点梳理】.docx
- 2025年青海省西宁市行政职业能力测验模拟试题完整版.docx
- 2024结构工程师过关检测试卷附参考答案详解(预热题).docx
- 2024结构工程师过关检测试卷附参考答案详解(预热题).docx
- 2024结构工程师过关检测试卷含答案详解(研优卷).docx
- 2024结构工程师过关检测试卷含答案详解【能力提升】.docx
- 2025年青海省西宁市选调生考试(公共基础知识)综合能力测试题及答案一套.docx
- 2025年青海省西宁市行政职业能力测验题库带答案.docx
- 大学生2025年《面试》个人介绍 (8份)_61.docx
- 2025年青海省西宁市行政职业能力测验题库必威体育精装版.docx
- 2024结构工程师过关检测试卷及答案详解【全优】.docx
- 2024结构工程师过关检测试卷及完整答案详解【各地真题】.docx
- 2024结构工程师试题(名师推荐)附答案详解.docx
文档评论(0)