- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
eX-NIDS:利用大型语言模型的可解释网络入侵检测框架
PaulR.B.Houssel,SiamakLayeghy,PriyankaSingh,MariusPortmann
SchoolofInformationTechnologyandElectricalEngineering,UniversityofQueensland,Brisbane,4072,QLD,Australia
Abstract
本文介绍了eX-网络入侵检测系统,一个旨在通过利用大型语言模型(LLMs)提高基于流的网
络入侵检测系统(NIDS)可解释性的框架。在我们提出的框架中,被NIDS标记为恶意的流量会
首先通过一个名为提示增强器的模块进行处理。该模块从这些流量中提取上下文信息和与网络
安全威胁情报(CTI)相关的信息。该丰富且上下文特定的数据随后与LLM的输入提示集成,使
本其能够生成详细的解释和解读,说明为什么NIDS将此流量识别为恶意。我们将生成的解释与
译一个不将任何上下文信息纳入LLM输入提示的基础提示解释器基线进行了比较。我们的框架
中使用llama3和GPT-4模型进行定量评估,采用了针对自然语言解释的新颖评估方法,重点在
1于它们的准确性和一致性。结果显示增强后的LLMs能够生成准确且一致的解释,在NIDS中
v
1作为有价值的补充工具来解释恶意流量分类。使用增强提示比基础提示解释器提高了超过20%
4的性能。
2
6
1
.1.介绍
7
0
5大型语言模型(LLMs)已经革新了自然语言处理(NLP),在涉及非结构化数据的任务中
2
:表现出色,如文本生成、上下文理解和语言翻译。它们的卓越性能导致了在对话式AI、代码生
v
i成等领域的广泛应用。然而,在网络安全领域特别是网络入侵检测系统(NIDS)中应用LLMs
x
r仍然处于探索初期。
a
NIDS对于监控和分析网络流量以识别恶意活动和潜在的安全漏洞至关重要。当前系统依
赖于基于签名的方法与基于异常的技术的混合,前者检测已知攻击模式,后者识别与典型网络
行为的偏差。虽然基于深度学习的NIDS在基准数据集上展示了近乎完美的性能[1,2],但它们
通常缺乏可解释性[3]。这使得安全分析师难以解释、信任并采取行动应对检测到的威胁,突显了
这一需求。传统的可解释AI技术计算特征空间中每个特征的重要性分数,如SHapleyAdditive
exPlanations(SHAP)[4],存在局限性。它们需要对机器学习有深入的理解,仅关注统计异常,
并缺乏上下文洞察或外部知识来解释特征重要性。这是一个可能由LLMs处理的限制。尽管有
Emailaddresses:p.houssel@.au(MariusPortmann),siamak.layeghy@.au(MariusPortmann),
priyanka.singh@.au(MariusPortmann),marius@(MariusPortmann)
一些研究探索了使用变压器和LLMs进行威胁检测[5],但大多数通过将序列到序列输出替换为
分类头来适应这些模型。虽然适合分类任务,这种修改消除了模型提供与其预测相伴随解释的
能力,这是LLMs的关键优势。因此,LLMs在提高NIDS可解释性方面的潜力尚未得到充分
利用。Houssel等人最近的工作[6]表明,尽管由于性能和计算限制,LLMs可能不适合实时威
胁预测,但它们为增强NIDS警报的可解释性提供了有希望的机会。同一项工作表明,LLM的
解释能够从NetFlow数据中正确检索信息,并与特征值保持一致。然而,这些模型未能进行逻
辑推理并保证事实准确性。总体而言,这些大语言模型可以将NetFlow样本作为一个整体进行
分析,并正确识别流量类型(例如,域名系统查询或HTTP流量)。虽然这对网络运营商很有
用,但一个更简单的确定性算法也能达到同样的结果。此外,它难以将多个特征关联起来以准
您可能关注的文档
- ACT:通过合成数据生成及自适应训练弥合代码翻译差距-计算机科学-软件开发-代码翻译-自动训练框架.pdf
- 自适应贝叶斯单次量子传感-计算机科学-机器学习-量子传感-量子信道.pdf
- 通过补丁级图聚类和混合密度专家从整张幻灯片图像进行生存建模-计算机科学-深度学习-注意力机制-组织病理学.pdf
- MMS 播放器:一个用于手语角色参数化数据驱动动画的开源软件-计算机科学-合成手语动画-机器学习-开源软件.pdf
- 一种在大型语言模型(LLM)驱动的应用程序环境中衡量自动语音识别(ASR)模型性能的方法-计算机科学-机器学习-自动语音识别-人机交互.pdf
- 探索大型语言模型在分析和改进科学代码中的方法名称方面的应用-计算机科学- AI自动化-程序理解-大语言模型.pdf
- 具有噪声伪标签学习的鲁棒半监督医学图像分割使用扩散模型-计算机科学-半监督学习-扩散模型-医学图像分割.pdf
- 改进高度不平衡数据上的预测 使用开源合成数据过采样附和-计算机科学-预测建模-人工智能-合成数据.pdf
- GG-BBQ:德国性别偏见问答基准测试-计算机科学-大语言模型-自然语言处理.pdf
- 二部患者模态图学习与事件条件下的删失建模用于癌症生存预测-计算机科学-机器学习-监督数据-即插即用.pdf
- 2025至2030中国磷酸氯喹片(COVID19)行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030中国防腐木行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030中国能量营养棒行业产业运行态势及投资规划深度研究报告.docx
- 2025至2030中国机械通气行业项目调研及市场前景预测评估报告.docx
- 2025至2030特色小镇行业发展分析及投资风险与发展前景预测报告.docx
- 2025至2030全球及中国SIP客户端行业发展趋势分析与未来投资战略咨询研究报告.docx
- 2025至2030中国玻璃清洗机行业运营态势与投资前景调查研究报告.docx
- 2025至2030中国汽车平衡块行业发展现状及发展趋势与投资风险报告.docx
- 2025至2030中国互联网教育行业市场深度研究与战略咨询分析报告.docx
- 2025至2030中国直播电商行业运行分析有效策略与实施路径评估报告.docx
文档评论(0)