- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
VLAI:基于RoBERTa的自动漏洞严重性分类模型
CédricBonhomme
ComputerIncidentResponseCenterLuxembourg
cedric.bonhomme@circl.lu[57B7A70D]
AlexandreDulaunoy
ComputerIncidentResponseCenterLuxembourg
alexandre.dulaunoy@circl.lu[44E6CBCD]
本2025-09-25
译
中摘要
1本文介绍了VLAI,一种基于变压器的模型,可直接从文本描述预测软件漏洞的严重程度。基
v
7于RoBERTa构建,VLAI在超过600,000个真实世界漏洞上进行了微调,并实现了超过82%的
0准确性来预测严重性类别,从而实现比手动CVSS评分更快且更一致的分类。该模型和数据集
6
3是开源的,并已集成到Vulnerability-Lookup服务中。
0
.
7
0主题:测量漏洞,利用或利用行为,漏洞管理的决策科学
5
2
:
v1介绍
i
x
r每年都会披露数千个新的软件漏洞,最初通常仅有简短的文字描述而没有官方严重性评分。安
a
全专家随后会使用通用漏洞评分系统(CVSS)等标准对这些漏洞进行分析并分配严重性等级。然而
这种手动评估过程可能需要数天时间,导致防御者在缺乏明确指导的情况下必须优先处理漏洞的关
键缺口。为填补这一空白,我们提出了VLAI(漏洞查询AI)——一个能直接根据描述预测漏洞严重
性的自然语言处理模型,在官方评分发布前提供预估结果。我们的方法采用经过微调的RoBERTa
变换器[10]对漏洞描述进行严重性分类,使安全分析师仅凭文本描述即可立即获得估算的严重等
级(即”VLAI分数”)。整个解决方案开源并集成到Vulnerability-Lookup服务中,为社区提供及时
的严重性预估和持续改进的模型。
2相关工作
早期自动评估漏洞严重性的工作使用了经典自然语言处理和机器学习技术。例如,统计模型被
训练用于根据漏洞描述预测CVSS指标或得分,取得不同程度的成功。深度学习的必威体育精装版进展使得更
准确的预测成为可能:Shahid等人(2021)[13]使用基于BERT的分类器(在一个名为CVSS-BERT
1
VLAI:基于RoBERTa的自动化漏洞严重性分类模型
的系统中)从描述中确定完整的CVSS向量,并报告计算出的严重性得分非常接近人类专家分配的
实际得分。行业从业者也对这一问题表现出兴趣;例如,PRIOn开发了自然语言处理模型来预测文
本中的CVSS基础分数和向量,指出官方评分延迟以及需要更快的风险评估需求。我们的工作沿袭
了这条研究路线,在一个更大规模的漏洞综合数据集上微调了一个基于Transformer的模型,并且
据我们所知,这是我们首次将此类模型开放并持续更新地集成到公共漏洞查询服务中的部署之一。
最近的研究也探索了语义相似性技术在结构化漏洞分类中的应用。Kota等人[9]提出了一种新
方法,使用跨编码器架构从CVE描述中预测CWE标识符。他们的研究利用MITRECWE分类
法的层次结构,并为CWE树的每一层训练单独的跨编码器模型。通过将这些模型与二元分类器相
结合,他们在近14,000个CVE条目上实现了72.1%的整体测试准确率和0.735的宏平均F1分
数。这项工作证明了语
您可能关注的文档
- 面向开放无线电接入网络(ORAN)的向量、图形和混合检索增强生成(RAG)管道基准测试-计算机科学-生成式人工智能-大语言模型-知识图谱-检索增强生成.pdf
- RECA-PD-一种稳健可解释的基于跨注意力的语音帕金森病分类方法-计算机科学-可解释的人工智能-语音分类.pdf
- 通过偏好优化学习翻译模糊术语-计算机科学-机器翻译-机器学习.pdf
- 手术前后舌癌的发音清晰度和变异性-计算机科学-机器学习-语音处理.pdf
- 多利益相关方驱动的推荐系统评估指标协同设计方法在数字档案中的应用-计算机科学-推荐系统-数字档案.pdf
- ACE-使用经过验证的大语言模型重构进行自动化技术债务修复-计算机科学-软件工程-大语言模型-AI助手.pdf
- PhenoBench-细胞表型分析的全面基准测试-计算机科学-数字病理学-基础模型.pdf
- 多模态对齐与交叉注意 GRU 用于细粒度视频理解-计算机科学-大型语言模型-多模态.pdf
- 三支一扶模拟题库附完整答案详解【考点梳理】.docx
- 2025年三支一扶练习题含答案详解(考试直接用).docx
最近下载
- 数字水务智慧水务整体解决方案.docx VIP
- 高中物理力学探究活动设计.doc VIP
- 温州大学432统计学2020---2021年考研专业课初试真题.pdf VIP
- 海底捞绩效考核海底捞绩效考核.doc
- 海南大宗商品交易所.pptx VIP
- 2020年温州大学考研真题432统计学(2020年) .pdf VIP
- 石河子大学2023-2024学年第1学期《宏观经济学》期末考试试卷(A卷)附标准答案.docx
- 2025届全国各地高三模拟试题分类精编01集合与常用逻辑用语学生版.pdf VIP
- 储能系统并网发电启动试运行方案.pdf VIP
- 食品饮料行业深度报告:社会减糖大势所趋,明星产品呼之欲出-241114-东北证券-56页.pdf VIP
文档评论(0)