恶意代码论文：恶意代码分类的研究与实现.doc

下载文档 降价啦

63
0
约6.89千字
约 8页
2017-09-27 发布于广西
举报
版权申诉
保障服务

恶意代码论文：恶意代码分类的研究与实现.doc

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

恶意代码论文：恶意代码分类的研究与实现【中文摘要】快速、准确地对恶意代码进行分类是防范恶意代码的关键之一,能够为检测、控制和清除恶意代码提供重要依据。目前,恶意代码的分类问题已经成为安全领域的研究热点之一,本文对此进行重点研究。现有的恶意代码分类方法存在不足。一是分类速度慢,无法及时处理反恶意程序公司日常所面临的海量样本,投入实际应用较少。二是扩展性差,一些方法利用反病毒软件对训练集进行分类,作为基准类别,导致这些方法无法识别未经过训练的类别。三是准确性低,其主要原因在于提取出的特征不足以反映样本的实际行为,或者所采用的分析技术自身的局限性。本文在深入分析恶意代码现有分析技术的基础上,通过对大量恶意代码进行分析,提出以样本运行行为序列为样本特征,构建恶意代码行为知识库,设计开发了恶意代码分类系统,并给出实验结果。主要完成了以下工作:1、恶意代码收集与行为分析,在此基础上设计了恶意代码自动行为分析系统。基于开源软件Zero Wine,设计了样本自动行为分析系统,生成样本行为分析报告。考虑到该软件在遇到部分加壳样本时,可能会出现分析异常的问题,在进行行为分析前,对样本进行了相应的脱壳和解密操作。2、特征提取和构建行为知识库。对样本集进行分析得到运行行为报告,提出以样本行为序列作为其特征。将所得到的样本行为信息添加到数据库,构建恶意代码行为知识库。3、基于聚类算法构建恶意代码的基准类别及其家族的原型特征,据此对恶意代码进行分类。聚类是指根据行为相似度确定恶意代码新的类别;而分类是指将恶意代码归入已知类别中。首先,对行为特征进行向量空间映射操作,将其映射到高维特征空间;其次,利用聚类算法生成基准类别,并构建家族原型特征,称之为基因码,即存在于恶意代码及其变种中的共同之处和普遍特征,用于标识恶意程序家族的信息;最后,基于家族基因码进行分类。4、引入增量分析方法,实现对家族基因码数据库进行更新,以增强系统的扩展性。某个时期生成的基因码数据库不可能适用太长时间,需要定期更新。传统的做法是将新增进来的训练样本集和以往学习过的部分或全部样本集中起来重新进行训练,产生新的基因码数据库。为避免重复学习和时空开销问题,引入增量分析方法,即对新样本进行分类后,对于未归类的新样本进行聚类分析,提取基因码并更新数据库,进而对这些样本进行分类。5、恶意代码分类系统的设计与实现。针对恶意代码家族的代码和行为具有很高相似性的特点,对相关的关键技术进行研究,设计并实现了恶意代码分类系统。6、对系统进行了准确性测试和算法对比测试。测试结果表明,该系统具有良好的准确性,达到预期结果。【英文摘要】Quick and accurate classification of malicious code is a key to prevent malware, for it is an important basis for detecting, controlling and removing malicious code. At present, the classification of malicious code has become one of hot topics in security field. This paper focuses on the classification of malicious code.There are some defects existing in classification methods of malicious code. Firstly, it is too slow to deal with the abound size of malware sets that anti-malware companies are confronted with. And little methods have been put into practical application. Secondly, the scaling ability is not good. Some approaches use anti-virus software to train the samples set as the benchmark category, resulting to such methods cannot identify untrained category. The third of defects is imprecise, either because it does not capture a sample抯 behavior well enough or because the limitations