基于关键字的交换内容过滤技术的研究与实现开题报告.docVIP

基于关键字的交换内容过滤技术的研究与实现开题报告.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关键字的交换内容过滤技术的研究与实现开题报告

开题题目:基于关键字的交换内容过滤技术的研究与实现 1、选题描述:包括选题的背景、依据和意义、研究目标、研究内容以及对国内外相关领域研究现状的分析(可附页) 选题背景、依据和意义: 进入21世纪以来,计算机在我国开始普及并迅速发展,在国家有关政策的积极鼓励推进下,我国的信息化建设获得了巨大的成就。随着互联网的不断快速发展,信息个体之间的互联互通和信息共享已经成为人们迫切需要解决的问题,企事业单位、政府和军队等部门内部积累了大量的基础数据。但是,出于内外网和不对等区域之间数据交换安全性问题的考虑,这些部门无法实时和充分地利用这些基础数据作为信息化建设应用扩展,因而只能相互独立、数据分散地形成一个个“信息孤岛”、“数据孤岛”,严重影响了其信息化建设的进一步发展,也为信息化工作的开展带来了不便。此外,因病毒的疯狂肆虐、黑客日益猖獗、软件本身漏洞和设计缺陷而导致的泄密事件也越来越多,对党政机关、军队等单位的信息安全构成了极大的威胁。 然而,传统的技术手段很难兼顾安全隔离和信息交换两者的需求,更缺乏对信息安全的严格审查,极易导致攻击代码的流入和重要信息的泄漏。简单的物理隔离、网闸技术等都不能从根本上解决问题,并且缺少对进程的交换数据中敏感的、涉密的信息进行实时的过滤防护。随之带来了严重的安全隐患。 安全、高效的数据交换是当前企事业单位、各级政府部门和军队信息化建设进一步发展的核心和关键:随着计算机网络和分布式系统规模的不断扩大,网络硬件平台和操作系统与网络协议之间的异构性越来越明显,不同的应用平台与分布式系统形成的一个个“信息孤岛”。如何实现企业的分布式系统之间可靠的、高效的、实时的跨平台数据传输,使应用软件能够平滑地运行于不同平台上是目前政府和军队建设、企业生存和发展急需解决的问题。然而,不同政务部门、不同级别专网、不同应用平台之间的信息交换存在着严重的安全隐患,极易导致攻击代码的流入和重要信息的泄漏。因此,安全、高效的进行数据交换是目前迫切需要解决的问题。 在此背景下,利用可控单向双通道通信、身份认证、访问控制、交换任务定制、敏感信息过滤和交换行为动态监管等技术,完成在可管可控条件下完成基于行为监管的实时的、高效的、安全的文件交换系统就显得十分必要。 由于不同部门、不同应用平台和不同密级的信息系统之间的数据安全传输问题的研究和解决变得尤为重要,如何来确保信息系统之间所交换信息的安全性,尤其是对于庞杂的文本类(.txt/.doc/.docx/.rtf/.pdf/.excel/.ppt等)信息,如何有效地组织和管理这些需要发送的信息,并快速、准确、全面地为数据安全交换系统从中检测且过滤出这些敏感的以及不符合要求的信息,是整个系统能否确保安全交换的关键技术之一。 传统的过滤只能支持少量的格式,主要是简单的TXT文本,并且笼统地将数据过滤问题归结为某一类过滤,已经不能满足当前信息发展的需要,而作为一个成熟的、全面的交换系统,我们必须更加全面地对可能出现敏感信息的文件进行严格过滤,从文件大小、类型和内容过滤等方面,更加细粒度定制过滤交换数据以确保降低通过交换系统传输的文件出现失泄密情况的可能性。因此为了满足用户日益增长的安全需求,对信息系统需要传送的数据进行敏感信息、涉密信息检测和过滤的技术研究和实现就具有十分重要的意义。信息系统交换数据内容中敏感成分检测和过滤模块的设计与实现是系统高效安全运行的重要保证。 研究目标、研究内容: 由于安全交换系统中传输的文件可能包含敏感或涉密信息,因此,在文件发送之前在发送方进行简单的敏感信息过滤是十分必要的。 敏感信息过滤主要针对文本类文件(.txt/.doc/.docx/.rtf等)携带的内容进行扫描过滤。保证交换的内容符合安全交换系统中的定制策略。我采用的基于内容的敏感信息过滤方式,主要包括以下四个过程: (1)建立用户需求模板; (2)提取待过滤文本内容的特征向量; (3)待过滤文本与用户需求的匹配(过滤过程); (4)通信信息反馈,改进需求模板。 具体实现原理如下: (1)待过滤文本的特征向量表示 任一篇文本都可用关键词表示成一个n维向量。设文本的关键词为,表示文本中的第个关键词,其对应的词频向量为,词频定义为关键词在文本中出现的次数,若关键词在文本中没有出现,则为0。定义文本对应的权重向量为,其中定义为关键词在文本中的权重,即关键词文本的主题内容的贡献程度。 关键词权重函数: 其中:为关键词的段落频率;1表示关键词的词长;是比例因子;当关键词位于段首、段尾和结论句子时,可根据需要赋予一个小于1的值,否则,=0。 (2)用户模板的向量表示 用户模板即用户的需求模型,用于表达用户对于信息的具体需求,对于不同的主题需求,可用不同的向量表示。 用户模板的向量表示有两种方式,第一种方式与(1)中文本向量

文档评论(0)

wnqwwy20 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7014141164000003

1亿VIP精品文档

相关文档