- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于信息安全考虑的数据识别分析.doc
基于信息安全考虑的数据识别分析 [摘 要]数据识别技术,对于企业内网数据的有效处理和安全保护等方面意义重大,在当前大数据的环境下,对于数据识别技术的需求尤为突出。基于此种考虑,本文首先针对油田工业环境中的数据特征及数据安全状态展开了深入的分析,然后进一步在此基础之上,对如何切实推动数据识别技术的发展予以深入讨论。 [关键词]信息安全;数据识别;油田企业 doi:10.3969/j.issn.1673 - 0194.2016.14.108 [中图分类号]G203 [文献标识码]A [文章编号]1673-0194(2016)14-0-01 1 油田工业环境中的数据特征分析 在工业生产工作环境中,数据主要来源于管理和工业生产两个领域。管理领域的数据相对而言比较常规化,主要涉及人力资源等相关管理领域工作数据,但是随着科技的不断深入发展,大量生产流程中的设备状态数据纳入到企业数据环境之中,而这种趋势,在油田工业领域中更是尤为突出。油田生产工作过程中一贯以数据的庞大繁杂著称,数据用以反映生产过程中众多设备的状态。通过这些数据可以判断整个工作过程的安全水平,然后展开进一步的调整。 随着物联网相关技术的发展,更多的数据纳入油田工业环境之中,实时性和海量性成为其主要特征。对于实时性而言,油田工业环境之中,生产过程中的数据关系到诸多设备的工作状态及安全水平,因此,只有对其展开及时的识别才能妥善处置。而对于海量性而言,主要是考虑到油田工业领域中必然会引入的大数据技术,从客观上要求对这些数据展开及时的深入分析,发挥其既有价值。因此从这样的两个方面看,对数据展开必要的识别,是有效针对不同种类来源的数据展开及时分析的必然要求。 与此同时,从安全的角度看,数据识别同样意义重大。当前数据安全的解决方案,通常会从传输和存储两个方面展开,即在传输过程中通过各种类型的网关等来对传输数据实现过滤,或者面向存储状态的数据展开分析,来确定数据中是否夹杂有不安全的因素。此种安全分析工作方式在传统企业环境下,当数据量以及传输总量相对较少的时候能够十分有效地展开工作,但是随着数据量的不断增加,流媒体数据也开始涌入到工业生产环境之中,想要切实有效地对所有的数据展开分析,就显得较为困难。相关安全系统的计算能力不断得到挑战,必须采取必要的措施改善此种情况。 在这样的背景之下,如何实现有效的数据识别,就显得意义重大。良好的数据识别体系,能够帮助安全系统以及相关的大数据技术依据不同的数据特征展开区分,从而来决定为不同的数据群体提供不同安全级别的保障,也便于为大数据分析系统优化其数据材料,并且在最短时间内响应不同数据消费端的查询请求。 2 推动数据识别体系建设 数据识别服务于整个油田数据系统。数据识别工作展开的有效性,关系到整个企业局域网数据的安全水平,对于其他多个方面的数据信息处理工作也有不容忽视的重要价值。从目前数据识别技术的发展状况看,主要是基于数据特征的识别技术,但是随着工业环境中更多数据的涌入,基于数据生命周期的识别技术同样也是未来发展的主要特征。 对于基于特征的数据识别方法而言,具体包括两个阶段的工作,第一,元数据和样本数据的采集;第二,敏感数据数据的识别与分类。 在第一个阶段中,数据识别系统的主要工作任务是通过自动化的方式面向数据库、文件系统及传输过程展开对于数据的结构化与非结构化数据样本和元数据信息的采集。采集主要内容包括元数据信息(数据表和字段的名称、类型、注释信息等)、文件类型数据(在获取文件格式的基础上,采用自动化分词等相关技术将文件内容进行切割和合并,并且建立起对应的文件特征数据)。然后在这样的采集基础之上,对获取到的数据进行梳理和过滤,提升样本整体质量。 在第二阶段中,展开对于敏感数据数据的识别与分类。应用数据识别技术,对不同类型的数据进行甄别,确定其中的敏感数据,并对其进行甄别和分级分类,从而便于进行更具有针对性的数据安全保护工作。这一部分的工作,具体包括词库建立、敏感特征提取、敏感特征匹配以及敏感数据识别质量评估等几个方面。其中词库建立主要是对采集到的数据进行收集和整理,剔除其中的无价值词汇,获取到符合识别需求的词库。而敏感特征提取,则是在建立起词库的基础之上,对词库展开分析和识别,以相关人员作为主要的力量进行构建,并且随着人工智能的发展,相关技术也在逐步引入到该环节之中。敏感特征匹配主要是对分类和识别目标展开特征提炼,将目标数据采用分词技术进行分词处理,然后进一步将提取到的特征与词库进行匹配,依据匹配情况进行排序。最后,敏感数据识别质量评估主要对识别结果进行评价,包括对错误分类的进一步纠正和对于未能识别的敏感词的补充,完善词库。 除此以外,基于生命周期的数据识别也是未
文档评论(0)