基于数据挖掘的数字档案信息管理探讨.docVIP

基于数据挖掘的数字档案信息管理探讨.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于数据挖掘的数字档案信息管理探讨.doc

基于数据挖掘的数字档案信息管理探讨   摘要:档案管理工作是许多机构的基础管理工作之一,而随着数字化进程的加速,许多机构依据自身的需要已建立起了相对完善的数字档案信息管理平台,为自身的档案管理和利用提供了方便。作为信息技术发展的重要成果,数据挖掘技术在数字档案信息管理中也得到了广泛的普及,对推动档案信息管理的进步起着重要的作用。本文从数据挖掘的定义和技术方法出发,总结了其于数字档案信息管理中的应用模式和重要意义。   关键词:数据挖掘 数字档案 信息管理   中图分类号:TP3 文献标识码:A 文章编号:1007-9416(2016)05-0000-00   随着科技的发展和计算机技术的日渐成熟,人类已经进入了信息化时代,这使得人们生活和工作的方方面面都结束了传统的重复性的工作模式,变得更加便捷。在档案信息管理工作中,由于其工作内容相对繁杂,数据量相对较大,因此,计算机技术的应用大大改进了以往的工作模式,满足了信息的共享性、时效性和便捷性等多种特征。数据挖掘作为档案信息管理工作的重要信息技术之一,具有其自身独特的功能和地位。   1数据挖掘的定义   随着数据学科的兴起,越来越多的科学家针对数据挖掘等技术进行了深入的研究,现在,数据挖掘已经成为一个专门的学术领域,横跨多个学科,涵盖了统计学、数学、机器学习和数据库等多方面内容。从普遍意义上而言,数据挖掘就是从包含大量模糊、随机、有噪声的数据中通过一定的技术手段进行识别,将有效的、新颖的、或者潜在有用的数据进行集中处理,进而形成可以理解的知识。在实际应用中,数据挖掘往往通过各种分析工具的利用,从海量的数据中发掘模型和数据之间的关系,并可以据此作出一定的预测。   2数据挖掘技术方法   数据挖掘技术的方法有很多,主要包括:   (1)分析方法:主要包括统计分析方法,诸如回归分析和时间序列分析、多元分析等。其中,回归分析针对自变量和因变量及其之间的变化关系进行分析;时间序列分析利用时间序列模型进行相应的分析。   (2)决策树:在信息理论的基础上对数据进行分类,在建立决策树的同时,也生成了相应的规则,并可以据此预测数据。主要包括分类及回归树法,卡方自动交互探测法等等。   (3)神经网络:即通过模拟人脑的思考结构进行一定的数据分析,具有一定的自我学习功能,并以此调整对应的参数,借以得到有关的资料。该方法可以对大量复杂的数据进行分析。   (4)相关规则:主要进行关联分析,按照“如果――则”的逻辑进行有关数据资料的细分。   (5)数据可视化:通过一定的、合适的图形等进行数据的展现和表示,同时,该方法还支持多维数据的可视化,有利于从不同的层次进行有关的分析。   除了上述方法之外,数据挖掘技术的主要方法还包括遗传算法、近邻算法、粗糙集、联机分析处理等等,不同的方法都有其适用的不同数据库或者数据资源,为有关数据的信息化处理提供了更多的方便。   3数据挖掘技术在档案信息管理中的应用模式   3.1档案信息的收集   档案信息的收集是数据挖掘技术应用于档案信息管理的重要内容之一。其主要内容是概念模型的建立,也就是通过一定基础的数据分析,对有关的数据或者集合按照一定的方法进行描述,即建立起有关的模型,并据此对比测试相应的样本对象等,在能够获得较高准确性的基础上,以此作为标准,继而将不同种类的对象进行划分。例如,在档案管理者针对某一信息进行录入后,则数据库会自动生成相应项目的属性描述,即形成了一个标准模型。当同类的信息再次输入时,数据库则会按照该标准模型对信息中的不同项目按照属性进行分类,大大节约了工作时间。   3.2进行档案分类   在档案管理中,其工作任务相对繁重,主要是因为数据量较大,而对档案进行分类整理往往需要耗费大量的精力。但是,通过数据挖掘技术的施行,可以自动对大量不同的档案依照属性的不同进行不同级别的分类,可以辅助有关的档案管理员进行更高效率的检索。该功能的主要过程为:依照某些数据的不同特征对其进行分类,使之形成相应的训练集;在此基础上,建立对应的分类模型,对数据库中的其他数据进行分类。   3.3档案信息的分析与整合   档案的建立以及档案信息化管理的重要用途之一,就是为了在特定时期,有关的管理者可以对数据库中的庞大数据进行迅速的信息提取、分析、整合,继而使其发挥应用价值。利用数据挖掘技术,有关的管理者可以针对某种现象发生的原因进行深入的分析,并挖掘背后的原因继而采取一定的措施,杜绝此类现象的出现。另外,数据挖掘技术还可以针对有关的档案查阅等,提供相应的信息便于管理者做好充足的准备。例如,在某个档案的管理网站中,数据挖掘可以自动统计使用者大量查阅档案的高峰期,有关的管理人员可以据此做好充足的准备,并采取一定的措施预防网站瘫痪

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档