- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅析数据挖掘在高校图书馆中的应用及优势.doc
浅析数据挖掘在高校图书馆中的应用及优势 摘要:数据挖掘技术是一种新兴的信息处理技术。文章在论述数据挖掘技术的基础上,探讨了数据挖掘在高校图书馆的应用和优势。 Abstract: Data mining technology is a new technology of information process. The article introduces data mining technology, and on this basis discusses its application and preponderance in the libraries in college. 关键词:数据挖掘;高校图书馆 Key words: data mining;university library 中图分类号:TP392 文献标识码:A文章编号:1006-4311(2010)35-0142-02 1数据挖掘的定义 数据挖掘(Data Mining)也称数据库中的知识发现(KDD:Knowledge Discovery in Database),是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程。提取的知识一般可表示为概念(Concepts)、规则(Rules)、规律(Regularities)、模式(Patterns)等形式。数据挖掘涉及机器学习、模式识别、统计学、数据库、知识获取与表达、专家系统、神经网络、模糊数学、遗传算法等多个领域。通过数据挖掘,可以从各种数据库(如事务数据库、关系数据库、对象――关系数据库和面向对象数据库)、数据仓库或其他信息存储(如空间的、时间相关的、文本的、多媒体的数据库以及 WWW)中提取有用的知识、规律或高层信息,并可以从不同角度观察或浏览。知识发现过程包括数据清理、数据集成、数据变换、数据挖掘、模式评估和知识表示。数据挖掘是人们长期对数据库技术进行研究和开发的结果,它不仅能对过去的数据进行查询和遍历,并且能够找出过去数据之间的潜在联系,发现隐含于海量数据之中的客观规律,从而促进信息的利用和加速信息的传递。 2数据挖掘在高校图书馆中的应用 数据挖掘是当前数据库研究,开发和应用最广泛、最活跃的一个分支, 随着高校图书馆的不断发展,自动化程度与数字化程度越来越高,图书馆要处理和提供的信息越来越多,越来越复杂。图书馆如何运用这一新技术挖掘丰富的信息资源,为学生服务和科学管理提供可靠的依据,是我们将要进行研究的重要内容。 2.1 聚类分析聚类是把一组个体按照相似性归成若干类别,它反映同类事物共同性质的特征型知识和不同事物之间的差异性质的特征型知识通过聚类,数据库中的记录可被划分为一系列有意义的子集聚类增强了人们对客观现实的认识,是概念描述和类分析的先决条件。聚类分析,可以把学生或教师按照相似性和差异性分为多个类别,属于同一类别的学生或教师的相似性尽可能大,不同类别中的学生或教师的相似性尽可能小,聚类模式挖掘可应用到学生群体的聚类属性和特征分析等工作环节中。 2.2 关联分析关联反映一个事件和其他事件之间依赖联系的,如果在事件中两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。关联可分为简单关联、时序关联、因果关联。关联分析的目的就是找出数据库中隐藏的关联网。在图书馆流通历史记录中找出有多大比例的学生借阅,挖掘出来的规则可为图书订购工作提供科学的依据。 2.3自动预测均势和行为数据挖掘自动在大型数据库中寻找预测性信息,它根据时间序列型数据,从历史的和当前的数据去推测未来的数据。序列模式分析用在图书馆读者管理中,可以在给定流通数据库中找出读者序列,根据读者过去借书的情况,可以有针对性地推荐他最近最可能要借的书,从而减少读者查找的时间,提高图书馆的服务质量。 2.4 概念描述概念描述就是对某对象的内涵进行描述并概括这类对象的有关特征,概念描述分为特征性描述和区别性,前者汇总并描述称为目标类的数据集,而后者汇总并将一个称作目标类的数据集与称作对类的其他数据集相区分,描述不同类对象之间的区别,生成一个类特征性描述只涉及该类对象中所有对象的共性。生成区别性描述的方法很多,如决策树方法、遗传算法等。通过概念描述,可以更清楚地了解读者,了解他们的特点,分析不同的群体借阅量,从而有针对性地提供不同的服务,提高图书馆的服务质量。 3数据挖掘在高校图书馆中应用的优势 数据挖掘技术应用在高校图书馆中,将为图书馆的数字资源组织和管理、服务质量提升和方式拓展等方面提供了技术支持。 3.1 加快信息获取速度在信息化社会中,信息技术
文档评论(0)