数据库知识发现地研究综述.pdfVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全同鹅五届j}算机辅助生产管理学术会议论文集 数据库知识发现的研究综述 陈林生闰惠高学东 北京科技大学管理学院 北隶100093) 摘要 蕾文彳r绍了数据库知识发现fKDDt研完情况.包括萁置叉、赴理过程H噩主要的方击和挂术 科时舟熠7KDD的应用,并指出r目竹KDD研亢的挑战性。 关键词敷据庠知识发现.数据挖掘.菩蔓据库 来卅.数据挖掘主要流1门=统计界、数据分析、数据库 1 数据库知识发现的定义及其基本步骤 和管理信息系统(MISJ界;而KDD则主要流行于人工 数据库知识发现(Kr)D)是从大量的碌始数据中智能鞠机器学习界。一种较为普遍的现点认为:数据挖 挖掘出隐含的、有用的、尚未发现的信息和知识。被认 掘是KDD中专『j负责发现知识的核心环节;而KDD 为是目前解决“数据爆炸”和“数据十富-信息贫乏(Da— 是一十交互式、循纠=反复的多步骤处理讨程,除了包括 taRicha!mIniornkationPoor)”的一种有效方法, 数掂挖掘外还包括数据准备和发现结果解释评估等诸 多环节。其过程见图l, KDD有时也被称为数据挖掘(DatalltHltlig).相对 ㈣l KDD立士程示意图 f1)数据准备阶段 量个数。 数据准备叉可分为三个子步骤:数据选取、数据颓 (2)数据挖掘阶段 处州和数措变换。数据选取的目的是确定发现仟务的 数据挖掘阶段首先璺确定挖掘的任务或目的是什 操作数据,根据用户的需要从原始数描厍中抽取的 幺,妇数杯总结、分茭、聚娄、关联规则发现或序列模式 组数据。数据预处理般可能包括消除噪声、推导计舜 发现等。确定J’挖掘仔务后,就要决定使用什么样的挖 缺值数据、消除重复记录、完成数挺粪掣转换(☆.!把连 掘算法, 续值数据转换为离散型的数据,以便:r符号归纳、r戋县 (5)结果解释和评估阶段 把离散型的转换为连续埴型的,以便f。_}甲经阚锵lj纳, 数据挖掘阶段发现出粜的模式,经过用户或机器 等.当数描挖掘的对象是数掘仓牟时t‘艘来。记.故据 的l甲估.可能俘茫冗泉或无关台勺槌式,这时需要将其剔 坝处珊已经在生成数据仓庳时完成.数据变损的王 豫;也有可能横式下满足用户要求.这时则需要整个发 矍目的是消减数据维数成降准.即从刖贻特征中找出 现吐程邀州到发现阶谨之前,如重新选取数据.采用新 真正有用的特征以减少数据挖掘时要考虑的特征或变 的敬掘变换方法、设定新的数据挖掘参数值,甚至换一 ·121· 2的, 种挖掘算法*外,KDD由一%鸯是面向人鼍』H 5 KDD的应用 因此可能曼对发现的模式型f』-叮视化,或者把纪粜转 换为用户易懂的另 种走町.如把关联批刚表达为“-f KDD的发展虽然只有短短敬年时间,但备种系统 …then…”规则形式或图是H。t 却有如雨后春笋般大量涌现,主要有以下几个方面: ·科学应用随着先进的科学数据收集工具的使 2数据挖掘的任务嚣:方。蠢 川,敬据量越来越太.传统的敬据仔析工具兀能为力, 数据挖掘作勾KDD的一%,I、部分.苴日相是4数蚓此必顼宵强大的智能鬯自动数据分析工具才行。例 据库中发现降含的、有枣卫川引识.埘此被研究锔最

文档评论(0)

bb213 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档