数据挖掘模式(DataMiningSchema).ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘模式(DataMiningSchema).ppt

* 开发一个数据挖掘和知识发现项目需要各方面协同合作而且极易出现问题,因此它的质量管理问题的讨论是重要而困难的。 近几年,有一些针对数据挖掘和知识发现项目的过程化管理所开展的工作,其中一个典型的模型被称作强度挖掘(Intension Mining)的I-MIN过程模型。 * I-MIN过程模型把KDD过程分成IM1、IM2、…、IM6等步骤处理,在每个步骤里,集中讨论几个问题,并按一定的质量标准来控制项目的实施。下面给出各步骤对应任务的简单描述: * IM1的任务与目的 它是KDD项目的计划阶段,需要确定企业的挖掘目标,选择知识发现模式,编译知识发现模式得到的元数据。其目的是将企业的挖掘目标嵌入到对应的知识模式中。 * IM2的任务与目标 它是KDD的预处理阶段,可以用IM2a、IM2b、IM2c等分别对应于数据清洗、数据选择和数据转换等阶段。其目的是生成高质量的目标数据。 * IM3的任务与目标 它是KDD的挖掘准备阶段,数据挖掘工程师进行挖掘实验,反复测试和验证模型的有效性。其目的是通过实验和训练得到浓缩知识(Knowledge Concentrate),为最终用户提供可使用的模型。 * IM4的任务与目标 它是KDD的数据挖掘阶段,用户通过指定数据挖掘算法得到对应的知识。 * IM5的任务与目标 它是KDD的知识表示阶段,按指定要求形成规格化的知识。 * IM6的任务与目标 它是KDD的知识解释与使用阶段,其目的是根据用户要求直观地输出知识或集成到企业的知识库中。 * §2.5 数据挖掘语言介绍 * 设计理想的数据挖掘语言是一个巨大的挑战。这是因为数据挖掘覆盖的任务宽、包含知识形式广(如数据特征化、关联规则、数据分类、聚集等等)。每个任务都有不同的需求,每种知识表示形式都有不同内涵。 一个有效的数据挖掘语言设计需要对各种不同的数据挖掘任务的能力、约束以及运行机制有深入地理解。 * 关系查询语言的标准化,发生在关系型数据库开发的早期阶段。经过不懈的努力,以SQL为代表的关系型数据库查询语言的标准化被成功解决。 同样,一个好的数据挖掘语言可以有助于数据挖掘系统平台的标准化进程,推动数据挖掘行业的开发和发展。 * 数据挖掘语言的发展 数据挖掘语言的发展大致经历了两个阶段: 第一个阶段是研究单位和公司自行研究和开发阶段; 第二阶段是研究单位和公司组成联盟,研制和开发数据挖掘语言标准化的阶段。 * 根据功能和侧重点不同,数据挖掘语言可以分为三种类型: 数据挖掘查询语言 数据挖掘建模语言 通用数据挖掘语言 2.5.1 数据挖掘语言的分类 * 2.5.2 数据挖掘查询语言 希望以一种像SQL这样的数据库查询语言完成数据挖掘的任务。 * 数据挖掘语言的发展 J. W. Han等开发的数据挖掘系统DBMiner中数据挖掘查询语言DMQL(Data Mining Query Language)是这类挖掘语言的典型代表。 DMQL由数据挖掘原语组成,数据挖掘原语用来定义一个数据挖掘任务。用户使用数据挖掘原语与数据挖掘系统通信,使得知识发现更有效。 * 原语的种类 这些原语有以下几个种类: 数据库部分以及用户感兴趣的数据集(包括感兴趣的数据库属性或数据仓库的维度); 挖掘知识的种类;在指导挖掘过程中有用的背景知识; 模式估值的兴趣度测量;挖掘出的知识如何可视化表示。 * 数据挖掘查询的基本单位是数据挖掘任务,通过数据挖掘查询语言,数据挖掘任务可以通过查询的形式输入到数据挖掘系统中。 一个数据挖掘查询由五种基本的数据挖掘原语定义。 * 2.5.3 数据挖掘建模语言 对数据挖掘模型进行描述和定义的语言,设计一种标准的数据挖掘建模语言,使得数据挖掘系统在模型定义和描述方面有标准可以遵循。 * PMML 预言模型标记语言”(Predictive Model Markup Language,PMML)被一个称作数据挖掘协会(The Data Mining Group,DMG)的组织开发。 PMML是一种基于XML的语言,用来定义预言模型。PMML允许应用程序和联机分析处理(OLAP)工具能从数据挖掘系统获得模型,而不用独自开发数据挖掘模块。 * PMML的模型定义由以下几部分组成: 头文件(Header); 数据

文档评论(0)

zcbsj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档