数据挖掘的发展趋势及未来的研究方向.pdfVIP

数据挖掘的发展趋势及未来的研究方向.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘的发展趋势及未来的研究方向

一、数据挖掘简介

近十几年来,信息数据增长之巨大已到了令人咂舌地步,大型数据库、数据

仓库被用于商业管理、政府办公、科学研究和工程开发等等。于是,我们又面临

了新的问题:如何从中及时发现有用的知识,提高信息利用率?要想使数据真正

成为一个公司的资源,只有充分利用它为公司自身的业务决策和战略发展服务才

行,否则大量的数据只能成为包袱,甚至垃圾。因此,数据挖掘技术应运而生。

我们可以把数据挖掘理解为:数据挖掘就是从海量的数据(包括结构化和非

结构化)中挖掘出隐含在其中的、事先不为人知的、潜在的、有用信息和知识的

技术。这些信息是可能有潜在价值的,是用户感兴趣的、可理解、可运用的,支

持决策,可以为企业带来利益,或者为科学研究寻找突破口。

二、数据挖掘的功能

数据挖掘综合了各个学科技术,有很多的功能,当前主要功能如下:

(1)分类:按照分析对象的属性、特征,建立不同的组类来描述事物。例

如:银行部门根据以前的数据将客户分成了不同的类别,现在就可以根据这些来

区分新申请贷款的客户,以采取相应的贷款方案。

(2)聚类:识别出分析对内在的规则,按照这些规则把对象分成若干类。

例如:将申请人分为高度风险申请者,中度风险申请者,低度风险申请者。

(3)关联规则和序列模式的发现:关联是某种事物发生时其他事物会发生

的这样一种联系。例如:每天购买尿布的人也有可能购买啤酒,比重有多大,可

以通过关联的支持度和可信度来描述。与关联不同,序列是一种纵向的联系。例

如:今天银行调整利率,明天股市的变化。

(4)预测:把握分析对象发展的规律,对未来的趋势做出预见。例如:对

未来经济发展的判断。

(5)偏差的检测:对分析对象的少数的、极端的特例的描述,揭示内在的

原因。例如:在银行的100万笔交易中有500例的欺诈行为,银行为了稳健经营,

就要发现这500例的内在因素,减小以后经营的风险。

需要注意的是:数据挖掘的各项功能不是独立存在的,在数据挖掘中互相联

系,发挥作用。

三、数据挖掘的应用现状

数据挖掘的应用非常广泛,只要该产业有分析价值与需求的数据库,皆可利

用数据挖掘工具进行有目的的发掘分析。常见的应用案例多发生在零售业、制造

业、财务金融保险、通讯及医疗服务:

(1)商场从顾客购买商品中发现一定的关联规则,提供打折、购物券等促销

手段,提高销售额;

(2)保险公司通过数据挖掘建立预测模型,辨别出可能的欺诈行为,避免道

德风险,减少成本,提高利润;

(3)在制造业中,半导体的生产和测试中都产生大量的数据,就必须对这些

数据进行分析,找出存在的问题,提高质量;

(4)电子商务的作用越来越大,可以用数据挖掘对网站进行分析,识别用户

的行为模式,保留客户,提供个性化服务,优化网站设计;

四、数据挖掘的主要技术

随着数据挖掘研究逐步走向深入,人们越来越清楚地认识到,数据挖掘的研

究主要有3个技术支柱,即数据库、人工智能和数理统计。

一、数据库技术

数据库技术是通过研究数据库的结构、存储、设计、管理以及应用的基本理

论和实现方法,并利用这些理论来实现对数据库中的数据进行处理、分析和理解

的技术。即:数据库技术是研究、管理和应用数据库的一门软件科学。

数据库技术研究和管理的对象是数据,所以数据库技术所涉及的具体内容主

要包括:通过对数据的统一组织和管理,按照指定的结构建立相应的数据库和数

据仓库;利用数据库管理系统和数据挖掘系统设计出能够实现对数据库中的数据

进行添加、修改、删除、处理、分析、理解、报表和打印等多种功能的数据管理

和数据挖掘应用系统;并利用应用管理系统最终实现对数据的处理、分析和理解。

由于数据库文化的迅速普及,用数据库作为知识源具有坚实的基础;另一方

面,对于一个感兴趣的特定领域——客观世界,先用数据库技术将其形式化并组

织起来,就会大大提高知识获取起点,以后从中发掘或发现的所有知识都是针对

该数据库而言的。因此,在需求的驱动下,很多数据库学者转向对数据仓库和数

据挖掘的研究,从对演绎数据库的研究转向对归纳数据库的研究。

二、人工智能技术

人工智能亦称智械、机器智能,指由人制造出来的机器所表现出来的智能。

通常人工智能是指通过普通计算机程序来呈现人类智能的技术。该词也指出研究

这样的智能系统是否能够实现,以及如何实现。人工智能于一般教材中的定义领

域是“

文档评论(0)

leet1201 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档