基于大型数据库的数据挖掘应用研究.docVIP

基于大型数据库的数据挖掘应用研究.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大型数据库的数据挖掘应用研究.doc

  基于大型数据库的数据挖掘应用研究 摘要:随着当前大数据时代的到来,在海量数据库的数据处理和数据分析过程中,应用有效的数据挖掘技术能够大大提升数据处理的速度,同时也能够提升数据处理的准确性。本文我们基于此主要来探究在大型数据库的处理过程中数据挖掘技术的相关应用,我们从大型数据库的数据挖掘概念入手,分析大型数据挖掘系统的概况以及当前比较经典的两类多数据挖掘技术。 中国 8/vie   关键词:大数据库;数据挖掘;多数据   中图分类号:TP311.13 文献标识码:A :1007-9416(2017)01-0108-02   目前,数据挖掘技术融合了多项学科内容,不仅包含数据库技术,而且也包含有人工智能以及统计学的相关内容,数据挖掘技术在当前大数据库的数据处理方面贡献了非常大的力量,数据挖掘系统在数据库的数据处理过程中作为一个独立模块而存在,有效的协调了不同模块之间的工作,下面我们首先来看一下大数据时代之下的数据挖掘信息概括。   1 大数据时代下的数据挖掘相关内容概述   1.1 数据挖掘技术的基本概念   数据挖掘技术主要就是指在数据库的信息处理过程中,通过特定的方式和特定的手段来进行数据信息的有哪些信誉好的足球投注网站。换句话说数据挖掘技术是基于当前大数据时代而存在的,在海量数据信息处理的过程中,数据挖掘技术能够大大提升数据处理的效率。数据挖掘技术需要从当前海量数据库中不同形式,不同结构不同内容的数据通过特定方式搜寻出来,其中包含了大量不同领域的学科,通过数据挖掘技术我们能够做出归纳性的分析和总结,对于企业来说,数据挖掘技术能够有效的对市场进行预测和评估,同时也能够有效的根据客户的信息预测其未来的动向等。需要注意的是数据挖掘技术在实际的应用当中最重要的一门学科技术就是人工智能。   1.2 数据挖掘的特点以及应用   数据挖掘技术主要有以下几个特点:   (1)数据挖掘的模型是非常复杂的,数据挖掘技术主要重视的就是数据库中信息的建模过程,通过对相关数据关系进行有效的建模,把数学问题通过模型来表示出来从而有效地解决复杂的数据关系。(2)数据挖掘技术是基于当前大数据库而存在的,因此在处理数据信息上其基本的数据量是非常大的,数据挖掘主要就是从海量数据库中提出相关信息,海量数据库中的信息数据的格式结构以及内容都是具有一定差??的。总的来说,数据挖掘技术在具体实施的过程中需要有效的注意这几个方面的问题,从而保证数据挖掘的有效性和时效性。(3)数据挖掘技术跟随用户的实际需求出发,如果用户无法给出具体的要求,那么数据挖掘就会将用户所提出的有关信息进行提取,将用户所感兴趣的所有数据信息都进行反映,也就是说数据挖掘的规则性并不是唯一的,而是随着用户要求的准确性而发生变化的。(4)数据挖掘最关键的一个特点是其不同的算法最优化是不同的,评判数据挖掘技术优劣的一个关键主要就是判断数据挖掘技术的有效性而不是最优性。   1.3 数据挖掘任务探究   数据挖掘可以有以下几种不同的分类:   第一分类分析,即数据挖掘通过将一个特定的任务进行分类,通过用户所提出的具体要求,将某些特征数据信息反映到特定的类别上。分类分析的过程主要是建立一棵树,通过枝叶来向下进行逐级划分,将满足数据要求的类别进行下设,最终建立一棵树与规范要求的树。第二就是关联规则,在关联规则中比较经典的方式有Apriori算法、Sampling算法等,关联规则主要是根据用户的这一信息数据来推算出其他方面的信息数据,比如说用户在数字化图书馆借阅书籍的过程中,关联规则可以根据用户在借阅书籍的种类以及根据用户的年龄、学历等信息来推算出用户的实际工作阶层,工作内容等,通过这种方式,企业可以有效发现潜在的市场等。第三是聚类分析,聚类分析主要是指在数据信息处理的过程中,将属于同一类别的数据信息存储到一个特定的数据库当中,聚类分析与数据信息的自身结构形式有关,它会根据系统所给定的相关性能指标来直接确定数据信息的类别,当前聚类分析比较经典的算法有分解法、动态聚类法等。   2 大型数据库的数据挖掘系统   前面我们对当前大数据库时代下的挖掘技术的相关概念以及分类进行了简单的分析和概述,下面我们主要来看一下挖掘技术中关联规则、聚类以及分类三种不同算法的相关内容。   2.1 关联规则挖掘   关联规则挖掘前面我们已经简单的说明了其主要就是指针对数据信息的一个特定特征来推算出其他的数据信息,通过这种推算方式来发现数据信息中具有价值的内容。当前来看,关联规则挖掘中最为基本的算法就是Apriori算法,Apriori算法能够有效的根据用户信息的数据特征来推算出其他的数据特征,Apriori算法的基本运转原理是通过将海量数据库进行有哪些信誉好的足球投注网站之后,将数据库中的频繁集项进行有哪些信誉好的足球投注网站,然后根据所生成的频繁集项来建立一定

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档