[计算机软件及应用]第九章、网络环境的数据库体系结构.pptVIP

[计算机软件及应用]第九章、网络环境的数据库体系结构.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[计算机软件及应用]第九章、网络环境的数据库体系结构

一、数据挖掘技术概述 数据挖掘是一门综合性的技术,涉及到很多学科---数据库、人工智能和数理统计等等。目前其主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。 9.2 数据挖掘 数据挖掘与数据仓库技术有着密切的关系。见图10.2.1 9.2 数据挖掘 数据挖掘库可能是你的数据仓库的一个逻辑上的子集,而不一定非得是物理上单独的数据库。但如果你的数据仓库的计算资源已经很紧张,那你最好还是建立一个单独的数据挖掘库。 9.2 数据挖掘 数据挖掘和OLAP的不同之处: ● OLAP是决策支持领域的一部分。OLAP分析过程在本质上是一个演绎推理的过程。但是如果分析的变量达到几十或上百个,那么再用OLAP手动分析验证这些假设将是一件非常困难和痛苦的事情。 数据挖掘与OLAP不同的地方是,数据挖掘不是用于验证某个假定的模式(模型)的正确性,而是在数据库中自己寻找模型。他在本质上是一个归纳的过程。 9.2 数据挖掘 ● 数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,你也许要验证一下如果采取这样的行动会给公司带来什么样的影响,那么OLAP工具能回答你的这些问题。 9.2 数据挖掘 二、数据挖掘(DATA MINING)的定义 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 9.2 数据挖掘 以上定义包括好几层含义: ● 数据源必须是真实的、大量的、含噪声的; ● 发现的是用户感兴趣的知识; ● 发现的知识要可接受、可理解、可运用; ● 并不要求发现放之四海皆准的知识,仅支持特定的发现问题。 9.2 数据挖掘 数据挖掘的目标是从数据中找到感兴趣的模式,用这些模式来决定商业策略或发现不正常的情况。数据挖掘工具在海量数据上应用了统计技术来查找这些模式。 9.2 数据挖掘 三、 数据挖掘的过程模型及常用技术 以TWO CROWS公司的数据挖掘过程模型为例进行讨论。 基本数据挖掘步骤包括:定义商业问题、 建立数据挖掘模型、分析数据、准备数据、建立模型、评价模型和 实施。 9.2 数据挖掘 数据挖掘常用技术包括: ①人工神经网络,即仿照生理神经网络结构的非线形预测模型,通过学习进行模式识别。 ②决策树,它代表着决策集的树形结构。 ③遗传算法,基于进化理论,并采用遗传结合、遗传变异、以及自然选择等设计方法的优化技术。 ④近邻算法,将数据集合中每一个记录进行分类的方法。 ⑤规则推导,从统计意义上对数据中的如果-那么规则进行寻找和推导。 9.2 数据挖掘 四、目前数据挖掘的主要应用 ● 网站的数据挖掘 ● 生物信息或基因的数据挖掘 ● 文本的数据挖掘 9.2 数据挖掘 面向对象的数据库技术可以直接处理一些复杂的对象、描述这些对象的复杂特征,因此,它可以满足当前一些新的数据库应用的需要。这些新的应用中的数据大部分是不能利用关系模型和实体-联系模型来充分加以描绘的。这些应用包括: 9.3 面向对象的数据库技术 ● 计算机辅助设计(CAD) CAD数据库存储了与一个工程设计相关的数据,包括所设计物品的各个组件、这些组件之间的相互关系等。 ● 计算机辅助软件工程(CASE) CASE数据库存储了用于辅助软件开发者的一些数据。这些数据包括源代码、软件模块间的依赖关系、变量的定义和使用,以及软件系统的开发历史等。 9.3 面向对象的数据库技术 ● 多媒体数据库 多媒体数据库包含图像数据、空间数据、音频数据、视频数据等等。这种类型的数据主要用于存储照片和地理数据,以及语音邮件系统、图形系统和视频点播系统等。 ● 办公自动化系统 办公自动化包括基于工作台的文档的生成和检索工具、维护日程安排的工具等。办公自动化数据库必须允许对日程、文档和文档内容进行查询。 9.3 面向对象的数据库技术 ● 超文本数据库 在互连网上存在大量的超文本。所谓超文本就是经过增强的文本,它带有指向其他文档的链接。WWW就是超文本(更准确的现在应该是超媒体)的一个实例。为了对它进行索引,超文本也可以是有结构的。超文本数据库必须支持基于链接的文档检索,以及根据文档结构对它进行查询的功能。 9.3 面向对象的数据库技术 一、面向对象数据模型 面向对象数据模型包括对象、类、继承、对象标识和对象包含这些方面的内容。 ● 对象 在面向对象数据模型中,一个对象可以看成是对应的E-R模型中的一个实体。在对象结构中封装了这个对象的相关数据和代码。它们是一个包含对象本身数据的变量集合即对象的属性、一个对象所响应的消息的集合和一个方法的集合。 9.3 面向对象的

文档评论(0)

qiwqpu54 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档