基于SQLServer2000的数据挖掘.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SQLServer2000的数据挖掘

基于SQLServer2000的数据挖掘 Sql Server 2000分析服务 部分术语 数据挖掘 ( Data Mining) 数据仓库 ( Data Warehouse) 挖掘模型 ( Mining Models ) 模式 ( Pattern ) 实例 ( Cases ) 模型挖掘算法 ( Data-Mining algorithms ) 数据挖掘方法 数据挖掘方法过程 分析问题 提取和清洗数据 校验数据 创建和调试模型 查询数据挖掘模型数据 维护数据挖掘模型的有效性 微软分析服务的体系结构 OLAP介绍 MOLAP ROLAP HOLAP 分析服务服务器体系结构 分析服务客户机体系结构 为挖掘进行优化数据 数据结构 选择列 输入列 目标列 键列 值列 要避免的列 选择列 计算及推导数据 决定数据粒度 数据挖掘物理结构 OLAP立方体 OLAP提供立方体的维作为输入源,而不用传统的平面表 Select company, ShippedData, ProductName, Count(1) as qty From Tofu_Purchases_Aprial_2002 Group By CompanyName ShippedDate 数据挖掘的方法 直接数据挖掘(Direct Data Mining) 直接数据挖掘采用了当今比较流行的数据挖掘技术和运算法则,比如决策树。他对原始数据进行分类,以得出目标值。许多行业都使用这一方法。 间接数据挖掘(Undirect Data Mining) 间接数据挖掘不用于预测,因此不受目标值的约束。这种方式只是对数据进行整理,发觉整个数据集的结构和数据组织形式,以便于理解和利用。 数据挖掘和统计学 数据挖掘 不等于 统计学+销售学 共同术语: 数据种群(population)、样本(sample)、值域(Range)、偏差(Bias)、均值(mean)、中值(Median)、分布(distribute)… 从历史数据中学习 影响分析法 变化分析法 比较分析法 因果分析法 趋势分析法 偏差分析法 预测未来 概率估算 模拟与假定推测方案 模型的评估及错误的避免 数据过密 解决方法: 决策树修建法 X平方分析法 交叉验证法 数据过疏 测试数据模型的数据准备 训练用数据集 测试用数据集 评估用数据集 SQL Server 数据挖掘 微软决策树 OLAP决策树 微软聚类 微软决策树 决策树是一种作为商业挖掘工具而广为使用的算法。决策算法主要用于完成预测任务,这种算法首先需要一个分类导向的模型,这样就可以把一个部分分成几个部分分别加以解决。 通常步骤: 创建模型 使模型可视化 推导预测结果 创建模型步骤 创建数据库 挖掘模型向导 创建数据源 选择实例表 选择数据挖掘算法 创建并编辑关联 选择关键列 选择输入和预测列 结束 分析服务管理界面 新建挖掘模型 数据挖掘向导 选择数据源类型 选择实例表 选择数据挖掘算法 选择关键列 选择输入、输出列 命名挖掘模型 关系型挖掘模型编辑器 模型可视化 相关网络浏览器(Dependency NetWork Browser) 模型浏览器(Data Mining Browser) 数据挖掘模型浏览器 相关网络浏览器 相关网络浏览器(续) 相关网络浏览器(续) 相关网络浏览器(续) OLAP决策树 OLAP是一种结构优化的格式,主要为优化聚合数据存储而设计的。利用OLAP可以沿某种层次结构的维创建连续的聚合,并快速地访问根据各个维汇总的值,并提供了一种表达数字之间关系的途径。 步骤同微软决策树相同之处较多: 1、创建模型 2、模型可视化 3、推导预测结果 关于微软分析服务的参考信息 SQL Server 2000 Analysis Service学习指南 中文SQL Server 2000 关系型数据库系统管理与开发 SQL Server OLAP 开发指南 Microsoft OLAP Unleashed 参考的数据库: /~mlearn/MLRepository.html 微软数据转换服务(DTS) DTS任务: 1、转换 2、批录入 3、数据驱动查询 4、执行包(包括FTP等) 使用DTS Dtsrun 如: Dtsrun /Ffilename /Uusername /Ppassword /Npackage_name /Mpackage_password Dtsrun /Sservername /Uusername /Ppassword /Npackage_name /Mpack

文档评论(0)

qianqiana + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5132241303000003

1亿VIP精品文档

相关文档