《数据仓库与数据挖掘》指导书.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《数据仓库与数据挖掘》指导书《数据仓库与数据挖掘》指导书.doc

《数据仓库与数据挖掘设计》指导书 PAGE  PAGE 11 PAGE 1 《计算机网络课程设计》指导书 《计算机网络课程设计》指导书 自编 北京信息科技大学 计算机学院 数据仓库与数据挖掘课程组 2012年11月 目 录 实验一:数据仓库的环境配置与构建实验 实验二:数据仓库的OLAP技术实验 实验三:数据挖掘方法实践实验 实验一、数据仓库的环境配置与构建实验 实验目的: 1)了解数据挖掘与商务智能之间的联系与区别; 2)分析数据挖掘仓库的特性和构架; 3)掌握数据挖掘的功能和建模的标准CRISP-DM。 4)掌握MSS的分析服务、报表服务和整合服务,并能够用以解决实际问题。 实验结果分析与要求: 完成实验目的中的内容,记录操作中的各个步骤,并进行分析。 实验内容: 1、将Excel数据表导入SQL数据库中的数据表 材料:SQL范例资料.xls中的三国表。 软件:SQL Server 2008 R2 基本步骤: 首先按照三国表中的属性在数据口中建立对应的表。 打开VS选择项目中的“Integration Services”项目,并制定项目的保存位置,最后单击“确定”按钮即可新建一个SSIS项目。 在“控制流”选项卡中,从工具箱拖拽“数据挖掘查询任务”的图示到工作区中。 切换“数据流”选项卡,先制定数据的源,因为要导入的是Excel数据,所以从工具箱拖拽Excel源的图示到工作区中,然后再Excel源上右击,选择菜单上的“编辑”。 在Excel源编辑器中,单击“新建”按钮来制定Excel数据的源,在Excel连接管理器中,单击“浏览”按钮来选择Excel文件,完成后单击“确定”按钮。 在“Excel工作表的名称”下拉列表中选择要导入的数据表,然后单击“确定”按钮,完成数据源的设置。 建立数据转换,从工具箱中拖拽“数据转换”到工作区中。 在Excel源上右击,选择“添加路径”。 指定“Excel源”到“数据转换”,最后单击“确定”按钮。 输出指定“Excel源输出”,输入指定“数据转换输入”,单击“确定”按钮。 设置数据流的目标,要导入到SQL的数据库中,从工具箱中拖拽“SQL Server目标”到工作区。 然???在“数据转换”上右击,选择添加路径来建立与数据流目标的连接。 在“数据流”对话框中,指定从“数据转换”到“SQL Server目标”,单击“确定”按钮。在“选择输入输出”对话框中,输出指定“数据转换输出”,输入指定“SQL Server目标输入”,单击“确定”按钮。 最后设置数据导入的位置,在“SQL Server目标”上右击,选择“编辑”。 在“SQL 目标编辑器”窗口中,单击“新建”按钮,然后在“配置 OLE DB连接管理器”窗口转中,同样单击“新建”按钮。 在“连接管理器”窗口中,“服务器名”选择SQL数据库的位置,在“登录到服务器”中选择“使用windows身份验证”,在“选择或输入一个数据库名”指定数据要导入的数据库,单击“确定”按钮返回上一个窗口,再单击“确定”按钮。 最后要指定数据要导入哪一个数据表,选择完成后单击“确定”按钮。 接下来选择“映射”,接着单击“确定”按钮即可。 现在已经完成配置,单击“启动调用”按钮,测试是否错误,执行完毕为绿色,执行中为黄色,错误为红色。 可以到导入的SQL数据库的数据表位置查看数据是否都已经导入了。选择SQL Server Management Studio打开后找到之前导出的数据表来查看。 选择“选择前1000行”后则可以看到结果。 2、对数据进行抽样 材料:SQL范例资料.xls中的三国表。 软件:SQL Server 2008 R2 基本步骤:在“数据转换”中选择“百分比抽样”,抽样的百分比为20%。其他同“将Excel数据表导入SQL数据库中的数据表”的操作步骤。 实验二、交换机数据仓库的OLAP技术实验 实验目的: 1)掌握决策树模型的基本概念和计算方法,并用其预测三国表中“身份属性”与其他属性的关系; 2)掌握贝叶斯分类器的基本概念,并用其预测三国表中“身份属性”与其他属性的关系; 3)掌握关联规则的基本概念和种类,并用其预测“肾细胞癌转移情况”。 4)对比以上三种模型,分析其联系与区别。 实验结果分析与要求: 完成实验目的中的内容,记录操作中的各个步骤,并进行分析。 实验内容: 使用决策树模型预测三国表中“身份属性”与其他属性间的关系; 材料:SQL范例资料.xls中的三国表。 软件:SQL Server 2008 R2 基本步骤: 首先将三国表导入到SQL数据库中。 新建Analysis Service 项目,进入项目中的新建挖掘结构,使用数据挖掘向导来建立,进入数据挖掘向导首页后单击“下一步”按钮。

文档评论(0)

ganqludp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档