- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务智能实验9报告教程
《数据挖掘与商务智能实验》
实 验 报 告
实验题目: 分类分析:决策树
姓名: 王俊
学号: 201430850164
指导教师: 张大斌
实验时间: 2016..11.10
2016年 11 月 12 日
实验9 分析类型:决策树
实验目的
了解和熟悉SPSS Modeler及其相关知识;
掌握SPSS Modeler工具建立CHAID决策树的方法;
学会运用SPSS CHAID决策树进行相关的内容分析。
实验内容
本实验以电信客户数据(文件名为Telephone.sav)为例,数据中包含的变量x1到x15分别是:居住地、年龄、婚姻情况、家庭月收入(百万)、受教育程度、性别、家庭人数、基本服务累计开通月数、是否申请无线转移服务、上月基本费用、上月限制性免费服务项目的费用、无线服务费用、是否电子支付、客户所申请的服务套餐类型和是否流失。本节的分析是在基本分析的基础上进行的,具体的CHAID算法如下所示:
实验步骤与结果
步骤1 创建CHAID数据流
(1)通过“statistic文件”节点读入文件名为Telephone.sav的数据。
(2)数据流中添加“分区”节点,将样本集划分为训练集和测试集,如图9-1所示。
(3)选择建模模块中的“CHAID(C)”节点,将其连接到数据流的恰当位置。
步骤2 设置具体参数
(1)右击鼠标,在“构建选项”-“基本(B)”,选择数的生长算法为Exhaustive CHAID。
自定义最大树状图深度为5,如图9-2所示。
(2)其他相关参数默认设置。
步骤3 结果运行
实验结果如图9-3所示。
CHIAID首先确定开通月数为最佳的分组变量,将其分为3组,开通月数小于等于5的,开通月数大于31和开通月数大于5小于30的。按照一层一层进行分组,但很快会发现其中某些推理规则没有太大的参考价值。例如,对于开通月数大于31个月的用户,无论是否采用电子支付方式,年龄如何,婚姻如何,最终的结果都是未流失。这种情况于该算法的剪枝方式有一定的联系。
实验分析与扩展练习
实验分析:
对于CHAID算法,SPSS Modeler如何进行交互方式建模?
答:在进行交互建模时候,以下这些参数的调整都会对建模的结果造成一定的影响:
数据分区中的训练和测试分区以及设置随机种子
B.相关CHAID参数设置中的树生长算法选择和最大树状图深度设置
C.相关CHAID参数设置中的成长规则
D.相关CHAID参数设置中的整体设置
D.相关CHAID参数设置中的高级设置的分割和合并
五、结论与讨论(重点)
通过这次实验,我总结一下知识点:
1.决策树算法的优点如下:
(1)分类精度高;
(2)生成的模式简单;
(3)对噪声数据有很好的健壮性。
因而是目前应用最为广泛的归纳推理算法之一,在数据挖掘中受到研究者的广泛关注。
2.CHAID的一般步骤:
(1.)属性变量的预处理
(2.)确定当前分支变量和分隔值
属性变量的预处理:
(1)对定类的属性变量,在其多个分类水平中找到对目标变量取值影响不显著的分类,并合并它们;
(2)对定距型属性变量,先按分位点分组,然后再合并具有同质性的组;
(3)如果目标变量是定类变量,则采用卡方检验
(4)如果目标变量为定距变量,则采用F检验
每对预测分类的评估,以确定最显著差异的因变量。由于这些合并步骤,通过计算修正邦费罗尼p值来合并交叉表。
3.CHAID算法优???:(1)可产生多分枝的决策树(2)目标变量可以定距或定类(3)从统计显著性角度确定分支变量和分割值,进而优化树的分枝过程(4)建立在因果关系探讨中,依据目标变量实现对输入变量众多水平划分
(格式按华南农业大学论文格式)
您可能关注的文档
- 哈工大-电子技术课程设计-数字显示电子钟教程.doc
- 哈工大-机械设计大作业-轴系部件教程.docx
- 哈工大MATLAB选修课最终大作业教程.doc
- 哈尔滨市南岗区2015—2016学年度上学期期末调研测试八年物理试题及答案教程.doc
- 14东方之珠第一课时PPT课件要点.pptx
- 哈工大数据库实验5教程.doc
- 员工手册2教程.doc
- 14《钢铁长城》课件(共30张PPT)要点.ppt
- 哈工大数电自主实验数字流水灯教程.doc
- 14内部质量审核控制程序要点.doc
- 2025年烟台市正大城市建设发展有限公司招聘工作人员12名笔试参考题库附带答案详解.doc
- 2025年衢州市属国企公开招聘工作人员笔试参考题库附带答案详解.doc
- 2025中铁四局集团有限公司法律合规部公开招聘1人笔试参考题库附带答案详解.docx
- 2025中国建筑股份有限公司岗位招聘【人力资源部(干部人事部)】笔试参考题库附带答案详解.docx
- 2025年滁州定远县中盐东兴盐化股份有限公司招聘2人笔试参考题库附带答案详解.doc
- DB1331T109-2025雄安新区建设工程抗震设防标准(963.84KB)(1).pdf
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2024陕西延长石油集团华特新材料股份有限公司社会招聘8人笔试参考题库附带答案详解.pdf
- 2023内蒙古大唐国际锡林浩特矿业有限公司采煤自营专项社会招聘32人笔试参考题库附带答案详解.pdf
- 2024年12月云南大学国际合作与交流处公开招聘(1人)笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
最近下载
- 注册安全工程师中级其他安全生产专业实务(其他安全类案例)模拟试卷5.pdf VIP
- 2025低压分布式光伏入网技术规范.docx VIP
- GB生产设备安全卫生设计总则.doc VIP
- 产教融合、校企合作——黄淮学院的探索与实践.ppt VIP
- 注册安全工程师中级其他安全生产专业实务(其他安全类案例)模拟试卷9.pdf VIP
- 《呼吸防护用品 自吸过滤式防颗粒物呼吸器》GB 2626-2019-2020.7.1.docx VIP
- 危险货物包装标志.docx VIP
- 地下水质量标准GB148482017.docx VIP
- 《心理学史教学大纲.doc VIP
- GBT-用于校准表面污染监测仪的参考源 α、β和光子发射体及编制说明.pdf VIP
文档评论(0)