- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
分析流程
数据源:
贝碧嘉.xlsx
算法配置:
算法:决策树回归
分析结果:
决策树回归基于MSE、RMSE、MAE、MAPE、R2指标对模型进行评价,请看详细结论。
分析步骤
1.通过训练集数据来建立决策数回归模型,得到决策树结构。
2.通过建立的决策树来计算特征重要性。
3.将建立的决策树回归模型应用到训练、测试数据,得到模型评估结果。
4.由于决策树具有随机性,每次运算的结果不一样,若保存本次训练模型,后续可以直接上传数据代入到本次训练模型进行计算预测。
5.注:决策树无法像传统模型一样得到确定的方程,通常通过测试数据预测精度来对模型进行评价。
详细结论
输出结果1:模型参数
参数名
参数值
训练用时
0.017s
数据切分
0.7
数据洗牌
是
交叉验证
10
节点分裂评价准则
friedman_mse
特征划分点选择标准
best
划分时考虑的最大特征比例
None
内部节点分裂的最小样本数
2
叶子节点的最小样本数
1
叶子节点中样本的最小权重
0
树的最大深度
10
叶子节点的最大数量
50
节点划分不纯度的阈值
0
图表说明:
上表展示了模型各项参数配置以及模型训练时长。
输出结果2:决策树结构
图表说明:
上图展示了决策树结构,内部节点给出了被分枝特征的具体切分情况,即根据某个特征的某个切分值进行划分。
(若节点数大于30,点击下载按钮查看决策树结构)
●mse/friedman_mse/mae等用以确定对哪一个特征进行切分。
●样本数量是该节点拥有的样本数量。
●节点样本均值是该节点全部样本的均值。
PS:特别注意的是,若节点数大于30,系统提供下载按钮查看决策树结构;若节点数大于2000,由于树结构渲染模糊,系统不提供下载导出。
输出结果3:特征重要性
图表说明:
上柱形图或表格展示了各特征(自变量)的重要性比例。
输出结果4:模型评估结果
MSE
RMSE
MAE
MAPE
R2
训练集
0
0
0
0
1
交叉验证集
0.424
0.513
0.18
0.861
0.967
测试集
0.5
0.707
0.133
0.659
0.968
图表说明:
上表中展示了交叉验证集、训练集和测试集的预测评价指标,通过量化指标来衡量决策树的预测效果。其中,通过交叉验证集的评价指标可以不断调整超参数,以得到可靠稳定的模型。
●MSE(均方误差):预测值与实际值之差平方的期望值。取值越小,模型准确度越高。
●RMSE(均方根误差):为MSE的平方根,取值越小,模型准确度越高。
●MAE(平均绝对误差):绝对误差的平均值,能反映预测值误差的实际情况。取值越小,模型准确度越高。
●MAPE(平均绝对百分比误差):是MAE的变形,它是一个百分比值。取值越小,模型准确度越高。
●R2:将预测值跟只使用均值的情况下相比,结果越靠近1模型准确度越高。
输出结果5:预测结果
预测测试集结果Y
风速
经度
台风起始时间
台风结束时间
纬度
当前台风时间
气压
移动速度
降水量
台风强度
23
23
114.5
3
3
19.1
56
990
20
0.2
2
15
15
111.6
4
4
20.9
123
998
14
1.2000000000000002
1
20
20
106.8
3
3
19.7
99
990
8
1.8
2
28
28
107.9
4
4
19.9
231
982
15
0.9
3
28
28
107.3
4
4
19.9
236
982
15
0.9
3
25
25
110.8
4
4
20.9
212
982
10
1.5
3
23
23
112.1
3
3
19.6
67
990
20
1.3
2
18
18
108.2
3
3
19.1
84
991
10
0.5
2
23
23
111.8
3
3
19.3
68
990
20
0.8
2
28
28
107.4
4
4
19.9
235
982
13
0.9
3
23
23
113.7
4
4
20.9
179
985
4
1.8
2
18
18
112.1
4
4
20.9
138
990
0
1.6
2
23
23
113.7
4
4
20.9
178
985
3
0.4
2
18
18
107.9
3
3
19.3
86
991
10
0.2
2
20
20
113.3
4
4
20.6
160
990
0
1.1
2
图表说明:
上表格为预览结果,只显示部分数据,全部数据请点击下载按钮导出。
上表展示了决策树模型对测试数据的分类结果,分类结果值是拥有最大预测概率的分类组别。
输出结果6:测试数据预测图
图表说明:
上图中展示了决策树对测试数据的预测情况。
您可能关注的文档
- 2024年MathorCup大数据挑战赛论文格式及提交规范.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.pdf
- 2024年MathorCup大数据挑战赛-赛道A初赛.docx
- Pearson相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- Spearman相关性分析_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 描述性统计_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-台风等级-风速-气压-移动速度).docx
- 数据概览_台风编号_经度_纬度.docx
- 数据概览_经度_纬度_台风等级.docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-移动速度-纬度-降水量)_(风速).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-气压-纬度-移动速度-降水量)_(风速).docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-经度-气压-风速-移动速度-纬度)_(降水量).docx
- gbdt回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- xgboost回归_(台风起始时间-台风结束时间-当前台风时间-经度-纬度-风速-气压-移动速度)_(降水量).docx
- 决策树回归_(台风起始时间-台风结束时间-当前台风时间-经度-风速-气压-纬度-移动速度-台风等级)_(降水量).docx
- 决策树回归(经度).docx
- extra_tree回归_(台风起始时间-台风结束时间-当前台风时间-风速-经度-气压-移动速度-降水量)_(纬度).docx
- gbdt回归_(台风起始时间-台风结束时间-经度-当前台风时间-台风等级-风速-气压-移动速度-降水量)_(纬度).docx
- 决策树回归_(经度-台风起始时间-台风结束时间-当前台风时间-风速-气压-移动速度-降水量-台风强度)_(纬度).docx
- B初赛妈妈杯大数据数学建模.pdf
- 描述性统计妈妈杯大数据数学建模.docx
最近下载
- 奶茶店兼职劳务合同模板(3篇).docx
- OTIS奥的斯XIOTIS西子奥的斯标准ACD4MR电气原理图XAA21310AT注解版.pdf
- 健康体重课件小学生版必威体育精装版完整版本.pptx VIP
- 内分泌性高血压筛查专家共识(2025版).pdf VIP
- 高级教师职称面试讲课答辩题目及答案(分五类共60题).docx VIP
- 全国智能制造应用技术技能大赛理论知识题库资料(核心500题).pdf VIP
- 安全生产台账建立与完善策略.docx VIP
- 矿山井巷施工施工组织设计 (1).pdf VIP
- CRM坐席操作手册.pdf VIP
- 2025年新高考物理压轴题专项训练09 电磁感应中的单双棒问题 含解析 .docx VIP
文档评论(0)