线性回归(最小二乘法).docxVIP

线性回归(最小二乘法).docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

分析流程

数据源:

使用数据.xlsx

算法配置:

算法:线性回归(最小二乘法)

分析结果:

暂无数据

分析步骤

1.通过分析F值,分析其是否可以显著地拒绝总体回归系数为0的原假设(P0.05),若呈显著性,表明之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。

2.通过R2值分析模型拟合情况,同时对VIF值进行分析,若模型呈现共线性(VIF大于10或者5,严格为10),建议使用岭回归或者逐步回归。

3.分析X的显著性;如果呈现出显著性(P0.05),则用于探究X对Y的影响关系。

4.结合回归系数B值,对比分析X对Y的影响程度。

5.确定得到模型公式(Tips:使用线性回归前可以通过统计类的方法例如正态性检验等方式对数据进行验证清洗,也可以采用数据处理中异常值处理等方法对数据进行清洗。)。

详细结论

输出结果1:线性回归分析结果表

线性回归分析结果n=9998

非标准化系数

标准化系数

t

P

VIF

R2

调整R2

F

B

标准误

Beta

常数

160.152

42.785

-

3.743

0.000***

-

0.15

0.149

F=195.081P=0.000***

FleschReadingEaseformula

-0.15

0.183

-0.008

-0.818

0.413

1.019

Flesch-KincaidGradeLevel

0.528

0.616

0.008

0.857

0.391

1.043

FogScale

-0.43

0.432

-0.012

-0.995

0.320

1.688

SMOGIndex

0

0.001

-0.004

-0.416

0.677

1.001

AutomatedReadabilityIndex

0.677

0.127

0.071

5.343

0.000***

2.092

Coleman-LiauIndex

-0.76

0.759

-0.011

-1

0.317

1.399

LinsearWriteFormula

-0.207

0.187

-0.01

-1.106

0.269

1.03

Quantity

1.417

0.048

0.27

29.216

0.000***

1.001

Price

1.03

0.035

0.269

29.142

0.000***

1

因变量:代金券面额

注:***、**、*分别代表1%、5%、10%的显著性水平

图表说明:

上表格展示了本次模型的分析结果,包括模型的标准化系数、t值、VIF值、R2、调整R2等,用于模型的检验,并分析模型的公式。

1.线性回归模型要求总体回归系数不为0,即变量之间存在回归关系。根据F检验结果对模型进行检验。

2.R2代表曲线回归的拟合程度,越接近1效果越好。

3.VIF值代表多重共线性严重程度,用于检验模型是否呈现共线性,即解释变量间存在高度相关的关系(VIF应小于10或者5,严格为5)若VIF出现inf,则说明VIF值无穷大,建议检查共线性,或者使用岭回归。

4.B是有常数情况下的的系数。

5.标准误=B/t值。

6.标准化系数是将数据标准化后得到的系数。

7.VIF是共线性。

8.F(df1,df2)是df1等于自变量数量;df2等于样本量-(自变量数量+1)。

9.F检验是为了判断是否存在显著的线性关系,R2是为了判断回归直线与此线性模型拟合的优劣。在线性回归中主要关注F检验是否通过,而在某些情况下R2大小和模型解释度没有必然关系。

智能分析:

F检验的结果分析可以得到,显著性P值为0.000***,水平上呈现显著性,拒绝回归系数为0的原假设,因此模型基本满足要求。

对于变量共线性表现,VIF全部小于10,因此模型没有多重共线性问题,模型构建良好。

模型的公式如下:y=160.152-0.15*FleschReadingEaseformula+0.528*Flesch-KincaidGradeLevel-0.43*FogScale-0.0*SMOGIndex+0.677*AutomatedReadabilityIndex-0.76*Coleman-LiauIndex-0.207*LinsearWriteFormula+1.417*Quantity+1.03*Price。

输出结果2:拟合效果图

图表说明:

上图展示了本次模型的原始数据图、模型拟合值、模型预测值。

输出结果3:模型路径图

图表说明:

上图以路径图形式展示了本次模型结果,主要包括模型的系数,用于分析X对于Y的影响关系情况。

输出结果4:模型结果预测

变量

系数

测试值

常数

160.15

文档评论(0)

数学建模-赛道做 + 关注
实名认证
服务提供商

各类数学建模竞赛-文档,及优秀论文分享

1亿VIP精品文档

相关文档