- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分析方法副本
1.1 引言 1.5 逐步回归分析 实际问题中影响因变量的因素可能很多,我们希望从中挑选出影响显著的自变量来建立回归模型,这就涉及到变量选择的问题。逐步回归是一种从众多变量中有效地选择重要变量的方法。它是在多元线性回归的基础上派生出来的一种算法技巧。 “最优”的回归方程就是包含所有对Y有影响的变量, 而不包含对Y影响不显著的变量回归方程。 如果采用的自变量越多,则回归平方和越大,残差平方和越小,然而较多的变量来拟合回归方程,得到的防策划能够稳定性差,用它作预测可靠性差,精度低.另一方面,如果采用了y 影响较小的变量而遗漏了重要变量,可导致估计量产生偏崎和不一致性.为此,我们希望得到“最优”的回归方程. (4)“有进有出”的逐步回归分析。 (1)从所有可能的因子(变量)组合的回归方程中选择最优者; (2)从包含全部变量的回归方程中逐次剔除不显著因子; (3)从一个变量开始,把变量逐个引入方程; 选择“最优”的回归方程有以下几种方法: 以第四种方法,即逐步回归分析法在筛选变量方面较为理想. 这个过程反复进行,直至既无不显著的变量从回归方程中剔除,又无显著变量可引入回归方程时为止。 逐步回归分析法的思想: 从一个自变量开始,视自变量Y作用的显著程度,从大到小地依次逐个引入回归方程。 当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉。 引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步。 对于每一步都要进行Y值检验,以确保每次引入新的显著性变量前回归方程中只包含对Y作用显著的变量。 1.6.1多元线性回归 b=regress( Y, X ) 1)确定回归系数的点估计值: 1.6 MATLAB统计工具箱中的回归分析命令 对一元线性回归,取p=1即可. 3、画出残差及其置信区间: rcoplot(r,rint) 2)求回归系数的点估计和区间估计、并检验回归模型: [b, bint,r,rint,stats]=regress(Y,X,alpha) 回归系数的区间估计 残差 用于检验回归模型的统计量,有三个数值: 相关系数r2、F值、与F对应的概率p 置信区间 显著性水平 (缺省时为0.05) 例1 解: 1、输入数据: x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]; X=[ones(16,1) x]; Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]; 2、回归分析及检验: [b,bint,r,rint,stats]=regress(Y,X) b,bint,stats To MATLAB(liti11) 题目 3、残差分析,作残差图: rcoplot(r,rint) 从残差图可以看出,除第二个数据外,其余数据的残差离零点均较近,且残差的置信区间均包含零点,这说明回归模型 y=-16.073+0.7194x能较好的符合原始数据,而第二个数据可视为异常点. 4、预测及作图: z=b(1)+b(2)*x plot(x,Y,k+,x,z,r) 返回 To MATLAB(liti12) 1.6.2多 项 式 回 归 (1)一元多项式回归 1)确定多项式系数的命令:[p,S]=polyfit(x,y,m) 2)一元多项式回归命令:polytool(x,y,m) A、回归: y=a1xm+a2xm-1+…+amx+am+1 此命令产生一个交互式的画面,画面中有拟合曲线和y的置信区间。通过左下方的Export菜单,可以输出回归系数等。 B、预测和预测误差估计: (1)Y=polyval(p,x)求polyfit所得的回归多项式在x处的预 测值Y; (2)[Y,DELTA]=polyconf(p,x,S,alpha)求polyfit所得 的回归多项式在x处的预测值Y及预测值的显著性为1- alpha的置信区间Y DELTA;alpha缺省时为0.05. 一元多项式回归也可以化为多元线性回归来解。 * 变量之间的关系 确定性关系 相关关系 确定性关系 身高和体重 相关关系 相关关系的特征是:变量之间的关系很难用一 种精确的方法表示出来. 1.回归分析方法 确定性关系和
文档评论(0)