- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
六、复相关系数和偏相关系数复相关系数R是由ESS和TSS构造的统计量,用来表示回归方程对原有数据拟合程度的好坏,衡量作为一个整体的x1,x2,…,xp与y的线性关系的大小。第30页,共66页,星期日,2025年,2月5日回归方程的拟合优度检验就是要检验样本数据点聚集在回归直线周围的密集程度,从而评价回归方程对样本数据的代表程度。由判定系数R2来实现。实际中,随着自变量个数的不断增加,必然会使得R2不断变化,于是出现的问题是,R2变化是由于数学习性决定的,还是确实是由于引入了好的变量进入方程而造成的。因此在作拟合优度检验的判定时,一般采用调整的R2,以消除自变量的个数以及样本量的大小对R2的影响。第31页,共66页,星期日,2025年,2月5日其它变量被固定后,计算任意两个变量之间的相关系数,这种相关系数称为偏相关系数。第32页,共66页,星期日,2025年,2月5日简单相关系数只是一种数量表面上的相关系数,而并非本质的东西。偏相关系数才真正反映两个变量的本质联系。Zero-order:零阶相关系数,计算所有自变量与因变量间的简单相关系数。Partcorrelation:部分相关,在排除了其他自变量对xi的影响后,当一个自变量进入模型后,复相关系数的平方增加量。第33页,共66页,星期日,2025年,2月5日回归方程的残差分析回归函数线性假设可行性残差序列的正态性分析残差序列的随机性分析残差序列的独立性分析奇异值诊断异方差诊断第34页,共66页,星期日,2025年,2月5日诊断回归函数是否为自变量x1,x2,…,xp的线性函数时,主要采用残差图y、e。如果在这个散点图中,点(y,e)大致在e=0附近随机变化(即无明显的趋势性),并在变化幅度不在的水平带状区域内,则可以认为回归函数的线性假定基本上是合理的。否则表明回归函数不是线性的,回归函数中可能应该含有某些变量的高次项或交叉乘积项,或者考虑是否可先将因变量y与某些自变量做变换,再建立相应的线性回归模型。当然,最极端情形是因变量与自变量之间没有回归关系。回归函数线性假设的可行性^^第35页,共66页,星期日,2025年,2月5日残差序列的正态性分析:设误差向量ε~N(0,σ2E),残差向量e~N(0,σ2(E-H)),ei~N(0,σ2(1-hii)),H=(hij)学生化残差所有SREi近似独立服从N(0,1),即近似地认为来自N(0,1)的简单随机样本。(1)频率检验法:统计所有SREi的正负个数是否各占一半,介于(-1,+1)、(-2,+2)、(-3,+3)的比例是否约68%、95%、99%。(2)正态QQ图检验法:将学生化残差从小到大重排r1、…、rm,计算qi=Φ-1[(i-0.375)/(n+0.25)],作图描点(qi,ri)。所有点应基本上在一直线上。或者计算q与r的相关系数,其值应接近于1。第36页,共66页,星期日,2025年,2月5日通过绘制标准化残差序列的带正态曲线的直方图或累计概率图来分析,确定残差是否接近正态Analyze-regression-linearPlot子对话框中选Histogram或p-p图第37页,共66页,星期日,2025年,2月5日残差序列的随机性分析:可以绘制残差序列和对应的预测值序列的散点图。如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机地分布在经过零的一条直线上下。在线性回归Plots对话框中的源变量表中,选择SRESID(学生氏残差)做Y轴,选ZPRED(标准化预测值)做X轴第38页,共66页,星期日,2025年,2月5日残差序列的独立性分析:如果回归模型中的误差项不是不相关,则称为自相关或序列相关。Durbin-Watson检验是最常见的自相关检验方法,但它仅适用于一阶自相关,即形如εi=ρεi-1+ui。由于εi未知,就用残差ei挖代替来判断是否自相关。H0:ρ=0检验统计量判别准则:当0DWdl时,正自相关;当4-dl<WD4时,负自相关;当dl<WDdu或4-duDW4-dl时,不能确定上;当WD在2附近,不存在一阶自相关,通常也无高阶自相关。如果模型存在自相关,可用差分模型代替原有模型,再检验、迭代第39页,共66页,星期日,2025年,2月5日样本奇异值的诊断:样本奇异值是样本数据中那些远离均值的样本数据点。它们会对回归方程的拟合产生较大偏差影响。一般认为,如果某样本点对应的标准化残差的值超出了-3—+3的范围,就可以判定该样本数据为奇异值。
文档评论(0)