- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[Excel回归结果的解读
Excel回归结果的解读
利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。
图1 连续10年的最大积雪深度与灌溉面积(1971-1980)
回归结果摘要(Summary Output)如下(图2):
图2 利用数据分析工具得到的回归结果
第一部分:回归统计表
这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):
表1 回归统计表
逐行说明如下:
Multiple对应的数据是相关系数(correlation coefficient),即R=0.989416。
R Square对应的数值为测定系数(determination coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,即有R2=0.9894162=0.978944。
Adjusted对应的是校正测定系数(adjusted determination coefficient),计算公式为
式中n为样本数,m为变量数,R2为测定系数。对于本例,n=10,m=1,R2=0.978944,代入上式得
标准误差(standard error)对应的即所谓标准误差,计算公式为
这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=16.10676,代入上式可得
最后一行的观测值对应的是样本数目,即有n=10。
第二部分,方差分析表
方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。
表2 方差分析表(ANOVA)
逐列、分行说明如下:
第一列df对应的是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9。
第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有
它表征的是因变量的预测值对其平均值的总偏差。
SSr又称组间离差平方和,反应出不同的因子对样本波动的影响
第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有
它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。
SSe又称组内离差平方和,是不考虑组间方差的纯随机影响
第三行为总平方和或称总变差SSt,即有
它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.10676=764.961,即有
总离差平方和 = 组间离差平方和 + 组内离差平方和
样本数据的波动有两个来源:一个是随机波动,一个是因子影响。样本数据的波动,可通过总离差平方和来反映。这个总离差平方和可分解为组间方差和组内方差两部分。
而测定系数就是回归平方和在总平方和中所占的比重,即有
显然这个数值越大,拟合的效果也就越好。
方差、均方差:表示一组数相对平均值的离散程度
R2:预测值与实际值相对平均值的分布情况比较,越接近1,说明预测值和实际值的分布情况越接近。
第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有
第二行为剩余均方差MSe,即有
显然这个数值越小,拟合的效果也就越好。
第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为
式中R2=0.978944,dfe=10-1-1=8,因此
方差、均方差:表示一组数相对平均值的离散程度
F检验完整公式
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的均方差,以确定他们的精密度是否有显著性差异。
F F表 表明两组数据没有显著差异;
F ≥ F表 表明两组数据存在显著差异。
此处的F检验是比较回归均方差(组间均方差)和剩余均方差(组内均方差),如果组间均方差明显大于组内均方差,说明数据波动的主要来源是组间均方差,因子是引起波动的主要原因,可认为因子影响是显著的。
第五列Significance F对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=0.00000005420.0001,故置信度达到99.99%以上。
第三部分,回归参数表
回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。
表3 回归参数表
第一列Coefficients对应的模型的回归系数,包括截距a=2
您可能关注的文档
最近下载
- 中小学2025年春季学期升旗仪式(国旗下讲话)主题安排表 .pdf VIP
- 兽医师执业活动情况范文.docx VIP
- 检验检测机构质量手册程序文件质量记录合集(依据2023年版评审准则).pdf VIP
- 项目管理经验总结报告.pptx VIP
- 上半年卫生执法监督工作总结7篇.docx VIP
- 吉林农安宝泉饮用天然矿泉水资源核实报告.pdf
- 新人教版七年级下册语文【1--25课】全册 教学设计.doc
- 甘肃省凉州区社区工作者考试真题题库及参考答案AB卷.docx VIP
- 初中道德与法治新人教版七年级下册教学计划(2025春).doc
- SL T 415-2019 水文基础设施及技术装备管理规范.pdf
有哪些信誉好的足球投注网站


文档评论(0)