- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第5章 连续变量及统计描述及参数估计
第5章 连续变量的统计描述与参数估计 石彤 2013.10 统计分析的目的是研究总体特征; 统计方法分为描述性统计分析和推断性统计分析: 描述性统计分析——对数据进行描述的统计方法; 推断性统计分析——从样本信息回推总体特征的统计方法。 各种统计描述指标(统计量,summary statistic),也称汇总统计量或概括统计量,用少量数据概括大量数据的技术。 针对不同测量类型的变量,有不同的描述指标体系和统计图形与之对应。 分类变量的描述统计量,如频数、频率;连续变量的描述统计量,如均数、标准差。 5.1 连续变量的统计描述指标体系 统计指标: 集中趋势 离散趋势 分布特征 其他趋势 图5.1 CCSS数据中S3绘制的直方图 5.1.1 集中趋势的描述指标 集中趋势(Central Tendency),又称“位置统计量”(Location Statistic),即数据分布的中心位置的统计量,包括算术均数、中位数、众数、截尾均数。 截尾均数: 由于均数较易受极端值的影响,因此可以考虑将数据进行排序后,按照一定比例去掉最两端的数据,包括中部的数据来求均数。 如果截尾均数和原均数相差不大,则说明数据不存在极端值,或者两侧极端值的影响正好抵消。 常用的截尾均数有5%截尾均数,即两端各去掉5%的数据。 在SPSS中“探索”(Explore)过程可以自动计算5%截尾均数。 5.1.2 离散趋势的描述指标 离散趋势(Dispersion Tendency),又称“尺度统计量”(Scale Statistic),即可以反映数据波动范围的大小的统计量,包括全距、方差、标准差、百分位数、四分位数、四分位间距、变异系数。 变异系数: 当需要比较两组数据离散程度大小的时候,往往直接使用标准差来进行比较并不合适。这可以被分为两种情况:一是测量尺度相差太大;二是数据量纲不同 。 变异系数(coefficient of variation,简称CV ) 可以消除测量尺度和量纲的影响 。它是标准差与其平均数的比率。计算出的变异系数没有量纲,同时又按照其均数大小进行了标化,这样就可以进行客观的比较。 5.1.3 分布特征、其他趋势的描述指标 分布特征(Distribution Tendency),又称“形态统计量”,即描述数据偏离分布程度的统计量,包括偏度、峰度。 其他趋势,是统计描述的其他指标,包括单峰或双峰分布、M统计量、极端值列表等。 5.1.4 SPSS中的相应功能 用于连续变量统计描述的过程,均集中在“描述统计”(Descriptive Statistics) 子菜单中: 1.频率过程(Frequencies) 该过程特色是产生原始数据的频数表,并能计算各种百分位数,描述指标包括集中趋势、离散趋势、百分位数和分布指标四部分,能绘制统计图。 2.描述过程(Descriptives) 该过程适用于对服从正态分布的连续性变量进行描述,它不能绘制统计图、所能计算的统计量较少,使用频率很高。 3.探索过程(Explore) 该过程用于对连续变量分布状况不清楚的探索性分析,可计算许多描述性统计量(如均数、百分位数、截尾均数、极端值列表),绘制统计图和参数估计; 4.比率过程(Ratio) 该过程用于对两个连续变量计算相对比指标,可计算专业的相对比描述指标。 5.2 连续变量的参数估计指标体系 5.2.1 正态分布 1.正态分布的定义 2.标准正态分布 5.2.2 参数的点估计 1.矩法 2.极大似然法 3.稳健估计值 M估计、R估计 5.2.3 参数的区间估计 1.标准误 样本均数的标准差,称均数标准误,或称标准误差。 2.区间估计的计算 可信度或置信度(1-α); 可信区间或置信区间; 显著度或显著性水平( α )。 5.2.4 SPSS中的相应功能 SPSS的许多过程均可完成连续变量参数估计的任务,针对性较强的是描述统计子菜单中的过程: 1.描述过程 将原变量转换为标准正态分布的得分,选择“将标准化得分另存为变量”复选框。 2.探索过程 可计算标准误,还可以直接给出均数95%可信区间,以及提供稳健估计值。 3.P-P图和Q-Q图 用图形方式直接观察样本数据分布是否服从所假设的理论分布,如正态分布。 5.3 案例:信心指数的统计描述 5.3.1 使用频率过程进行分析 例5.1 对CCSS数据中的消费者信心总值数index1、现状指数index1a和预期指数index1b进行统计描述,并计算出95%个体参考值范围。 1.界面说明 2.操作说明与结果解释 5.3.2 使用描述过程进行分析 1.界面说明 2.操作说明与结果解释 5.3.3 使用探索过程进行分析 例5.2 分月份对总
您可能关注的文档
最近下载
- 【同步教学】北师大版数学五年级下册第三单元《分数乘法》单元测试卷2.doc VIP
- 教学大纲_特种设备安全技术.docx VIP
- 个人简历——【标准模板】.doc VIP
- 结构加固方法介绍和选择.ppt VIP
- 【嘉世咨询-2025研报】2025中国两轮电动车行业现状报告.pdf
- 宜宾市叙州区总工会社会化工会工作者招聘笔试真题2022.docx VIP
- 大桥河幸福河湖建设规划方案研究.docx VIP
- 《机械与特种设备安全》教学大纲.pdf VIP
- 2025广东广州市工业和信息化局直属事业单位引进急需人才20人备考试题及答案解析.docx VIP
- 2023年宜宾市叙州区总工会社会化工会工作者招聘考试真题.docx VIP
文档评论(0)