《统计学 》课件——第二章 统计学的数据.pptVIP

《统计学 》课件——第二章 统计学的数据.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

例如,当α=0.05,极限误差与样本量关系可查下表。(2)估计总体平均需要样本量的计算公式。极限误差比例⊿样本量n极限误差比例⊿样本量n0.11000.053900.0951100.0454800.091200.046000.0851400.0357900.081500.0311000.0751800.02516000.072000.0224000.0652300.01543000.062700.0196000.055320应用公式要在抽样前确定总体的方差S2较困难。确定极限误差Δ也需要其它信息。表2-5估计总体比例样本量表2.6统计数据的近似与误差1、统计误差统计误差是调查测量值或模型估计值与真实值的差异。统计学的数据允许有误差。统计误差可以用绝对数或相对数表示。统计学因为可以有误差,所以对误差的理解就极为重要。当两个数据相差很小时,例如:两次考试的数学成绩80分与81分,统计学就认为很小的差距是由于偶然原因造成的,两次的数学水平没有差异。只有当差距很大时,差距才具有统计学意义,才可以认为差距是系统的、本质的原因造成的。2、统计误差的分类图2-7统计误差的分类主要误差分两类,一类是调查误差,一类是模型估计误差(残差Residual),残差是误差的一类。调查误差原因主要有两类:一类是样本的代表性误差,一类是测量登记误差。在实际中因为测量工具的原因所有连续型变量数据都是真实值的近似。模型的估计误差或残差是真实值与估计值的差。是衡量模型拟合好坏的标准之一,模型估计误差分为绝对误差,相对误差,标准化残差(StandardizedResidual),student化残差(StudentizedResidual),残差越大表示预测越不准确。残差的大小与数据本身的分布特性有关,与拟合模型(回归方程)的选择有关。为了减少调查测量误差,调查问卷数据一般需要进行信度与效度检验。一项研究的信度(reliability)主要指它的方法的可靠性和结果的稳定性(可重复性)。一项研究的效度(validity)则主要反映在它的内容、标准和概念的正确性上。也就是研究观测的内容和指标是否真正反映了所想要探讨的问题。调查数据来源一般分两类调查,一类是政府机构的调查,为政府决策服务,如人口普查,经济普查,居民收入抽样调查。一类是民间研究机构的调查,为科学研究服务。如综合社会调查(GSS)。中国综合社会调查(CGSS),中国家庭健康调查(CHNS)。测度量表是一手数据调查常用的测度方法。如李克特量表(Likertscale)是定距量表,常用于测量观念、态度或意见。需要构造大量的陈述或说法(statement),用5级记分的方式来测量同意的程度,“1非常同意”、“1同意”、“3说不准”、“4不同意”、“5很不同意”。李克特量表(Likertscale)格式(2)实验数据:在实验中控制实验对象而收集到的数据。实验数据是在条件可控制的状态下获得的,一般没有极端值,且绝大多数服从正态分布,一般用参数统计的方法研究。2、间接来源(二手数据SecondarySourcesDataCompilation):使用他人调查与汇总的数据。查阅各种资料所得到的数据。常用的二手数据资料有统计部门和政府部门公布的有关资料,如各类统计年鉴,各类经济信息中心、信息咨询机构、专业调查机构等提供的数据;各类专业期刊、报纸、书籍所提供的资料;各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料;从互联网或图书馆查阅到的相关资料。图2-3中国统计年鉴目录图2-4国际统计年鉴目录2.3.3.统计数据按时空分类数据按时空分为截面数据、时间序列数据、面板数据。(1)截面数据(cross-section):指对一个变量或多个变量在一个时间点上收集的数据。时间相同空间不同。例:2010年各地区的农民收入数据。地区新疆陕西山东广东浙江农民人均收入(元)16181443265336544253表2-32010年全国各地区农民人均收入新疆人口普查截面数据存在异质性(heterogeneity)问题,利用数据要考虑可比性,考虑规模效应(size,scaleeffect),以免得出混乱的结论。(2)时间序列数据(timeseries):一个变量在不同时间取值的观测结果。空间相同而时间不同。例2000-2012年中国的国内生产总值数据。年份国民总收入(亿元)200099214.62001109655.22002120332.72003135822.82004

您可能关注的文档

文档评论(0)

青柠职教 + 关注
实名认证
服务提供商

从业10年,专注职业教育专业建设,实训室建设等。

1亿VIP精品文档

相关文档