统计学的复习提要统计学的复习提要.docVIP

统计学的复习提要统计学的复习提要.doc

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学的复习提要统计学的复习提要.doc

统计学的复习提要 ? 第一章数据与统计 一、统计 统计的三种含义:统计活动(统计工作)、统计数据(统计资料)和统计学。 二、数据 1、统计数据的四种计量尺度 定类尺度、定序尺度、定距尺度和定比尺度 2、数据类型(依据四种不同的计量尺度分为) 分类数据、顺序数据、数值型数据 3、常用的统计调查组织方式: (1)普查:为某一特定的目的而专门组织的一次性全面调查方式。 (2)抽样调查:从总体中抽取样本进行调查,利用样本调查的结果对总体的特征进行推断的一种非全面调查方式。 (3)统计报表:按照规定,自上而下统一布置,自下而上逐级填报的一种调查组织方式。 (4)重点调查:从总体中选择少数重点单位进行调查的调查组织方式。 (5)典型调查:从总体中选择一个或几个代表性的单位深入细致调查的一种调查组织方式。 ? 第二章描述统计 一、数据预处理 1、数据审核 包括准确性审核、全面性审核和及时性审核。 目的是最大程度上剔除并修正差错。 2、数据筛选 包括将不符合要求或存在明显错误的数据剔除;将符合条件的数据筛选出来。 3、数据排序 二、定性数据的图表分析 1、频数分布 (1)频数和频率 (2)频数分布 分类数据分组 ?分类???????计算落入各组频数或频率???????频数分布 顺序数据分组 ?分类???????计算落入各组频数或频率(或者累积频数或累积频率)???????频数分布 2、图形表示 主要有条形图、饼图和环形图等。 三、定量数据的图表分析 1、定量数据分组 (1)单变量分组 单变量分组是把一个变量值作为一组,这种方法一般适用于离散型变量且数目较少的情况。 (2)组距分组 组距分组是将全部变量值依次划分为若干个数值区间,每一个数值区间作为一组,这种方法一般适用于离散型变量变量值较多或者连续型变量。 组距分组的步骤。 注意:分组过程中,为解决“不重”问题,采用“上限不在内”的原则; 对于开口组,如何确定首组的下限和末组的上限?以及如何计算组中值? 2、频数分布的类型 频数分布主要的三种类型,即钟形分布、U型分布和J型分布 (1)钟形分布。特征:中间大,两头小,即靠近中间变量值得频数多,两头的频数少。 (2)U型分布。特征:中间小两头大,即靠近中间变量值得频数少,两头的频数多。 (3)J型分布。有两种,一种是正J型分布,频数随着变量值得增大而增多,另一种是反J型分布,频数随着变量值得增大而减少。 3、图形表示 主要有直方图、折线图、茎叶图和箱线图。 ? 第三章描述统计:数值方法 ? 一、集中趋势测度 集中趋势测度值的反映的是数据一般水平的代表值或者数据分布的中心值。 重点会计算各种刻画集中趋势的测度值。 1、平均数(适用于数值型数据) (1)算术平均数 (2)调和平均数??? (3)几何平均数 2、众数 (1)一组数据中出现次数最多的变量值 (2)不受极端值的影响 (3)一组数据可能没有众数或有几个众数 (4)不仅适用于数值型数据也适用于分类数据和顺序数据 注意:对于组距分组数据,如何计算众数? 3、中位数 (1)排序后处于中间位置上的值 (2)不受极端值的影响 (3)主要用于顺序数据,也可用数值型数据,但不能用于分类数据 注意:对于未分组和组距分组数据,如何计算中位数? 4、四分位数 5、均值、众数和中位数的关系 二、离中趋势测度 离中趋势测度值的反映的是数据的各变量值偏离中心值的程度。 重点会计算各种刻画离中趋势的测度值。 1、全距 一组数据的最大值与最小值之差 R?= max(xi) - min(xi) 2、内距 3、方差与标准差 重点计算总体方差与标准差和样本的方差与标准差。(未分组数据和分组数据) 4、标准分数 5、离散系数(标准差系数) (1)什么是离散系数?标准差与均值的比值。 (2)为什么计算离散系数? 三、分布形态的度量 1、分布的对称性 偏态:数据分布的不对称性。 偏态系数=0为对称分布 ???偏态系数0为右偏分布 ???偏态系数0为左偏分布 2、分布的陡峭性 峰度及峰度系数 峰度系数=0为峰度适中 ????峰度系数0为扁平分布 峰度系数0为尖峰分布 ? 第四章抽样及抽样分布 一、抽样技术中的基本问题 1、基本概念 总体和样本???参数和统计量????抽样单元与抽样框 2、基本抽样技术 简单随机抽样、分层抽样、系统抽样、整群抽样、多阶段抽样以及不等概抽样 二、抽样分布 1、样本均值的抽样分布 (1)当总体服从正态分布?????????????????时,来自该总体的所有容量为n的样本的均值?x也服从正态分布,?x?的数学期望为μ,方差为σ2/n。即? (2)设从均值为?,方差为??2的一个任意总体中抽取容量为n的样本,当n充分大时(n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 2、样本

文档评论(0)

zyongwxiaj8 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档