《统计基础与实务》教学课件 第三章 统计整理.pptxVIP

《统计基础与实务》教学课件 第三章 统计整理.pptx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计基础;第一节 统计整理概述;;;;三、统计整理的步骤;;社会经济现象之间常常既存在某些共同的性质,又存在种种差异。为了对总体有更深刻的认识,就需要进行统计分组。 统计分组就是根据统计研究任务的需要,按照一个或几个分组变量将总体划分为几组,使组与组之间具有差异性,而同一组内的单位保持相对的同质性。;;;;1;确定分组标志后,根据分组标志的特征不同,统计总体可以按照品质标志分组,也可以按照数量标志分组。划分各组界限时,要尽量保证组内同性质和组间差异性。;简单分组是指对总体按一个标志进行分组,只反映总体某一方面的数量状态和结构特征,如职工按性别分组,企业按经济类型或规模分组等。 平行分组体系是指对同一总体按照两个或两个以上的标志分别进行简单分组而形成的分组体系。平行分组体系可以反映总体多方面的特征,右图列出了工业企业按照企业规模、经济类型和轻、重工业三个标志分别进行分组得到平行分组体系。;复合分组是指对总体按两个或两个以上的标志重叠分组,即先按一个主要标志分组,然后再按另一个从属标志在已分好的各组中再分组。例如,人口按性别先作简单分组,即男性组和女性组,在男性组和女性组中再按接受教育程度分为大学、高中、初中、小学几组(见右图)。 复合分组构成了复合分组体系。进行复合分组时,要先按主要标志对总体进行第一次分组,然后再按次要标志对总体进行第二次、第三次分组。采用复合分组能对总体作出更加全面和深入的分析,反映其内部类型和结构特征。但复合分组的组数将随着分组标志个数的增加而成倍地增加。因此,在进行复合分组时,分组标志个数不宜过多,要适当加以控制。;;;按品质标志分组所编成的分配数列叫做品质分配数列,简称品质数列。品质数列是用来观察总体单位中不同属性的单位分布情况。 下表列出了某班学生按性别分组形成的品质数列。;按数量标志分组所编成的分配数列叫做变量分配数列,简称变量数列。变量数列是用来观察总体中不变量值在各组的分布情况。变量分为离散变量和连续变量,因此,编制变量数列的方法是不相同的。;组距式数列是指在变量数列中的每一组并不是由一个变量来表示,而是由表明一定变动范围或表示一定距离的两个变量值所形成的数列。 在实际应用时,如按离散型变量分组,且在变量值变动幅度较大、个数较多时采用;而按连续性变量分组时,由于不能一一列举它的变量值,所以只能采用组距式数列。 下表列出了某班级学生统计学考试成绩按分值范围分组的情况。;(1)组距与组数 在变量式分组数列中,每个组变量值中的最大值叫该组的组上限,最小值叫该组的组下限。组距是指每个组变量值中最大与最小值之差,即: 组数是指组距式变量数列编制过程中分组的个数。组数与组距是相互联系的,同一变量数列中,组数越多,则组距越小;反之,组数越小,则组距越大,两者成反比例关系。 ;等距数列与不等距数列的概念和等距分组与不等距分组的概念是相互联系的。对于标志值的变动幅度在各组之间相等的分组,即为等距分组,否则为不等距分组。因此,对于总体单位标志值变动比较均匀的情况,可采取等距分组;当总体单位标志值变动很不均匀、出现急剧增长或下降、波动较大时,应采取不等距分组。;在变量式分组数列中,每个组两端的标志值被称为组限,其中,每个组的起点值为组下限(或最小值),终点值为组上限(或最大值)。划分组限时,相邻组的上下限可以不重叠,也可以重叠。在后一种情况,与上线相等的标志值应该计入下一组,即“上限不在组内”;换句话说就是每一组只包含它的下限值,不包含它的上限值,即“包小不包大”。;所谓频数,是指分配数列中各组的单位数,也称为次数或频数。频数越大,该组的标志值对总体标志水平所起的作用越大;反之,越小。因此,频数实际上是各组标志值的权数,用以衡量各组作用的大小。;;直方图是用来表示统计分布的一种统计图。绘制直方图,以直角坐标系的横轴表示变量,各组要连续排列;纵轴表示次数,也可以表示频率。如需同时反映,可将左边横轴的垂线表示次数,右边的垂线表示频率。直方图每个条形的宽度表示组距宽度,高度表示各组频数或频率。将教材中表3-8所呈现的某班学生统计学考试成绩的组距式变量数列绘制成直方图(见图1)。 直方图中的条形可以清晰地显示各组的分布情况。每组条形的面积与条形面积和之比反映了各组的频率。;当变量值的数目很多时,数列的组数也相应增多,组距会相应变小。当数列的组数非常多,组距非常小时,折线就会近似地表现为一条平滑的曲线,这样就会形成统计分布的曲线图。 统计分布的曲线图中使用频率最高的一种曲线叫做“正态分布曲线”(见左图)。这种曲线的“两头小、中间大”,类似钟形,所描述的统计分布具有以下特征:以标志标量的平均值为中心,沿对称轴向两边发展,越接近中心,分配的次数越多,离中心越远,分配的次数越少。 社会经济现象中许多分配次数分布属于正态分布,如学

您可能关注的文档

文档评论(0)

一帆风顺 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6132143125000013

1亿VIP精品文档

相关文档