第五讲 数据整理与描述.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五讲 描述性统计 —— 数据的描述性测度 内容提要 数据: 随机性、大量性、变异性 数据分布: 次数分布、相对次数分布、累积次数分布、累积相对次数分布 数据分布规律: 分布中心、分布范围、对称性 次数分布表与图 所谓次数分布,也叫频数分布,指的是一批数据中各个不同数值所出现的次数情况,或者是指一批数据在量尺上各等距区组内所出现的次数情况。 把次数分布情况制成的统计图表就分别叫做次数分布图和次数分布表。 次数分布表的编制步骤 求全距(极差) 决定组数和组距 决定组限 求组中值 登记次数 连续变量数据的实限 连续变量的每一个值是代表数轴上的一段距离。这就出现了数据的实限问题。一个数据所代表的实际范围称为该数据的实限,包括从等于大于该数据的下实限至小于该数据的上实限。 例子:5(下限为:4.5;上限为:5.5) 5.0 (下限为:4.95;上限为:5.05) 相对次数分布表 相对次数就是各组的次数f与总次数N之间的比值,若以Rf 表示,则Rf = f / N。 相对次数分布表主要能反映各组数据的百分比结构。阅读相对次数分布表时,相对次数较大的组,则说明落入该组内的数据个数占全部数据个数的比例也越多。反之,则越少。 次数分布图 次数直方图 次数分布图 次数多边图 次数分布图 累积次数分布图 练习: 某校85班与86班统计学考试成绩如表所示。要求对上述两个班的成绩用两种分组办法进行分组,并利用两种分组的数据对两班成绩进行比较和分析。 (1)以10分组距进行等组距分组; (2)如学校规定90—100分为优、75—89分为良、60—74分为及格、59分以下为不及格,按优、良、及格、不及格分组。 数据的描述性测度 中心测度 平均数;中位数;众数 变化测度 全距;方差与标准差; 四分位数和四分位距;极值 形态测度 偏度;峰度 (一)中心测度 中心测度是指刻画数据集中趋势的数字,用来描述数据的中心位于何处。 最常用的中心测度为平均数、中位数和众数,其中平均数和中位数只适用于定量数据,而众数既适用于定量数据,也适用于定性(分类)数据。 (1)算术平均数(M) μ——总体算术平均数 ——样本算术平均数 算术平均数的特性 所有观察值关于平均数的偏差和为零,即 对极值非常敏感。 所有观察值关于平均数的偏差平方和最小。 算术平均数的计算 利用原始数据进行计算 利用频数分布表计算 算术平均数的优缺点 优点 ——反应灵敏 ——严密确定 ——简明易懂 ——适合代数运算 ——受抽样变动的 影响较小 缺点 ——易受极端数值 的影响 ——一组数据中某 个数值的大小模 糊不清或不够确 切时无法计算 算术平均数的几个特殊优点 只知一组观察值的总和及总次数就可以求出算术平均数。 用加权法可以求出几个平均数的总平均数。 用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。 在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。 (2)加权平均数 加权平均数是不同比重数据(或平均数)的平均数。用 表示。 其计算公式有两种形式 (3)中位数 定义:中位数是把按从小到大(从大到小)排列的一组数据一分为二的数值。 中位数的计算: 1. 用原始数据计算(分奇数个数据和偶数个数据) 2. 利用次数分布表计算 利用次数分布表计算中位数 (1)计算公式(由小向大计算) 表示中位数所在组的下限; N表示总频数; 中位数所在组的频数; 表示小于中位数所在组下限的频数综合。 中位数的优缺点与应用 优点:不易受极端值影响 缺点:不适合代数计算 应用条件: 一组数据中有特大或特小两极端数值时; 一组数据中两端数据或个别数据不确切、不清楚时; 当需要快速估计一组数据的代表值时; 数据资料属于等级性质时。 (4)众数 众数的概念 理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。 粗略众数是指一组数据中频数出现最多的那个数。 众数的计算方法 (1)用观察法直接寻找众数 在频数分布表中,频数最多一组的组中值就是粗略众数。当两个相邻的组的频数都是最多时,那么两分组的分组点就是众数。 (2)皮尔逊的经验法 当频数分布呈正态或接近正态时,皮尔逊发现众数近似地等于3倍的中位数减去2倍的算术平均数。 众数的适用情况 当需要快

文档评论(0)

boss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档