- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第八章描述统计的原理与应用
Data Graphing
课程目标
介绍描述统计的原理
了解集中量数的特性与各量数
了解变异量数的特性与各量数
了解相对量数的特性与各量数
了解标准分数的特性与各量数
熟习描述统计的SPSS运作
描述统计
描述统计的定义
一套用以整理、描述、解释资料的系统方法与统计技术
数据从初始状态(raw data)成为可被理解的统计量数(statistic)的一套操作程序
透过统计量数来描述大量资料,并作为彼此沟通的共同符号语言
第一节
集中量数
集中量数(measures of central location)
用以描述一组数据或一个分配集中点的统计量数
一个能够描述数据的共同落点的指标。
常用的集中量数有平均数、中位数及众数
第一节
平均数
平均数(mean;以M表示)
取某一变项的所有数值的总和除以观察值个数所得到的值
因为是将数据直接以数学算式来计算平均值,又称为算术平均数(arithmetic mean)。
母体资料得出的平均数需以希腊字μ表示
第一节
中位数
中位数(median;或以Mdn表示)
又称为中数、百分等级为50的百分位数(P50)或第二四分位数(Q2; second quartile)。
将某一个变项的数据依大至小或由小至大排列,取位居最中间、或能够均匀对分全体观察值的分数
在中位数之上与之下,各有50%的观察值。
50、55、60、60、60、65、66、70、90
50、55、60、60、60、65、66、70、90 、95
62.5
第一节
众数
众数(mode;或以Mo表示)
一组分数中,出现次数最多的一个分数
一组数据中最典型(typical)的数值或次数分配最高点所对应的分数
是各集中量数当中,最容易辨认的量数
一个分配有两个分数具有相同的最高次数,此时即出现了双众数,称为双峰分配(bimodal distribution)
50、55、60、60、60、65、66、70、90
第一节
集中量数的特性与优缺点比较
第一节
三种集中量数与分配形状的关系
第一节
变异量数
变异量数(measures of variation)或离散量数
用来描述观察值在某一个变项上的分数分散情形的统计量
描述统计中,集中量数必须搭配变异量数,才能反应一组数据的分布特征
常用的变异量数包括全距、四分差、变异数及标准差
第二节
全距
全距(range)
一组分数中最大值(Xmax)与最小值(Xmin)之差
是一群分数变异情形最粗略的指标
全距容易计算,适用性高,可以应用在名义变项与顺序变项,来求出变项当中类别的多寡。
缺点是不精确也不稳定,无法反应一个分配的每个数值的状态。
第二节
四分差
四分差(semi-interquartile range; QR)
是一组数据当中的第三四分位数(区隔高分端的前25%的分数,简称Q3)与第一四分位数(区隔低分端的后25%的分数,简称Q1)距离的一半
中间百分之五十的样本分数差距的二分之一
第二节
离均差与平方和
离均差
一组数据中,各分数与平均数的距离,通常以小写的x来表示
当离均差为正值时,表示分数落在平均数的右方
离均差为负值时,表示分数落在平均数的左方
平均数是每一个分数加总后的平均值,为一组分数的重心位置
离均差平方和(sum of squares; SS)
SS的概念可以类比为面积的概念,表示分数与平均数变异的面积和
deviation score= x =(X - μ)
第二节
变异数与标准差
变异数
平均化的离均差平方和
标准差
变异数的开方,以σ表示。标准差或变异数越大者,表示该分配的变异情形较大。
第二节
变异数的不偏估计数
标准差与变异数的不偏估计数的主要差别在于分母项为N-1而非原来的N
N-1称为自由度(degree of freedom;df),表示一组分数当中,可以自由变动的分数的个数。
在离均差的计算上,自由度为样本数减1,表示在N个观察值中,只有N-1个数字可以自由运用于离均差的计算。
第二节
变异量数的特性与优缺点比较
第二节
偏态(Skewness)
描述一个变项的对称性(symmetry)的量数称为偏态系数
不对称的资料称为偏态资料,依其方向可分为负偏(negatively skewed)(或左偏,即左侧具有偏离值)、正偏(positively skewed)(或右偏,即右侧具有偏离值)与对称(symmetrical)三种情形
第三节
地板与天花板效应
地板效应(floor effect)
指数据多数集中在偏低的一端,但在高分端则有极端值,分数不容易突破低分端,但会往高分端延伸,彷彿有一个地板(或真的存在一个低分限制条件)阻挡了数据往低分移动。
由
文档评论(0)