六西格玛系列之统计学-第2章描述性统计讲义.docx

六西格玛系列之统计学-第2章描述性统计讲义.docx

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章描述性统计描述定性数据的图形法和数值法每个观测值能落入一类(组)并且只能落入一类(组)对给定的类,类频数是指落入这个类中的观测值的个数对给定的类,类相对频率是指落入这个类中的观测值个数相对于观测值总数的比例条形图Minitab图形条形图用长方形表示定性变量的类(组),其中每一个长方形的高是类频数/类相对频率帕雷拖图Minitab统计质量工具Pareto图意大利经济学家Vilfredo Pareto,将定性变量的类(即长方形)按照高度从左向右降序排列的条形图饼图Minitab图形饼图用一个饼(圆)的一份表示定性变量的类,每份大小与类频数或类相对频率成比例描述定量数据的图形法点图Minitab图形点图数据集中每一个定量变量的数值表示为水平刻度尺上的一个点,当数值重复时,点垂直画在另一点之上茎叶图Minitab图形茎叶图定量变量的数值分为茎和叶两部分,可能的茎按顺序排在一列中,数据集中每一个定量变量的数值的叶放在相应茎的行上,有相同茎的数值的叶在水平方向按升序排列茎叶图 MPG N=100叶单位= 0.10 1 (茎)30 (叶)0 2 (茎)31 (叶)8 6 (茎)32 (叶)5799 12 (茎)33 (叶)126899表示大于等于33且小于34的测量值有6个 18 (茎)34 (叶)024588 29 (茎)35 (叶)01235667899 49 (茎)36 (叶)01233445566777888999(21)(茎)37 (叶)000011122334456677899最大组区间 30 (茎)38 (叶)0122345678 20 (茎)39 (叶12 (茎)40 (叶)0123557 5 (茎)41 (叶)002 2 (茎)42 (叶)1 1 (茎)43 (叶) 1 (茎)44 (叶)9直方图Minitab图形直方图定量变量的测量值分成若干组区间,每一个组区间有相同的宽度,这些组区间构成了水平轴刻度。确定落在每个组区间中的观测值的频数或相对频率(36~37,37~38,测量值37放在37~38组区间)。每个组区间上放一个垂直的长方形,它的高度等于组区间频数或相对频率构造直方图的步骤1.计算定量变量数据集的极差2.根据数据集中测量值的个数确定组区间的个数,根据极差和组区间个数确定组区间宽度。最小(即第一个组区间)组界应当比最小值小,选择适当的组区间宽度,使得没有测量值落在组界上数据集中测量值的个数组区间个数小于255~625~507~14大于5015~203.数出落入每个组区间的测量值个数,这个数称为组频数4.计算每一组区间组相对频率(组频数/测量值的总个数)5.直方图本质上是条形图,组区间就是类型,长方形的高度由组频数或组相对频率确定直方图适用于非常大的数据集,但是不能为我们指出单个测量值点图和茎叶图适用于较小的数据集,能提供数据集有用的细节(每一个测量值)描述定量数据的数值法统计量是由样本数据计算得到的数值描述性度量参数是总体的数值描述性度量中心趋势的度量1.算术平均(均值)/平衡点1.1实际问题中使用最频繁1.2体现了所有数值的影响1.3受极端值影响很大1.4样本均值用表示,总体均值用μ表示2.中位数测量值按升序(或降序)排列后位于中间的测量值2.1不包括所有测量值2.2受极端值影响很小2.3样本中位数用m表示,总体中位数用τ(Tau)表示2.4当测量值个数n为奇数时中位数=X[(n+1)/2],为偶数时中位数=[X(n/2)+X(n/2+1)]/22.5有时称中位数为中心趋势的耐抵性度量2.6对于偏度较大的数据集,中位数能较好的地描述数据分布的中心3.众数/峰点最大频数对应的测量值,很少作为中心趋势的度量如果从一块板上截下数据集直方图的轮廓,它将在算术平均(均值)的那一点保持平衡;中位数左右两边的面积均为50%;众数位于以最大频数/相对频率出现的点,即分布的峰点数据集有一点偏度或没有偏度的丘形分布,中位数和算术平均(均值)是基本相等的,而均值比中位数具有更好的数学性质,因此常用均值作为中心趋势的度量变异性的度量1.极差1.1极差R=最大测量值-最小测量值=Xmax-Xmin1.2极差是数据变异性相对不灵敏的度量,适用于小样本2.方差2.1样本方差S2,总体方差σ22.2有理论上的意义,因为它的单位是变量的平方,难于解释2.3样本方差计算公式2.4总体方差计算公式2.5为什么样本方差除(n-1)而不是n在容量为N的总体中,假设我们已经通过随机抽样的方式获得了一份容量为n的样本。有两个任务需要完成,一是归纳样本n个数据之间的分布状况;二是借助样本来推测总体的分布状况,即尝试以局部推测总体  

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档