数据的描述统计数值法.pptVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

************第30页,共50页,星期日,2025年,2月5日3.3百分位数、四分位数与盒式图将数据递增排序,对于某个数值X,如果有p%的数据小于它,则称X为第p百分位数(percentile)第10百分位数第90百分位数*第31页,共50页,星期日,2025年,2月5日第25百分位数称为下四分位数或第一四分位数(firstquartile)记为Q1中位数、第50百分位数、第二四分位数第75百分位数称为上四分位数或第三四分位数(thirdquartile)记为Q3(Q3-Q1)内距或四分位差(interquartilerange)记为IQR*第32页,共50页,星期日,2025年,2月5日计算百分位数将数据按递增排序计算指数i=(p/100)n,n为样本容量如果i不是整数,取比i的整数,这个整数表示p百分位数的位置如果i是整数,则p百分位数是递增顺序排列中位置i与i+1的平均值*第33页,共50页,星期日,2025年,2月5日Example(p=10thPercentile)i=(10/100)12=1.2不是整数,取2第10百分位数为11,0707,52411,07018,21126,81736,55141,28649,31257,28372,81490,416135,540190,250*第34页,共50页,星期日,2025年,2月5日五数概括法最小值第一四分位数Q1中位数Md第三四分位数Q3最大值*第35页,共50页,星期日,2025年,2月5日盒子-胡须图

(Box-and-WhiskersPlots)五数概括的一种扩展,用Q1、Md、Q3以及四分位差绘制随机抽取20顾客对某品牌电脑的满意度进行评分(1-10分)135578888889999910101010*第36页,共50页,星期日,2025年,2月5日计算Q1=7.5,Md=8,Q3=9,IQR=1.5内栏(innerfence):(Q1-1.5IQR)至(Q3+1.5IQR)区间外栏(outerfence):(Q1-3IQR)至(Q3+3IQR)区间胡须的画法:找到Q1到内栏间的最小值以及Q3到内栏间的最大值*第37页,共50页,星期日,2025年,2月5日找出异常值轻微异常值(mildoutlier):内栏与外栏间的数值极端异常值(extremeoutlier):外栏之外的数值*第38页,共50页,星期日,2025年,2月5日Figure3.19*第39页,共50页,星期日,2025年,2月5日MegaStat绘制的盒式图*第40页,共50页,星期日,2025年,2月5日3.4加权与分组数据某些数值相对于其它数值可能更重要变量值的重要程度,通常称为权重(weight)加权均值与加权方差*第41页,共50页,星期日,2025年,2月5日案例:支持率的计算民调地区选民(百万)支持率东北部26.940.1%南部50.647.2%中南部34.645.1%西部32.539.2%*第42页,共50页,星期日,2025年,2月5日分组数据的统计描述概括成频数分布或直方图的数据原始数据无法观测到,只能看到每组的上下限和频数利用组中值和频数计算均值和方差属于加权形式*第43页,共50页,星期日,2025年,2月5日分组数据的均值和方差*第44页,共50页,星期日,2025年,2月5日3.5几何平均数(geometricmean)n个变量值乘积的n次方根适用于对比率数据的平均,尤其是时序数据主要用于计算平均增长率、平均收益率计算公式为5.可看作是均值的一种变形*第45页,共50页,星期日,2025年,2月5日一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率算术平均:几何平均:案例:股票投资平均收益率*第46页,共50页,星期日,2025年,2月5日平均发展速度、增长速度通常用几何平均法求得。计算公式为:第47页,共50页,星期日,2025年,2月5日案例:人口2000年-2007年平均增长率2000年2001年2002年2003年2004年2005年2006年2007年126743127627128453129227129988130756

文档评论(0)

xiaozhuo2022 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档