统计概念和公式.docVIP

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 2、数据分析所用的方法可分为描述统计方法和推断统计方法。 描述统计研究的是数据的收集、处理、汇总、图表描述、概括与分析等统计方法。 推断统计是研究如何利用样本数据来推断总体特征的统计方法。 3、按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。 顺序数据是只能归于某一有序类别的非数字数据。 数值型数据是按数字尺度测量的观测值,其结果表现为具体的数值。 4、按照统计数据的收集方法,可以将其分为观测数据和实验数据。 5、按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 6、统计数据主要来自两条渠道:数据的间接来源,即数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用;数据的直接来源,是通过自己的调查或实验活动,直接获得第一手数据。 7、使用抽样的方式采集数据的具体方式分为两类:概率抽样和非概率抽样。 常用的概率抽样方式有:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。 判断抽样属于非概率抽样,是指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为样本,实施时根据不同的目的有重点抽样、典型抽样、代表抽样。 8、搜集数据的基本方法:自填式、面访式、电话式。 9、抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。 非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。 10、数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。 数据审核就是检查数据中是否有错误,对于通过调查的原始数据,主要从完整性和准确性两个方面去审核。 数据筛选是根据需要找出符合特定条件的某类数据。 数据排序是按照一定顺序排列,以便研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。 11、累积频数是将各有序类别或组的频数逐级累加起来得到的频数。 向上累积是从类别顺序的开始乙方向类别顺序的最后一方累加频数(数值型数据则是从变量值小的一方向变量值大的一方累加频数。向下累积反之。 12、数据分组的方法有单变量值分组和组距分组两种。 13、直方图(分组数据)示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距;由于分组数据具有连续性,直方图的各矩形通常是连序排列;直方图主要用于展示数值型数据。 未分组数据:茎叶图和箱线图。箱线图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的,用于反映原始数据分布的特征。 14、统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,必要时可以在统计表的下方加上表外附加。 15、集中趋势是指一组数据向某一中心靠拢的程度,它反映了一组数据中心的位置所在。 16、数据分布是对称的,众数(M0)、中位数(Me)和平均数()必定相等。 17、描述数据离散程度采用的测度值,根据数据类型的不同分为:异众比率(分类数据)、四分位差(顺序数据)、方差和标准差(数值型数据)。 18、样本方差:未分组数据,组距分组数据 19、标准分数:对某一个值在一组数据中相对位置的度量,计算公式 20、离散系数:标准差与其相应的均值之比,对数据相对离散程度的测度消除了数据水平高低和计量单位的影响,用于对不同组别数据离散程度的比较。公式 21、偏态系数=0为对称分布;0为右偏分布;0为左偏分布。 22、峰态系数=0扁平峰度适中,0为扁平分布,0为尖峰分布。 23、分布(卡方分布):服从标准正态分布N(0,1),服从自由度n的分布。 P[(n)λ]=P,λ=(n),知n,p可查表求得λ。 24、t分布:X~N(0,1),Y~(n),X与Y独立,则t= 时,E(t)=0;时,D(t)= 25、F分布:Y与Z相互独立,Y与Z分别服从自由度为m和n的分布,, 则X服从第一自由度为m第二自由度为n的F分布。X~F(m,n) E(X)=,n2;,n4。 26、的抽样分布:、、……为某一总体中抽出的随机样本,为平均值。 ~N(u,) 仍是正态分布,为大样本。E()=u,D()= 27、样本比例的抽样分布:n为样本大小,具有某一特征的个体数X, 样本比例:,总体比例π。但n充分大,服从均值为π,方差为的正态分布。~N(π,),E(p)=π。 28、两个样本平均值之差的抽样分布:,。 ,。 ,属于正态分布。 29、参数估计就是用样本统计量去估计总体的参数。在参数估计中,用来估计总体参数的统计量的名称称为估计量,根据一个具体的样本计算出来的估计量的

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档