- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 统计概念及描述统计分析 3.1 统计学基本概念 3.1.1 统计学概述 统计学起源于17世纪,它主要是由于当时的贵族阶层对机率数学理论很感兴趣,以及政治科学、天文学发展的需要。 瑞士数学家J.Bernouli(1654~1705)系统论证了大数定律,后来他的后代D. Bernouli(1700~1782)将概率论理论应用到医学和人类保险。 1733年De Moiver发现了正态分布理论, 德国数学家和天文学家Gauss(1777~1855)在研究观察误差理论时,也独立发现了正态分布的理论方程。所以,常有人将正态分布理论称为Gauss分布。 3.1 统计学基本概念 3.1.1 统计学概述 1870年,英国遗传学家Galton(1822~1911)在研究人种特性时提出了相关与回归的概念。之后Galton和他的继承人K.Plarson(1857~1936)于1889年发表了《自然的遗传》,书中K.Plarson首先提出了回归分析问题,并给出了计算简单相关系数和复相关系数的计算公式。 K.Plarson在研究样本误差效应时,提出了测量实际值与理论值之间偏离度的指数卡方(x2 )检验问题。 K.Plarson的学生Gosset(1876~1937)对样本标准差进行大量研究,于1908年以笔名“Student”在该年的生物统计学报(Biometrika)上发表论文,创立了小样本检验代替大样本检验的理论和方法,即t分布和t检验法。t检验已成为当代统计工作的基本工具之一,它也为多元统计分析理论的形成和应用奠定了基础。 3.1 统计学基本概念 3.1.1 统计学概述 英国统计学家Fisher于1923年发展了显著性检验及估计理论,提出了F分布和F检验,创立了正交试验设计和方差分析。 Neyman(1894~1981)和S.Pearson分别于1936年和1938年提出了一种统计假说检验学。假说检验和区间估计作为数学上的最优化问题,对促进统计理论研究、应用发展以及对试验结果作出正确判断、并进一步得到正确结论具有非常实用的价值。 3.1.2 描述统计简介 统计学是用科学的方法采集、整理、汇总、描述和分析统计数据,并根据统计结果进行推断和决策的方法论科学。统计学主要分为两大分支:描述统计学和推断统计学。 3.1.2 描述统计简介 描述统计学:是研究对数据的收集、整理、汇总、显示、分析,主要是对数据的数量特征进行描述的方法。包括:图形描述和数量特征描述。数量特征主要有:均值、中位数、众数、极差、最大值、最小值、方差、标准差等统计指标。 推断统计学:是研究从总体中随机抽取样本,利用样本提供的信息或随机试验产生的数据进行分析,依据样本数据的分析结果对总体进行推断的方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。它主要包括。抽样分布、估计理论、假设检验、回归分析、非参数检验方法、预测和决策等内容。 常用的统计学概念: 总体(Population):一个统计问题所研究对象的全体。 样体(Sample):从总体中抽取一定数量的个体进行研究,这部分个体称做样本。 随机抽样(Random Sample):从总体中随机抽取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。 进行统计分析时,经常使用一些统计性指标来描述数据的统计量,也称为描述性统计量。 常用的描述统计量: N(样本数量): 样本中个体的数量称为样本容量或样本数量。统计学中常将样本数N=30,称为小样本,N30称为大样本。从统计学角度,通常有这种规律:大样本通常符合正态分布,小样本则不一定符合正态分布。 3.2统计量的抽样分布 任何变量都会服从某种分布状态。常见的理论分布有:二项分布、泊松分布、正态分布。常用的统计数分布有:样本平均数分布、t分布、F分布、 分布。 随机变量的分布可用分布函数来表示其概率。离散型变量的概率分布如二项分布、泊松分布,连续型变量的概率分布如正态分布。下面我们对这些统计概念做简单介绍。 3.2.1 概率、概率分布 3.2.1 概率、概率分布 3.2.1 概率、概率分布 3.2.2 二项分布 二项分布是一种离散随机变量的分布。 对于二项分布总体,在进行重复抽样试验中,都具有如下共同特征: (1)每次试验只有两个对立结果,如种子的发芽或不发芽,它们出现的概率分别是р或q (q=1-р)。 (2)试验具有重复性和独立性。重复性是指每次试验条件不变,即在每次试验中事件A出现的概率皆为р;独立性是指任何一次试验中事件A的出现与其余各次试验中出现何种结果无关。 3.2.2 二项分布 3.2.3 泊松分布 3.2.4正态分布 正态概率分布有以下重要特征:(见图4-2) (1)正态分布是对称分布,对称轴是x
文档评论(0)