吴喜之统计学基本概念和方法概率和分布.pptVIP

吴喜之统计学基本概念和方法概率和分布.ppt

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
吴喜之统计学基本概念和方法概率和分布

另一个常用离散分布是Poisson分布 (翻译成“泊松分布”或“普阿松分布”)。 * 在不同条件下,同样事件在单位时间中出现同等数目的概率不尽相同。 比如中午和晚上某商店在10分钟内出现5个顾客的概率就不一定相同。 因此,Poisson分布也是一个分布族。族中不同成员的区别在于事件出现数目的均值l不一样。 * 这里点间的连线没有意义,仅仅为读者容易识别而画,因为Poisson变量仅取非负整数值 * ,也就是说,一次抽取若干物品,每检查一个之后并不放回 * * * * * As a result of this class, you will be able to ... 想象连续变量观测值的直方图;如果其纵坐标为相对频数,那么所有这些矩形条的高度和为1;完全可以重新设置量纲,使得这些矩形条的面积和为1。 不断增加观测值及直方图的矩形条的数目,直方图就会越来越像一条光滑曲线,其下面的面积和为1。 该曲线即所谓概率密度函数(probability density function,pdf),简称密度函数或密度。下图为这样形成的密度曲线。 * 正态分布的密度曲线是一个对称的钟型曲线(最高点在均值处)。正态分布也是一族分布,各种正态分布根据它们的均值和标准差不同而有区别。 近似地服从正态分布的变量很常见,象测量误差、商品的重量或尺寸、某年龄人群的身高和体重等等。 在一定条件下,许多不是正态分布的样本均值在样本量很大时,也可用正态分布来近似 * 左边是N(-2,0.5)分布,右边是N(0, 1)分布 * 当然,和所有连续变量一样,正态变量落在某个区间的概率就等于在这个区间上,密度曲线下面的面积。 比如,标准正态分布变量落在区间(0.51,1.57)中的概率,就是在标准正态密度曲线下面在0.51和1.57之间的面积。 很容易得到这个面积等于0.24682;也就是说,标准正态变量在区间(0.51,1.57)中的概率等于0.24682。如果密度函数为f(x),那么这个面积为积分 * 图4.6表示了0.05上侧分位数za=z0.05及相应的尾概率(a=0.05)。有些书用符号z1-a而不是za;因此在看参考文献时要注意符号的定义。 * 不同的样本量通过标准化所产生的t分布也不同, 这样就形成一族分布。 t分布族中的成员是以自由度来区分的。这里的自由度等于样本量减去1(如果样本量为n,刚才定义的t分布的自由度为n-1)。 由于产生t分布的方式很多,简单说自由度就是样本量减1是不准确的。自由度甚至不一定是整数。 * 图4.9表示了自由度为2的t(2)分布右边的尾概率(a=0.05)。 * * 由于使用了药厂的0.6成功概率。这个模型是基于药厂的观点的。 可以基于这个模型计算100名患者中有少于或等于40名患者治疗有效的概率。 通过计算(或查表,后面会详细描述)易得,在药厂观点正确的假定下,这个概率为0.000042。这说明,如果药厂正确,那么只有40名患者有效这个事实是个小概率事件,即“少于或等于40名患者有效”的可能性只有大约十万分之四。 这样在药厂的观点和事实之间有了矛盾。是事实准确还是药厂准确呢? 显然人们一般不会认为药厂的说法可以接受。这样,就利用小概率事件来拒绝了药厂的说法。 这种用小概率事件对假定的模型进行判断是后面要介绍的假设检验的基础。 * 两条正态分布的密度曲线 标准正态变量在区间(0.51, 1.57)中的概率 §4.4.1 正态分布 对于连续型随机变量X,a下侧分位数(又称为a分位数,a-quantile)定义为数xa,它满足关系 这里的a又称为下(左)侧尾概率(lower/left tail probability) §4.4.1 正态分布 而a上侧分位数(又称a上分位数,a-upper quantile)定义为数xa,它满足关系 这里的a也称为上(右)侧尾概率(upper/right tail probability)。 N(0,1)分布右侧尾概率P(zza)=a的示意图 §4.4.2 c2-分布 一个由正态变量导出的分布是c2-分布(chi-square distribution)。 n个独立正态变量平方和称为有n个自由度的c2-分布,记为c2(n)。c2-分布为一族分布, 成员由自由度区分。 由于c2-分布变量为正态变量的平方和,它不会取负值。 自由度为2、3、5的c2-分布密度曲线图 §4.4.3 t-分布 正态变量的样本均值也是正态变量,能利用减去其均值再除以其(总体)标准差来得到标准正态变量。 但用样本标准差来代替未知的总体标准差时,得到的结果分布就不再是标准正态分布了。它的密度曲线看上去有些象标准正态分布,但是中间瘦一些,而且尾巴长一些。这种分布称为t-分布(t-distribution,或

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档