北京交通大学刘晓分布拟合检验.pptVIP

下载本文档

4
0
约4.13千字
约 64页
2017-05-27 发布于四川
举报
版权申诉

北京交通大学刘晓分布拟合检验.ppt

1、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

三、分布拟合的检验 * * * * 表列联表（Ⅰ）数学成绩合计语文成绩合计表列联表（Ⅱ）数学成绩合计语文成绩合计 19世纪，伟大的生物学家Mendel按照颜色与形状把豌豆分为四类：黄而圆的，青而圆的，黄而有角的，青而有角的．Mendel根据遗传学的理论指出，这四类的豌豆个数之比应当为9︰3︰3︰1．他在粒豌豆中，观察到这四类豌豆的个数分别为：315，108，101，32．在实际观察中，由于有随机性，观察数一般不会恰好呈现9︰3︰3︰1的比例，因此就需要根据这些观察数据，对Mendel的理论进行统计检验．检验正是为了这种需要而产生的．除此之外，Mendel的其它许多数据都曾用检验法检验过．可见Pearson的检验对确立他的遗传学说起了一定的作用．而Mendel的实践向统计学家提出了一个很有意义的问题，也促进了统计学的发展．上述这种分类数据的检验问题的一般提法如下：根据某项指标，总体被分成类：．对此，我们最关心的是其比例问题，即属于各类的个体数在总体中所占的比例的大小．通常我们可从理论上、经验上提出一个如下假设：：类所占的比例为，．由于分类是完全的，所以．我们进行观察，从该总体中随机抽取个个体．假设其中属于类的观察个数为，．显然，．在成立时，个个体中属于类的“期望个数”应当为，．在统计学中，称为理论频数；称为实际频数．在假设为真时，实际频数应接近于理论频数． Pearson 提出用作为衡量实际频数与理论频数的偏差的综合指标．在假设为真时，的值倾向于较小；否则，就倾向于取较大的值．因此检验的拒绝域应当为． Pearson证明了下面的极限定理，根据这个定理，我们可以由给定的显著性水平，近似地确定出临界值．定理在假设成立时，有．注： ⑴ 分类数据的检验问题的显著性水平近似等于的检验的拒绝域为 ⑵ 在实际使用这个检验法时，样本量必须充分地大，并且在每个类中的实际频数都不应小于．例9︰3︰3︰1．．如果Mendel的理论是正确的，则在被观察的颗豌豆中，属于这四类的“理论频数”分别为．取，所以，因此检验的拒绝域为．而我们所观察到的实际频数分别为，由此算得统计量的值为．由于，所以不拒绝，可以认为Mendel的理论是正确的．为方便计算，可列出如下的表格：表1 Mendel豌豆试验的检验计算表在上述所讨论的分类数据的检验问题中，当原假设成立时，各类的比例（也就是所有的）都是完全已知的．但是在许多应用问题中，它们有可能只是部分已知的，其中还包含着有限个未知的实参数．看下面的例子：例人按性别和是否色盲分类如下：男女正常色盲按照遗传学模型，这些数字应有下列相对的概率：，其中．问数据是否与模型相符合？本题所要检验的假设为：其中分别为男性正常，女性正常，男性色盲，女性色盲的概率．由于依赖于未知参数，所以衡量实际频数与理论频数的偏差的综合指标中含有未知参数，因此它不能作为检验统计量，我们必须对它进行修改，一个很自然的做法就是将上式中的用它的估计量来替代．为此，我们首先求出参数的极大似然估计量，并由此得到的估计量．然后将此代入上式，得统计量．显然，它也可以用来衡量实际频数与理论频数的偏差，也就是数据与模型的偏差的综合指标．现在的问题是，当时，它的极限分布是否仍是分布？假如仍是分布，其自由度是否仍是？英国著名的统计学家R.A.Fisher解决了这个问题，从而推广了统计量的极限定理．根据某项指标，总体被分成类：．设类所占的比例为，．这里依赖于个未知参数．如果的极大似然估计量为，．那么．其中，．此时，显著性检验问题：类所占的比例为，．的显著性水平近似等于的检验的拒绝域为．例在上述色盲与性别的问题中，似然函数为，由似然方程，得的极大似然估计值为，从而得诸的估计值，分别为．由知理论频数分别为．取，由于，，所以，因此检验的拒绝域为．而我们所观察到的实际频数分别为，由此算得统计量的值为．由于，所以不拒绝，可以认为关于色盲与性别的观察数与遗传学模型是相符合的．设是取自总体中的一个样本，需要检验的原假设为：总体分布函数为．其中称为理论分布．它可以是一个完全已知的分布，也可以是一个仅依赖于有限个实参数且具体数学形式已知的分布函数．这个分布检