- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言统计第七章 假设检验
第七章 假设检验 第一节 引 言 假设检验是推断统计的最重要的一个部分。语言研究经常要涉及统计值之间的差异问题,即在比较两个样本统计量(比如平均数、相关系数等)或者样本统计量与相应的总体参数之间的差异的基础上,推断总体参数之间是否确实存在差异。简单来说, 我们先对两个 (或多个)异提出一个假设,然后在样本统计量的基础上,运用适当的统计手段对该假设进行检验,就可以发现在多大程度上(或有多大的可能性)两者之间的差异是真正存在的。 第二节 实验研究 实验研究实质上是一个假设检验的过程,一般来说,有以下几个步骤: (1)首先对研究结果作出预测或提出假设:如果X出现,那么 Y 将会随之出现。假设不能凭空而来,而是要有一定的依据,譬如已有的理论或研究结果等。 (2)操纵某一或某些因素,以创造使Y出现的条件X。所操纵的因素就是我们要研究的变量。与此同时,要尽量控制所有其它变量,如果不加以严格的控制,就有可能使研究结果模糊不清。 第三节 假设 一、 假设的特征 如前所述,实验研究是一个假设检验的过程,因此我们必须对假设有一定的了解。简单地说,假设就是根据已知理论与事实等对研究结果所作出的预测。一般来讲,假设应具备以下几个特征:它要表明两个或多个变量之间的关系;要用陈述句的形式来表达,措辞要清楚明确;要具有可检验性。例如,上述有关阅读材料的熟悉程度的假设就是用陈述句的形式清楚、明确地表明了熟悉程度与阅读质量两个变量之间的关系,然后我们再用实验的方法来检验这一假设的有效性。 第四节 假设检验 在实验研究中,我们不是直接去证实 的正确性,而是去设法推翻 , 也就是先假设有关参数之间不存在差异,然后再通过实验收集证据,看能不能推翻这一假设。这时,只要找到一条反证,就足以证明零假设是错误的。采用这种检验假设的方法,就能够得出确定的结论。如果推翻了零假设(即 为真),就表明有关差异是由各种误差造成的, 就表明差异确实存在, 那么就接受与零假设对立的备择假设 (即 为真) ; 如果无法推翻它 (即 为真),而不是真正的差异,那么就接受零假设,而拒绝有关备择假设。 二、 显著水平 在决定是否能推翻零假设时,必须确定一个允许的误差限度,即随机误差造成的差异在多大范围之内才能推翻零假设。这个范围用概率表示,譬如5%,1%的等(或0.05, 0.01等)。 如果随机误差的概率 (即可能性)为 ,就表示当随机误差造成的差异在等于或小于5%,就可以推翻零假设。如果零假设被推翻,我们就说观察到的差异有显著意义或者说检验有显著意义,所以这个概率通常称为显著水平。 三、 显著性检验中的两类错误 上面谈到,我们在对差异进行显著性检验时有可能得出错误的结论。一种情况是 “错误地拒绝” , 即零假设成立或属真时 (也就是说不存在真正的差异,所观察到的差异只是由随机误差造成的),应该接受零假设而我们却拒绝了。 另一种情况是 “错误地接受” , 即零假设不成立或属假时 (也就是所观察到的差异是确实存在的),应该拒绝零假设而我们却过于谨慎,认为没有足够的证据推翻它,所以在不该接受零假设时接受了它。 四、检验统计值与临界值 误差概率是否低于某水平,是用根据样本所计算的一个值来判断或检验的,这个值就叫做检验统计值。显著水平(即认为差异显著时所允许的最大随机误差概率)其实就是抽样分布曲线中处于尾端部分的面积。当我们说“低于某个显著水平”时拒绝零假设,就等于说尾端的面积要小于该面积,这个面积或区域叫做 “临界区域” 或 “拒绝区域” , 界定该区域的值叫做临界值, 也就是对应于该区域面积的Z值、t值等。 五、 单尾与双尾检验 我们已经知道,在检验零假设时,要同时提出适当的备择假设。备择假设预测总体参数之间存在差异,但是具体来讲,又有两种情况。一种在指出存在差异的同时, 还指出差异的方向 (即 “大于” 、 “小于” 、 “高于“低于” 等) , 例如: 六、 参数检验与非参数检验 所谓的“参数检验”一般对所涉及的变量的测量水平、总体的分布形态、总体的方差等方面有一定的要求。严格来讲, 参数检验只适用于连续性的等距 (或比率) 变量, 譬如考试分数。 此外,参数检验一般都要求样本所来自的总体呈正态分布,因为这对决定检验统计值的抽样分布非常重要。当数据为正态分布时,参数检验最为有效,随着其偏斜程度的增加,参数检验的有效性也随之降低。不过,这一要求在有些情况下可以有所放松,譬如当样本容量较大时,根据“中心极限定理”,即使总体的分布为非正态,平均数的抽样分布也会接近正态。 七、假设检验的一般步骤 对于多数假设检验,检验的过程都是一样的:
文档评论(0)