- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言统计第二章 数据的初步整理——统计图表
第二章 数据的初步整理 ——统计图表 第一节 范畴型数据的整理 第二节 数值型数据的整理 一、原始数据 二、次数分布表 三、次数分布图 第一节 范畴型数据的整理 在语言研究中 经常要把研究对象(人、反应、语言现象等)按某种标准分成相互排斥的类或范(或者根据多种标准交叉分类),这类数据叫做范畴型数据(见第一章“称名变量”)。对于范畴型数据的整理,主要是进行分类并计算出每一类的观察次数和相对次数(即在总次数中所占的百分比),最后以表和条线图的形式表示出来。 第二节 数值型数据的整理 语言研究中更经常遇到的是数值型数据,譬如考试分数、句子阅读时间、每句单词数等。如果数据量很小(譬如只有几个数值),把它列举出来即可,而不需进行任何整理,但是对于数量较大的数据,则必须利用图表进行初步整理,才能更易看出其中带有规律性的特点,尤其是数据中各数值的分布情况,譬如数据的集中趋势及离中趋势(详细讨论见第三章),即数据的典型数值以及数值之间的差异程度。 一、原始数据 下面一组数据为一篇英语阅读材料中100个句子的长度数据(以音节数表示): 二、次数分布表 尽管通过排序,数据的条理性有所提高,但是表2.2 (b) 仍然不够简明,不能做到一目了然。从表中可以看出,数据中数值出现的次数或频率是不同的,有的只出现一次,而大部分是重复出现的,如果把重复出现的数值在表中只列举一次,随后标明其出现的次数,就可以把数据进一步压缩,使其更加条理化。这样的表称为次数分布表。 1.未分组与分组次数分布表 次数分布表示数据的散布情况,而次数分布表则是对数据进行初步整理的重要手段,它能较为直观地表示出数据的分布情况,使人们得以大体上了解数据的平均水平和差异情况等。一般来讲,次数分布表的最左边一列为各个数值,接下来为登记次数,其次为各数值出现的次数。上述句子长度数据的次数分布表如下: 2.编制分组次数分布表的方法 编制分组次数分布表的关键是确定组距和组数。具体方法如下: (1)求全距或两极差:全距是指一组数据中最大数值与最小数值之差,因此,只要在数据中找出最大数值与最小数值,然后从前者减去后者,即得全距。 (2)求组距:组距也叫做分组区间,指每组中最高数值(成为“上限”)与最低数值(成为“下限”)之间的距离,常用符号i表示,为了便于计算分组区间和组中点。各组组距应尽量相等。常用组距一般为2,3,5,10等,但最好取单数,这样便于定组中点。为了能确定一个最佳的组数,当数据的总体分布为正态时,可以用下面的公式计算 三、次数分布图 如果用统计图来表示数据的次数分布,则更加直观清楚。比较常用的统计图有次数分布直方图和次数分布多边图。这两种图都是用面积来表示数据的分布。 1.次数分布直方图 分组数据的次数分布直方图的绘制方法如下: (1)画一个直角坐标系,在横坐标上标明各分组区间,在纵坐标上标出次数。分组区间一般有两种标示方法:一种是标出各组的下限;另一种是标出各组的组中点。 小 结 如前所述,原始实验数据往往杂乱无章,如果不加以适当的整理,大量有份值的信息就会被掩盖起来,同时也无法进行进一步的统计分析,这样的数据是说明不了什么问题的。因而,统计分析的第一项重要工作就是对原始数据进行初步整理、归纳和分类,使其最突出、最重要的特征得以显现出来。本章介绍了在语言研究中对数据进行整理压缩的常用图表的编制方法和注意事项。 * * 同任何研究一样,语言研究的目的是为了探讨和说明问题,以便深入地了解事物或现象的本质及其相互关系,而对数据的统计分析是实现这一目的的重要一环。对原始数据进行整理的基本方法之一是编制统计图表。统计表把被说明的事物及有关统计数字分门别类地整齐地表示出来,简洁明了,易于比较分析;统计图则使数据的突出特征具体、形象、直观、生动地展示出来,易于理解,且印象深刻。因而,图表的适当应用可以起到去粗取精、化繁为简的作用。 例如,我们从学生的英语作业中收集到90个错误,经分析,其中30个是由汉语干扰造成的,25个是由过度概括造成的 ,个是个是由教学方法不当造成的,20个是由教学方法不当造成的,15个是由其它原因造成的。此数据可以整理如下表(相对次数也可以加括号放在次数之后): 该数据也可以用条线图进行更直观的表示: 坐标中横坐标代表范畴或类别,纵坐标代表每个类别的观察次数。 表2.2(a) 100个英语句子的长度值﹡ 29 40 36 58 20 23 44 18 47 18 22 17 13 12 11 20
文档评论(0)