- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
[农学]第二章 数据资料的整理
第二章 资料的整理 钟爱华 2总体和样本 总体:研究对象的全体,具有共同性质的个体所组成的集团。样本:直接观察测量研究的对象。总体和样本的基本组成单位都是个体,由有限个个体组成的总体称为有限总体,反之为无限总体。组成样本的个体少的样本称为小样本,反之,为大样本。 在实际研究中还有一类假想总体。例如进行几种饲料的饲养试验,实际上并不存在用这几种饲料进行饲养的总体,只是假设有这样的总体存在,把所进行的试验看成是假想总体的一个样本; 样本中所包含的个体数目叫样本容量或大小(sample size),样本容量常记为n。通常把n≤30的样本叫小样本,n 30的样本叫大样本。 研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。 3参数与统计量 参数:总体的特征量。(总体平均数、总体方差等) 统计量:样本的特征量。(样本平均数、样本方差等) 两者的关系:通过统计量估计推算参数。 常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差; 常用拉丁字母表示统计量,例如用 表 示样本平均数,用S表示样本标准差。 4随机抽样和随机样本 抽样:从总体中抽取一部分直接进行研究的过程。随机:所有的对象(个体)都有相等的机会被抽取。随机抽样所得的样本称随机样本。 5误差和错误 误差:测量值与真值之间的差异,不可避免。误差=测量值—真值错误:人为的差错,可避免。 6准确性和精确性 准确性是指测量值接近真值的程度。精确性:变异量重现性指标。同一对象重复测量,一致性高,精确度高。精确性是准确性的必要条件。 7效应和互作 效应是指因素影响的结果,也称效果。效应分为有效和无效两种,有效又可分正效和负效两种。 互作是指因素的协同效应,总效应不等于分效应之和即表明具有因素互作,总效如大于分效应之和为具有正互作效应,总效如小于分效应之和为具有负互作效应。 第二节 资料的分类 数据的整理:就是把大量复杂的数据进行整理归类,使其系统化,便于统计分析,从而得出正确的科学结论。一.资料的概念 定义:资料是指研究对象的信息材料。 特点: 数字性:应以数字形式表示 大量性:对大量相象或者同类相象观察所得的数据资料 具体性:已经实现的事实 二.资料的类型1 数量性状资料:简称数性资料,可分两类: ①连续性变数(continuous variable)或计量资料 可以用工具直接测量的量,如身高、体重等。 特征:连续性变量,不间断量。 ②不连续性或间断性变数(discontinuous or discrete variable)或计数资料 计数得到的数性资料,一般都是自然数,如人数,天数,种子数。 特征:以整数计量,非连续性变量,间断性量。 2 质量性状资料:简称质性资料,指不能或不易直接测量能观察的性状资料,如颜色、性别、状态等描述性特征。常用两种方法数量化: ① 等级评定: 如人的健康状况分为优,良,一般,差;生存状态分为生或死等。 ② 统计次数法或归类计数:于一定总样或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。如黄花64朵,白花56朵。 第二节 数据资料的整理 一、次数分布表 间断性变数资料的整理。 连续性变量资料的整理 步骤: (1)数据分组: (2)计算频率分布 3、属性变数资料的整理 也可可用类似次数分布的方法来整理。 把资料按各种质量性状进行分类 分类数等于组数 归组:按个体在质量属性上的具体表现。 二、次数分布图(统计图) 1.方柱形图(histogram)(P书39-40) 适用于表示连续性变数的次数分布 2. 条形图 (Bar Chart) 适用于间断性变数和属性变数资料 3. 饼图 (Pie Chart) 饼图适用于间断性变数和属性变数资料,主要表示变数中各种属性或各种间断性数据观察值总观察个数中的百分比。 4. 多边形(polygon) 表示连续性变数资料的一种普通方法,且在同一图上可比较两组以上的资料 5. 线形图(dynamic curve graph) 表示数据的动态变化趋势。 三、统计表 目前常用的是三线表 四、原始数据的检查与核对 数据检查与核对,应注意以下三个方面 (一)数据本身差错 1. 记录不全:丢失、损坏、遗漏 2. 记载错误:笔误、虚构 3. 测量工具不准:测量技术不熟练等原因所造成的错误 所以对于特数值(如极大或极小的),应反复核实。 (二)取样差错 取样不全或过少或非随即取样 (三)数据不合理的合并
文档评论(0)