社会调查之抽样误差课件.pptVIP

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会调查之抽样误差课件

第四节 抽样误差与样本规模 一、误差的概念 ◆抽样中的总误差 1、登记性误差 2、代表性误差 ①系统性的代表性误差 ②偶然性的代表性误差——抽样误差 抽样误差 ——由于随机抽样的偶然性因素使样本各单位的结构不足以代表总体各单位的结构而引起的抽样指标(统计值)与全及指标(参数值)之间的偏差 ◆影响抽样误差大小的因素 1、全及总体各单位标志值的差异程度 2、抽样单位数的多少 3、抽样组织方式 4、抽样方法 二、抽样分布 抽样分布是根据概率的原则而成立的理性分布。 显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。 例: 我们先来看一个总体为10个个案的平均数抽样分布。 假如这10个人参加工作的年限分别为6、7、8、9、10、11、12、13、14、15年。 举例:总体为10个个案的平均数的抽样分布 样本容量为1,10次取样 样本容量为2,45次取样 样本容量为3,120次取样 样本容量为4, 210次取样 样本容量为5,252次取样 变化趋势 平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显。 中心极限定理 在一个含有N个元素且平均数为μ,标准差为σ的总体中,抽取所有可能含有n个元素的样本。全部可能的样本数目为m: 若用 , , … 来分别表示这m个样本的平均数,那么,样本平均数 的分布将是一个随n愈大而愈趋于具有平均数μ和标准差 的正态分布。 定理说明 当n足够大时(通常假定大于30),无论总体的分布如何。其样本平均数所构成的分布都趋于正态分布。 正态分布图 正态分布的特点: 1、单峰对称; 2、平均数、中位数、众数合一,都在峰点; 其中:Xi 为分布中任何一个值,μ是平均数;σ是标准差。 Z是距离平均数μ的标准差单位,又称Z分数。 三、抽样平均误差 ——即抽样平均数(或抽样成数)的标准差,它反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度 重复抽样条件下: 样本平均数 的抽样平均误差 重复抽样条件下: 样本比例p 的抽样平均误差 不重复抽样条件下: 样本平均数 抽样平均误差 不重复抽样条件下: 样本比例p 抽样平均误差 四、抽样极限误差 —— 在抽样推断中,抽样指标是一个围绕全及指标上下随机波动的变量,波动的幅度可以根据需要事先给定,这个可允许的误差范围,被称为抽样极限误差,又称绝对误差 〈例〉某校同学的身高为正态分布,平均值为170cm,标准差为10cm。 问:(1)高于平均数1.5个标准差的同学身高是多少? (2)162cm身高的同学距离平均数有几个标准差? (3)95%的同学身高会在什么范围内? 解1: 解2: 解3: (150.4~189.6) 五、样本规模 (一)影响样本规模的因素 1、抽样精度 2、总体标准差 (二)样本规模的估算 (基本样本量) 例1:对某型号电子元件10000只进行耐用性检查,根据以往抽样测定,元件合格率为95%,并求得耐用时数的标准差为600小时,问: 1)在重复抽样条件下,概率保证程度是68.27%,元件平均耐用时数的误差范围不超过150小时,要抽取多少元件做检查? 2)在重复抽样条件下,概率保证程度是99.73%,允许误差范围不超过4%,试确定所抽取的元件数目. 解: (三)对基本样本量进行调整 1、有限总体调整 2、设计效应因子 3、回答率 4、配额需要 5、经费 例2: 某次市场调查的一个问题是“如果让您只在下列三个品牌中进行选择,您的首选品牌是:①品牌A ②品牌B ③品牌C 调查是采用简单随机抽样方式从某地区共1850000个电脑用户中抽取1‰进行的,目的是了解这三个品牌在该地区的竞争力,试根据下表数据,以95%的置信度估计该地区首选品牌为A的男性用户在整个用户中的比例。 处理该类问题的要点: 1) 抽样分布的规律性:样本均值或样本比例的分布是以总体均值为均值,抽样误差为标准差的正态分布,即(以简单随机重复抽样为例): 2)Z值即是将这种正态分布标准化 标准化后的变量值与相应的概率是唯一的对应关系 回顾:正态分布变量的标准化: 针对样本均值 针对样本比例 3)Z值其实是绝对误差与抽样误差的比值(为简单化,将Z取正值)针对样本均值 针对样本比例 上述公式涵盖三个方面:一般的问题总是已知其中两个,求第三个 4)实际问题中总体平均数、比例、标准差是用样本来估计的。

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档