样本选择方法.ppt

  1. 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
定量研究方法 样本量的确定方法 如何计算样本中每个回答单位的权数——加权问题。 缺失值的处理 选项-变量加权 项目无回答的来源 被访者中途退出调查 访问员遗漏调查项目 调查项目不完整 数据录入人为差错 异常值 项目跳答选项 不正确的数据处理 度量单位的不一致 排序不完整 缺失值处理的原则 缺失值是否存在系统偏差 系统偏差不能简单的取平均值 尽量用简单的方法处理缺失值 缺失值处理前要保留原始数据 加强质量控制和规范操作避免缺失值 采用有理论支持的方法处理 综合排序的缺失值处理 如果让10个消费者对30种产品/品牌偏好排序 每个消费者只对知晓的排序 存在大量的缺失数据 排队都是好的产品 用平均来处理不适当 用没有评价的次序的平均值代替较好 每个消费者的缺失都分别处理 不等概率抽样——不满足自加权 加权的等概率抽样往往满足不了我们的要求,有时也是不可实现的。 对于不等概率抽样,正确使用设计权数就尤为重要了。 例如:一个城市1000人和农村100人的分层抽样调查中,农村人口相对城市人数太少,我们希望农村分配的样本应该更多些。采用——不等概率抽样。 不等概率抽样 例:在某地公共交通系统的调查中,总体N=1100人,按地区分成两层城市(N1=1000)和农村(N2=100)。打算抽取n=250人的样本。 问:如果城市n1=200人,农村n2=50人,设计权数是多少? Wd2=2 n2=50 N2=100 农村 n=250 N=1100 合计 Wd1=5 n1=200 N1=1000 城市 不等概率设计权数 不等概率样本量 总体 大小 层 项目无回答 被访者接受了调查,但仅回答了部分问题。我们可以对这种无回答情况作相应的缺失值处理。 单位无回答 主要讨论单位无回答的设计权数调整。主要原因是被访者拒绝参加,无法联系,找不到等情况。 无回答主要有两种类型 如何处理无回答——修正设计权数 对权数进行调整的理论假设是回答单位能够代表无回答; 单位无回答者的设计权数需要根据回答者的结果进行重新分配; 通常的做法是用一个无回答调整因子乘以设计权数,由此得到无回答的调整权数; 一般情况下:无回答调整因子=样本单位权数/回答单位样本权数 自加权设计:无回答调整因子=样本单位数/回答单位样本数 例:从一个N=100人的总体中抽取一个n=25 人的简单随机样本。回答单位的数量记为nr,结果显示只有20个人提供了所需的信息。 问:那么,此时无回答的调整权数是多少? 步骤1:计算设计权数。 入样概率p为: 计算过程 因此,每个样本单位的设计权数为4。 步骤2:对无回答的设计权数进行调整。 由于在n=25个人中只有nr=20个人提供了所需的信息,那么最终样本量应为20。假定回答单位不仅能代表回答单位,而且能代表无回答单位,此时算得无回答调整因子为: 步骤3:计算无回答的调整权数。 无回答的调整权数wnr等于设计权数与无回答调整因子的乘积: 所以作出回答的20人中,每一个人都代表被调查总体中的5个人,把它们合在一起就代表整个总体共5 ?20=100人 (即n= wnr ?nr )。此时,对数据文件的每一个记录赋予权数5。 如果假定所有的无回答单位与回答单位具有相似的特征是合适的,那么可以对所有的回答单位使用相同的无回答调整因子。 不同的子总体往往具有不同的回答率,在这种情况下,对所有的无回答情形使用同一种调整方法将导致结果的偏误。 针对不同子总体分别修正设计权数 例如,城市和农村被访者,通常可能城市人具有更低的回答率;高收入的人通常比其他人具有更低的回答率。这种情况下,如果可行的话,应对回答率各异的子总体分别进行无回答调整。 例如:在某地公共交通系统的调查中,总体N=1100人, 按地区分成两层城市(N1=1000)和农村(N2=100)。 打算抽取n=250人的样本。 问:1. 如果城市n1=200人,农村n2=50人,设计权数是多少? 2. 实际回答情况是城市n1=150人,农村 n2=40人, 设计权数该如何修正? 计算过程 计算过程 Wd2=2 Wd1=5 设计权数 n=190 nr2=40 nr1=150 实际回答样本量 Wdr,2=2.5 n2=50 N2=100 农村 n=250 N=1100 合计 Wdr,1=6.67 n1=200 N1=1000 城市 修正设计权数 样本量 总体 大小 层 主要有两个原因: 首先,我们希望将调查的估计值与已知的总体的总值,或者与从另一调查所得的估计值相匹配,这是

文档评论(0)

wxc6688 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档