等概率整群抽样.pptVIP

下载本文档

3
0
约1.39万字
约 74页
2024-11-20 发布于广东
举报
版权申诉

等概率整群抽样.ppt

1、本文档共74页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

*（三）选择样本群个数n设计一个整群抽样是一个迭代过程：（1）确定一个需要精度e（2）选择psu和子样本的规模（3）推测该设计方案所获得的方差（4）设定满足精度的n（5）重复直到调查花费在你的预算内。第59页,共74页，5月，星期六，2024年，5月如果群规模相等，我们忽视psu水平的有限总体修正系数，即有：一个近似100（1-a）%的置信区间为：为了达到一个期望的置信区间的半宽度e,使第60页,共74页，5月，星期六，2024年，5月*五、系统抽样定义:将总体中的所有元素按一定顺序排列，在规定范围内随机抽取一个元素作为初始单元，然后按事先规定好的规则确定其他样本单元，这种抽样方法称为系统抽样。系统抽样是一种特殊的且群规模相等的整群抽样。第61页,共74页，5月，星期六，2024年，5月假设要抽取规模为3的样本，总体中含12个元素：123456789101112。要抽取系统样本，就可以在1到4之间随机选择一个数。抽取该元素，并在其之后每隔3个元素再抽取1个。因此总体包含了了4个psu(尽管各元素不连续，但可以看作是群)：{1，5，9}{2，6，10}{3，7，11}{4，8，12}现在从中抽取由1个psu构成的简单随机样本即可。第62页,共74页，5月，星期六，2024年，5月在包含NM个元素的总体中，容量为M的系统样本共有N种可能的选择。我们仅仅观测了包含系统样本的那个群的均值：群规模相等的1阶整群抽样产生了无偏估计，即有：对于一个简单的系统样本，在N个群中选取了n=1个群，于是得到理论方差为(5.33)第63页,共74页，5月，星期六，2024年，5月忽略有限总体校正系数，如果ICC为负，则系统抽样比容量为M的SRS更有效。不过由于n=1，无法获得的无偏估计。要估计方差需要对总体结构有所了解。三种不同总体结构：（1）随机次序列表：与SRS相似（2）增序或降序样本框：比SRS更有效（3）周期性模式样本框：比SRS效果差(5.33)第64页,共74页，5月，星期六，2024年，5月随机次序列表：总体的排列次序与感兴趣的特征无关，比如人口抽样框中名单按姓氏字母排列。预计ICC近似0。此时，SRS与系统抽样会产生相同的结果。增序或降序样本框：比如财务记录的排列可能是最大金额开始、最小金额在最后。这样的总体被称为具有正的自相关性：邻近的元素比间隔远的元素更为类似。有效性：分层抽样系统抽样SRS。第65页,共74页，5月，星期六，2024年，5月周期性模式样本框：当总体以循环或周期性次序排列，而抽样的间隔恰好是周期的倍数时，系统抽样最危险。假定总体取值(按次序排列为)123123123123123，抽样间隔为3，则系统样本中所有元素都是相同的。得到的方差为0，而真实的方差为2/3。当研究人员想要获得总体的代表性样本、而又没有任何先验的资源来构造抽样框时，往往会采用系统抽样的方法。在采用系统抽样的很多情形中，系统样本都可以作为SRS样本加以处理。第66页,共74页，5月，星期六，2024年，5月5.6整群抽样中基于模型的推理随机效果的方差模型为整群抽样提供了一个基本结构：其中是服从均值为0，方差为的分布。是服从均值为0，方差为的分布。且所有的和都是相互独立的。(5.34)第67页,共74页，5月，星期六，2024年，5月可知模型意味着一个群的总期望值随着群内元素数目的增加而线性增加。模型的群内相关系数被定义为让，可得容易看出模型中的取值总是正值,与ICC可以取负值不同,所以用模型M1描述数据,相同样本下整群估计必然比简单抽样效率低。(5.9)(5.7)第68页,共74页，5月，星期六，2024年，5月对模型M1做线性估计量为:其中为常数,总体总值为:则偏差为5.6.1用模型进行估计第69页,共74页，5月，星期六，2024年，5月由上式可知当时,是无偏估计量,这时方差为:(5.36)第70页,共74页，5月，星期六，2024年，5月基于设计