民意调查的抽样.pptVIP

下载本文档

0
0
约2.49千字
约 27页
2025-07-26 发布于广东
举报
版权申诉

民意调查的抽样.ppt

1、本文档共27页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第1页，共27页，星期日，2025年，2月5日課程大綱抽樣原理隨機抽樣等距抽樣分層分段抽樣非隨機抽樣第2页，共27页，星期日，2025年，2月5日抽樣原理(1)由於我們不可能訪問母體中所有的個體，所以必須進行抽樣。抽樣一定會有誤差，也就是根據樣本的調查結果跟真實母體之間有一定的差距，稱為抽樣誤差。抽樣誤差代表一種區間，也就是樣本估計的結果被包含在一定的上下限。第3页，共27页，星期日，2025年，2月5日抽樣原理(2)抽樣誤差的估計為若干個樣本標準誤σ/sqrt(n)。當我們做無數次抽樣之後，所得到的每一個樣本平均值將形成一個常態分布。而這些樣本平均值的離散程度就是樣本標準誤。如果樣本抽的次數夠多，真正的母體平均值μ應該等於所有樣本平均值的平均值加減一定的標準誤。但是我們不可能抽無限次的樣本，只能假定單一抽樣就代表無限次抽樣後的平均值。因此我們對母體平均值的估計就是依照抽樣結果。第4页，共27页，星期日，2025年，2月5日常態分布圖第5页，共27页，星期日，2025年，2月5日抽樣原理(3)根據上圖，我們知道，68%的樣本平均值會落在μ加減一個標準誤的範圍中。如果是μ加減兩個標準誤的範圍，則會包含95%的樣本平均值。如果是μ加減三個標準誤的範圍，則會包含99%的樣本平均值。換句話說，68%的樣本平均值加減一個標準誤會包含μ。以此類推。第6页，共27页，星期日，2025年，2月5日抽樣原理(4)而σ又是從樣本的資料估計得來：σ=sqrt(n/n-1)*s.s為標準差，計算方式為sqrt[∑(xi-x_bar)2/n-1]。其中xi表示每一個觀察值。通常一個簡化的公式為設定σ等於0.5，而抽樣誤差公式可以快速計算為1/sqrt(n).也就是樣本數的開根號的倒數。第7页，共27页，星期日，2025年，2月5日信心水準與抽樣誤差剛剛提到的68%或95%或99%通常稱為信心水準。意思為抽100次樣本，有多少比率的樣本是我們確定會以一個特定區間包含母體平均數μ。信心水準越高，所需要的區間也就越大，μ的上下限也就差距越大。所以信心水準跟抽樣誤差之間必須取捨。通常我們是用95%信心水準，對應兩個標準誤的抽樣誤差第8页，共27页，星期日，2025年，2月5日信心水準與抽樣誤差試算信心水準68%95%99%標準誤正負1正負2正負3抽樣誤差0.5/sqrt(n)1/sqrt(n)1.5/sqrt(n)試算抽樣誤差(假設n=900)正負1.6%正負3.3%正負5%第9页，共27页，星期日，2025年，2月5日信心水準與抽樣誤差例子第10页，共27页，星期日，2025年，2月5日信心水準與抽樣誤差注意事項上述的公式完全不考慮母體大小，只考慮樣本數大小。根據上述的公式可以逆向推估需要的樣本。當母體非常小的時候，例如低於100，抽樣誤差已經沒有意義，可以考慮全查。第11页，共27页，星期日，2025年，2月5日單純隨機抽樣將每一個觀察值加以編號依照亂數表選中一個號碼每個觀察值應該有同樣的中選機率第12页，共27页，星期日，2025年，2月5日第13页，共27页，星期日，2025年，2月5日等距抽樣(1)把全體總數N除以樣本數n得到K，起始為隨機亂數抽出R，然後每隔K個抽出一個樣本，R，R+K，R+2K，R+3K，一直到R+(n-1)K。如果觀察值本身有分組，則是依照各組人數從小而大排列，然後各組內再編號以方便抽出。假如我們有4800個觀察值如下表，如何抽出16個樣本？先抽一個亂數6，然後每隔300就抽一個。第14页，共27页，星期日，2025年，2月5日等距抽樣(2)分組人數累積人數抽出樣本130030062500800306,60636001400906,1206480022001506,1806,21065120034002406,2706,3006,33066140048003606,3906,4206,4506總數480016第15页，共27页，星期日，2025年，2月5日分層分段抽樣(1)主動將樣本分成若干層，原則為層內同質性越大越好，層外同質性越小越好。例如：依照都市化程度分鄉鎮；依照學院特性分科系；依照學校特色分學校。人數越多的層應該分到越多樣本；在各層之下再分段以簡化抽樣。每一人的中選機率仍然會相同。第16页，共27页，星期日，2025年，2月5日分層分段抽樣(2)例如調查政大的學生對政大的認同感。根據資料，博士班學生約834人，碩士班約4,570人，大