- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第8章抽樣與樣本分配
第8章 抽樣與樣本分配
8.2 抽樣 (Sampling)
Census: 在調查(survey)時,試圖將母體的所有份子的資訊納入調查的範圍內。
Sampling: 只包含母體的部分份子的資訊。
使用樣本資料來推估母體的優點:
1. 成本較低。
2. 資料更容易掌握處理。
3. 比較不耗費時間。
4. 樣本之觀察可以相當準確。
5. 即使在無法得到母體所有份子之資料時,仍可作統計分析。
因此,我們必須注意所使用的統計方法是否能夠提供豐富且有用的資訊。
再則,
樣本必須能充分的代表母體的特性。
抽樣試驗的兩種可能誤差:
1. 抽樣誤差 (Sampling Errors):
(是母體統計值與樣本估計值之差距
(當我們只用樣本來推論母體,卻無法得知母體參數時,此誤差極可能發生。
(是隨機誤差(random errors or chance errors):即使是隨機抽樣,也有可能抽到極端值或與母體代表性不符的樣本,而影響樣本的估計值。
(增加樣本數可降低此種誤差。
2. 非抽樣誤差 (Nonsampling Errors):
(systematic error (or bias)
(因不正確的衡量單位所致, 或
(因樣本的選擇不恰當所致。
(不會因樣本增加而降低其誤差。
(有三類非抽樣誤差:
1. Errors in Data Acquisition: 計算器有問題、錯解資料、誤答(無論是有意還是無意者)、筆誤等,因此資料取得時已有錯誤。
2. Nonresponse Error: 問卷調查時,當受訪者不回覆時,便使樣本的代表性降低,嚴重時可能導致樣本估計偏離母體參數。
3. Selection Bias: 當抽樣時,某一部份的母體份子無法被抽中,而被排除於樣本之外的情形。如:現場call-in的民調。
為使樣本能充分代表母體,抽樣的方式非常重要,隨機抽樣能使樣本具備與母體相當的特性。
隨機抽樣 (Random Sampling):
1. Simple Random Sampling: 樣本之選擇是根據下述原則:母體中的每一份子被抽中的機率是相同且互相獨立的,且不同的樣本組合若其樣本數相同,各組合被選出之機率亦相同。
(Drawing from a Box (with replacement)
(使用亂數表:將母體編號後用亂數表製造由1到N的n+個編號,在根據此n個編號選出樣本。
2. Stratified Random Sampling: 將母體分成互斥的集合(set or strata),再由各集合中選出隨機樣本。
(其目的在於比較不同集合中的參數是否有所不同,如按性別分、按年齡分、按職業分、按所得分等等。
(注意:各strata中樣本佔全樣本的比例必須與其母體的比例相同,這樣抽出的樣本才具備對母體的代表性。
3. Cluster Sampling: 如果我們無法(或太耗費成本)將全部母體按strata來清楚分類(因無complete list),便可將母體分成幾個互斥的小群 (groups or clusters),再對各小群做隨機抽樣。
(此作法將使抽樣誤差加大,這是因為各小群內可能在社會經濟條件上相當類似。
(但這個問題可用增加樣本數來解決。
8.3 抽樣成本與抽樣誤差
抽樣成本(Sampling Costs):選擇樣本時必須負擔的成本 ( 會影響抽樣誤差(Sampling errors)
樣本的大小(Sample Size)與其準確度:
樣本越大(很可能使抽樣誤差越小),成本越高。
用成本─利益分析法(Cost-Benefit Analysis) 來評判是否可以犧牲樣本的準確度(使抽樣誤差較大)以降低抽樣成本。
應用8.1:製藥廠想測試去頭皮屑的洗髮精中的某重要成分,成分不夠就無效,成分太高會有調頭髮的後遺症,雖然其測試的精確度很重要,但要測試全部的製成品卻不可能(一旦拿去測試,產品就用掉了),只有抽樣,但仍須大樣本以降低抽樣誤差,以維護公司的商譽(有效且無副作用的製藥態度)。
應用8.2:
製造水泥之工廠想知道每一個50磅種的袋子是否混入一定數量的碎石子(因為這樣才可使其成品最耐用),但一點點誤差對其成品的耐用度影響不大,因此,廠商只需要小樣本來測試,且不需要極精確的結果,小樣本、偶爾才檢測,可為廠商省下不少成本。
( 一般而言,要求的結果越精確,可允許的樣本誤差越小,其統計分析的成本越高。
時間的限制:
若有deadline之限制,抽樣的數目就不可能太大。 例如:大選前夕的民調,政府或公司需要一些經濟變數的數值來做立即的經濟決策(在第19章中會有一些例子與討論)。
例子:Time/CNN對1000美國人與500日本人做電話訪問,發現66%的美國人及33%的日本人認為日本對美產品之進口有不公平待遇。
文档评论(0)