- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
期中统计学考前重点整理
PAGE
PAGE 4
期中統計學考前重點整理
統計方法
普查Census:對母體的每一份子都獲得資料,也就是100% 的抽樣,如工商普查,戶口普查,農業普查等等。
樣本Sample:由於母體太龐大,有時候要得到所有人的資料很困難,因此只能收集部份人,這些部份人的集合稱為樣本。即樣本為母體用一種步驟process選出的一個部份集合,測量樣本中每個受測者的資料為樣本資料。
統計Statistics:是一門科學,用來對不確定事件做研判與提供決策。提供如何收集數據,整理資料,經過分析,最後下決策作結論。
隨機樣本Random sample:從母體中選取出的子集合,每一個單位被選取的機率都相同。
取出不放回Sampling without replacement:樣本從母體取出後不再放回,比較好的抽樣方式,每一個抽出的個案在樣本中一定不同。
取出放回Sampling with replacement:樣本從母體取出後放回,再抽樣。
序列圖Runs Plot:依時間而得的資料作圖。
統計推論Statistical Inference:是由一組樣本資料算出的統計量以便對母體的參數做評估Estimation,預測Prediction及檢定Testing。它是由樣本資料推論到整個母體。
抽樣Sampling:要得到有代表性的樣本,需要有正確的抽樣方法。所謂抽樣就是一種程序或方法,它告訴如何由母體抽出樣本。有簡單隨機抽樣法,系統抽樣法,分層隨機抽樣法及部落抽樣法等四種,當然也可以混合使用。
參數Parameter:對母體的某一特性值;統計量:由樣本所計算出的一個量;統計量Sample statistic:由樣本來估計參數的量,如樣本平均數Sample mean。
量化變數Quantitative variable vs. 質化變數Qualitative(Categorical) variable
控制中In control:不會存在不尋常的變異資料,一般是指所有的資料落在三個標準差之內。
直方圖的製作方法:
盒鬚圖Box-and –whiskers displays(Box plots)的製作方法:Q1~3 in the box,whiskers為Q1或Q3到Inner fence = Q1-1.5IQR ~Q3+1.5IQR的最邊際資料。
統計量四種不同形式
集中趨勢統計量:
樣本平均數Mean=;母體平均數=
群族資料Grouped data
樣本平均數 fi=the frequency of class I, Mi=Midpoint of I
樣本變異數
中位數Median(Md):資料由小排到大,最中間的數
奇數 X([x/2]+1),偶數(X[x/2]+X([x/2]+1))/2
眾數Mode(Mo):資料中出現最多的數
去尾平均數Trimmed mean
加權平均數Weighted mean= Xi的權重為Wi
位置統計量:排序後
p百分位Percentile:np/100不是整數時X[np/100+1],整數時1/2(X[np/100]+ X[np/100+1])
四分位數Quartile:有三個Q1 Q2 Q3
離勢(分散程度)統計量
表達資料分散狀況的量測,也就是量測資料離中心點多大的指標
全距:一組資料的最大值與最小值的差距=
四分位距(IQR)=Q3-Q1
平均絕對偏差(MAD, Mean Absolute deviation)= ∑|Xi-X|/N
變異數Variance:偏差平方和的平均
樣本變異數 Sample variance
s2==(computation formula)
母體變異數Population variance σ2=
標準差Standard deviation:
變異係數Coefficient of variation=(Standard deviation/mean)×100
形狀統計量
對稱與否的指標為偏態係數
偏態係數Skewness:sk=0(normal),sk0(right skewness,Median),sk0(left skewness, Median)
峰態係數Kurtosis:K0較尖,K0較扁
經驗法則資料呈常態鐘型分配
大約68.26%的資料落在之間
大約95.44%的資料落在之間
大約99.73%的資料落在之間
謝比雪夫(Chebychev’s inequality or theorem)不等式(單峰樣本,不過度偏峰)
至少有75%的資料落在
至少有89%的資料落在
對於任何k1,則至少有比例的資料落在 之間
以上討論1個變數,1組資料的統計量
機率概論
機率Probability:量測事件發生的機會
古典機率,法國拉普拉斯 P(A)=k/n
相對次數機率:
文档评论(0)