- 1、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
04_统计基础知识--CID.ppt
統計基礎知識 統計基礎知識 概率論基礎知識 數據收集與測度 抽樣方法 正態分布 中心極限定理 數據的圖示方法 離散數據的分布 統計基礎知識 概率論基礎知識 數據收集與測度 抽樣方法 正態分布 中心極限定理 數據的圖示方法 離散數據的分布 事件類型 隨機事件 在同一組條件下, 每次試驗可能出現也可能不出的事件. 必然事件 在同一組條件下,每次試驗一定出現的事件. 不可能事件 在同一組條件下,每次試驗一定不出現的事件. 必然事件和不可事件是隨機事件的兩種極端 . 事件間的關系與運算 包含 A B 相等 A=B 即: A B B A 事件間的關系與運算 不相容 事件間的關系與運算 不相容----例 事件間的關系與運算 並 A∪B 事件間的關系與運算 交 A∩B 事件間的關系與運算 差 事件間的關系與運算 對立 A=A 概率的定義 概率的公理化定義 前蘇聯科學家柯莫哥洛夫於1933年給出了概率公理化定義: 非負性: 對任一隨機事件A, 有 規范性: 必然事件的概率為1, 而不可能事件的概率為0, 即 可加性: 如果A與B是兩個互不相容事件(互斥), 則 概率的性質及運算法則 性質1: 對任一隨機事件A, 有0≦P(A)≦1 . 性質2: 事件A的對立事件A, 有P(A)+P(A)=1 . 性質3: 若A B, 則有P(A-B)=P(A)-P(B) . 性質4: 加法法則 事件A與事件B並的概率, P(A∪B)=P(A)+P(B)-P(AB) 性質4: 乘法法則 對於任意兩個事件A與B, 有 P(AB)=P(B|A) P(A) P(A)0 P(AB)=P(A|B) P(B) P(B)0 概 率 樹 ? 擲硬幣的概率樹 討論與練習 統計基礎知識 概率論基礎知識 數據收集與測度 抽樣方法 正態分布 中心極限定理 數據的圖示方法 離散數據的分布 連續型數據 離散型數據 兩種類型數據的轉換 以駕車為例: 溫度計: 顯示實際溫度 冷卻液指示燈: 顯示是否過熱 通過觀察溫度計, 司機會看到冷卻液溫度上升的趨勢. 可以看出, 計量數據能比計數數據提供更多的資訊. 兩種類型數據的轉換 波長 頻率 三原色配比 測量尺度 測量尺度決定了研究數據時採用的統計分析方法, 以及測量數據所包含有多少信息 測量尺度: 定類/定序/定距/定比 測量尺度 定類測量尺度 黑/白 赤/橙/黃/綠/藍/靛/紫 0/1 ≠/= 單值1─1函數 統計: 計數 測量尺度 定序測量尺度 大/小 優/良/中/差 1/2/3 ≠/=/ > / < /≧ /≦ 任意單調函數 統計: 計數/排序; 不能進行算術平均 測量尺度 定距測量尺度 溫度/日期/時間 “0”沒有意義 能識別差距 統計: 可以使用各種統計量 沒有“比值”/“比率”的概念 線性函數: y=ax+b (a0) 攝氏度與華氏度的轉換: ° F= 32+9/5℃ 換算前後統計結論一致 測量尺度 定比測量尺度 長度/質量/電流/壓力/強度/亮度等 “0”有意義 統計: 可以使用各種統計量 可以討論“比值”/“比率” 線性函數: y=ax (a0) “mm”與“inch”的轉換: Lmm= 25.4×Linch 換算前後統計結論一致 數據分類--層別法 層別法是一種數據分析方法, 將數據分為不同類別, 以便浮現問題的形態並發現過程的差別. 水果攤應用層別法實例 數據收集計劃 為甚麼需要這些數據 why 收集甚麼樣的數據 what 誰負責 who 何時收集 when 何處收集 where 如何收集 how 數據收集工具 經常需要用創造性的方式確保收集正確的數據, 如圖表或圖形而不是文字. 數據收集工具應當易於使用和理解. 設計的表格在全面使用前要經過試用. 工具應當只包括需要的資訊. 工具應包括如何記錄數據, 盡可能舉例說明. 工具應提供意見/建議和特殊報告的空間. 統計基礎知識 概率論基礎知識 數據收集與測度 抽樣方法 正態分布 中心極限定理 數據的圖示方法 離散數據的分布 母體vs樣本 “母體”是指組成某一特定群體的全部單位.有時母體大到無法測量. “樣本”是指該特定母體中的某些單位.要求母體中的每一個單位都有同等機會被用來測量.換言之,樣本必須是隨機的. 母體vs樣本 抽樣的目的 收集所有數據往往不切實際或成本太高. 如: 檢查近海某鹽份含量. 收集數據是一個破壞性的過程. 如驗血. 可靠的結論常常可以用相對較少的數據得出. 抽樣的理由 樣本(適當選擇且具有代表性)能夠提供在過程中進行改善的機會所需的資訊. 有些不需要進行抽樣甚至抽樣是不合理的實例: 當數據因為某些原因已經被收集時(如電訪中心)或者過程
文档评论(0)