资料仓储开发模型.ppt

  1. 1、本文档共79页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 資料倉儲開發模型 2.1 資料倉儲開發模型概述 2.2 資料倉儲概念模型 2.3 資料倉儲的邏輯模型 2.4 資料倉儲的實體模型 2.5 資料倉儲的超資料模型 2.6 資料倉儲的粒度和聚集模型 習題 2.1 資料倉儲開發模型概述 模型是對實際世界進行抽象化的工具。在資訊管理 中需要將實際世界的事物及其有關特徵轉換為資訊 世界的資料才能對資訊進行處理與管理,這就需要 依靠資料模型作為這種轉換的橋樑。 資料倉儲設計的模型,除了描繪概念世界的概念模 型、描述邏輯世界的邏輯模型和描述電腦世界的實 體模型之外,還有超資料模型、粒度模型和聚集模 型,如圖2.2所示。 2.2 資料倉儲概念模型 2.2.1 概念資料模型 在建構資料倉儲的概念模型時,可以採用在交易資 料處理系統中經常應用的實體關係模型 ──E-R圖 (ERD, Entity Relation Diagram) 資料類型的差距 資料倉儲的資料模型中不包含操作型的資料,資料 倉儲的資料模型只包含客戶所感興趣的分析資料、 描述資料和細節性資料。 資料的歷史變遷性 資料倉儲的資料模型延伸了關鍵字結構,增加了時 間屬性,作為關鍵字的一部分。 資料的一般性 傳統的企業資料模型主要採用實體-關係圖 (ERD)建構。實體-關係圖用實體以及實體之間的 關係來描述實際世界。 因為傳統的實體-關係圖無法表述資料倉儲中所需要 的分析資料、描述資料和細節資料的關係,無法反 映出時間屬性的存在和功能,更無法呈現出資料的 導出關係。 為解決這些問題,可以將傳統的資料模型建構工 具ERD稍作修改,將原ERD中的實體分成指標實體 (事實實體)、維度實體和詳細類別實體 (引用實 體)。 資料模型中的指標實體用矩形表示,如圖2.4(a) 所示,它們處於資料模型的中心,是資料倉儲活動 的中心。 高層資料模型中的指標實體,應該具有下列 特性: 可以為客戶提供定量的資料 商務資料或實際資料的基本分析點 資料模型中的維度實體用菱形表示,如圖2.4(b) 維度實體應該具有這樣一些特色:可以形成一個 維度系統,具備存取和過濾指標實體的能力,提供 相關的非標準實體。 資料模型中的詳細類別實體用六角形表示,如圖 2.4(c)。 2.2.2 規格化的資料模型 資料的規格化是將資料結構分解成較小的合適的組 成程序,規格化主要強調執行記憶體的靈活性和高 效性,可使規範化的結構佔用最小的記憶體空間, 增強資料庫的記憶體效率。 第一範式 第一範式具有以下特點: 所有的屬性都是原子化的。 它們不可能有相同的一組值。 它們不可能有任何的嵌套關係。 第二範式 資料模式規格的第二範式是在第一範式的基礎上消 除非關鍵列對關鍵列的部分依賴關係所得到的資料 模式。 第三範式 第三範式具有下列特徵: 所有的非主屬性都完全相依於關鍵列。 所有的主屬性都完全相依於不屬於它們的鍵。 沒有非主屬性完全相依於任一個非主屬性集。 因此,在將資料模式從非規格化到第三範式的轉換 程序中,需要採取以下步驟: 消除所有的重複序對,執行第一範式。 將實體的所有非主屬性相依於所有的主鍵列。 將所有非主鍵列直接相依於主鍵列 資料倉儲的反規格化處理 利用資料模型的反規格化處理可以提高資料倉儲的 執行效率。因此,在資料倉儲的模型建構中,為了 提高資料倉儲的執行效率,採用反規格化處理是必 要的。 2.2.3 星型模型 ERD資料模型為一種資料倉儲的設計基礎,在實際 應用中存在很多缺點。如圖2.5所示的簡單資料模型 中有四個相互關聯的簡單實體。 每一個維度表透過一個主鍵與事實表作連接,如圖 2.6所示。 事實表(Fact Table)主要包了描述特定商業事件的資 料,即某些特定商業事件的度量值。一般情況下, 事實表中的資料不允許修改,新的資料只是簡單地 添加於事實表中,維度表主要包含了記憶體在事實 表中資料的特徵資料。 2.2.4 雪花模型 2.3 資料倉儲的邏輯模型 透過中層邏輯模型的設計,可以向客戶提供一個 比概念模型更詳細的設計結果,使客戶了解到資料 倉儲能夠給他們提供一些什麼資訊。邏輯模型也就 成為資料倉儲開發者與使用者之間進行資料倉儲開 發的交流與討論的工具。 2.3.1 事實表模型設計 事實表設計 a. 客戶事實表。 b. 客戶交易事實表。 c. 客戶回饋記錄表。 d. 客戶信用狀況表。 事實表中的事實特性 事實表中一般要包含兩部分:一是由主鍵和外鍵所 組成的鍵部分,另一是客戶希望在資料倉儲中所了 解的數值指標。 事實是一種度量,所以事實表中的這種指標往往需要具有數值化和可加性的特徵。 事實表模型的設計中還需要注意到衍生事實。 事實表模型

您可能关注的文档

文档评论(0)

you-you + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档