官术网_书友最值得收藏!

2.4 數據集市

在第1章中介紹了獨立數據集市和從屬數據集市兩種架構,本節繼續討論數據集市的概念、與數據倉庫的區別、數據集市的設計等問題。

2.4.1 數據集市的概念

數據集市是數據倉庫的一種簡單形式,通常由組織內的業務部門自己建立和控制。一個數據集市面向單一主題域,如銷售、財務、市場等。數據集市的數據源可以是操作型系統(獨立數據集市),也可以是企業級數據倉庫(從屬數據集市)。

2.4.2 數據集市與數據倉庫的區別

不同于數據集市,數據倉庫處理整個組織范圍內的多個主題域,通常是由組織內的核心單位,如IT部門承建,所以經常被稱為中心數據倉庫或企業數據倉庫。數據倉庫需要集成很多操作型源系統中的數據。由于數據集市的復雜度和需要處理的數據都小于數據倉庫,因此更容易建立與維護。表2-19總結了數據倉庫與數據集市的主要區別。

表2-19 數據倉庫與數據集市的主要區別

2.4.3 數據集市設計

數據集市主要用于部門級別的分析型應用,數據大都是經過了匯總和聚合操作,粒度級別較高。數據集市一般采用維度模型設計方法,數據結構使用星型模式或雪花模式。

正如前面所介紹的,設計維度模型先要確定維度表、事實表和數據粒度級別,下一步是使用主外鍵定義事實表和維度表之間的關系。數據集市中的主鍵最好使用系統生成的自增的單列數字型代理鍵。模型建立好之后,設計ETL步驟抽取操作型源系統的數據,經過數據清洗和轉換,最終裝載進數據集市中的維度表和事實表中。

主站蜘蛛池模板: 博兴县| 棋牌| 岑溪市| 卓尼县| 甘泉县| 陇川县| 辉县市| 宜宾市| 白山市| 涞水县| 贵南县| 南澳县| 呼玛县| 唐海县| 昭苏县| 宾阳县| 阜平县| 屏山县| 西乡县| 溧水县| 九龙城区| 赣州市| 昌宁县| 梅河口市| 稷山县| 廉江市| 英吉沙县| 巴彦淖尔市| 象州县| 无棣县| 社旗县| 滨州市| 丹东市| 宜兴市| 庐江县| 彭州市| 博白县| 大渡口区| 雅安市| 濮阳县| 唐河县|