- Hadoop構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)實(shí)踐
- 王雪迎
- 496字
- 2020-11-28 16:11:53
2.6 小結(jié)
(1)關(guān)系模型、多維模型和Data Vault模型是三種常見(jiàn)的數(shù)據(jù)倉(cāng)庫(kù)模型。
(2)數(shù)據(jù)結(jié)構(gòu)、完整性約束和SQL語(yǔ)言是關(guān)系模型的三個(gè)要素。
(3)規(guī)范化是通過(guò)應(yīng)用范式規(guī)則實(shí)現(xiàn)的。第一范式(1NF)要求保持?jǐn)?shù)據(jù)的原子性、第二范式(2NF)消除了部分依賴、第三范式(3NF)消除了傳遞依賴。關(guān)系模型的數(shù)據(jù)倉(cāng)庫(kù)一般要求滿足3NF。
(4)事實(shí)、維度、粒度是維度模型的三個(gè)核心概念。
(5)維度模型的四步設(shè)計(jì)法是選擇業(yè)務(wù)流程、聲明粒度、確定維度、確定事實(shí)。
(6)星型模式和雪花模式是維度模型的兩種邏輯表示。對(duì)星型模式進(jìn)一步規(guī)范化,就形成了雪花模式。
(7)Data Vault模型有中心表(Hub)、鏈接表(Link)、附屬表(Satellite)三個(gè)主要組成部分。中心表記錄業(yè)務(wù)主鍵,鏈接表記錄業(yè)務(wù)關(guān)系,附屬表記錄業(yè)務(wù)描述。
(8)Data Vault不區(qū)分?jǐn)?shù)據(jù)在業(yè)務(wù)層面的正確與錯(cuò)誤,它保留操作型系統(tǒng)的所有時(shí)間的所有數(shù)據(jù),裝載數(shù)據(jù)時(shí)不做數(shù)據(jù)驗(yàn)證、清洗等工作。
(9)數(shù)據(jù)集市是部門級(jí)的、面向單一主題域的數(shù)據(jù)倉(cāng)庫(kù)。
(10)數(shù)據(jù)集市的復(fù)雜度和需要處理的數(shù)據(jù)都小于數(shù)據(jù)倉(cāng)庫(kù),因此更容易建立與維護(hù)。
(11)實(shí)施一個(gè)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的主要步驟是:定義范圍、確認(rèn)需求、邏輯設(shè)計(jì)、物理設(shè)計(jì)、裝載數(shù)據(jù)、訪問(wèn)數(shù)據(jù)、管理維護(hù)。
- MySQL高可用解決方案:從主從復(fù)制到InnoDB Cluster架構(gòu)
- 同步:秩序如何從混沌中涌現(xiàn)
- MySQL基礎(chǔ)教程
- 揭秘云計(jì)算與大數(shù)據(jù)
- 區(qū)塊鏈通俗讀本
- 深入淺出數(shù)字孿生
- Python數(shù)據(jù)分析:基于Plotly的動(dòng)態(tài)可視化繪圖
- 智能數(shù)據(jù)時(shí)代:企業(yè)大數(shù)據(jù)戰(zhàn)略與實(shí)戰(zhàn)
- 大數(shù)據(jù)治理與安全:從理論到開(kāi)源實(shí)踐
- 大數(shù)據(jù)分析:數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目實(shí)戰(zhàn)
- 數(shù)據(jù)庫(kù)查詢優(yōu)化器的藝術(shù):原理解析與SQL性能優(yōu)化
- Filecoin原理與實(shí)現(xiàn)
- 算力經(jīng)濟(jì):從超級(jí)計(jì)算到云計(jì)算
- 掌中寶:電腦綜合應(yīng)用技巧
- Creating Mobile Apps with Appcelerator Titanium