官术网_书友最值得收藏!

2.6 小結(jié)

(1)關(guān)系模型、多維模型和Data Vault模型是三種常見(jiàn)的數(shù)據(jù)倉(cāng)庫(kù)模型。

(2)數(shù)據(jù)結(jié)構(gòu)、完整性約束和SQL語(yǔ)言是關(guān)系模型的三個(gè)要素。

(3)規(guī)范化是通過(guò)應(yīng)用范式規(guī)則實(shí)現(xiàn)的。第一范式(1NF)要求保持?jǐn)?shù)據(jù)的原子性、第二范式(2NF)消除了部分依賴、第三范式(3NF)消除了傳遞依賴。關(guān)系模型的數(shù)據(jù)倉(cāng)庫(kù)一般要求滿足3NF。

(4)事實(shí)、維度、粒度是維度模型的三個(gè)核心概念。

(5)維度模型的四步設(shè)計(jì)法是選擇業(yè)務(wù)流程、聲明粒度、確定維度、確定事實(shí)。

(6)星型模式和雪花模式是維度模型的兩種邏輯表示。對(duì)星型模式進(jìn)一步規(guī)范化,就形成了雪花模式。

(7)Data Vault模型有中心表(Hub)、鏈接表(Link)、附屬表(Satellite)三個(gè)主要組成部分。中心表記錄業(yè)務(wù)主鍵,鏈接表記錄業(yè)務(wù)關(guān)系,附屬表記錄業(yè)務(wù)描述。

(8)Data Vault不區(qū)分?jǐn)?shù)據(jù)在業(yè)務(wù)層面的正確與錯(cuò)誤,它保留操作型系統(tǒng)的所有時(shí)間的所有數(shù)據(jù),裝載數(shù)據(jù)時(shí)不做數(shù)據(jù)驗(yàn)證、清洗等工作。

(9)數(shù)據(jù)集市是部門級(jí)的、面向單一主題域的數(shù)據(jù)倉(cāng)庫(kù)。

(10)數(shù)據(jù)集市的復(fù)雜度和需要處理的數(shù)據(jù)都小于數(shù)據(jù)倉(cāng)庫(kù),因此更容易建立與維護(hù)。

(11)實(shí)施一個(gè)數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的主要步驟是:定義范圍、確認(rèn)需求、邏輯設(shè)計(jì)、物理設(shè)計(jì)、裝載數(shù)據(jù)、訪問(wèn)數(shù)據(jù)、管理維護(hù)。

主站蜘蛛池模板: 汝城县| 新平| 云霄县| 上林县| 沙坪坝区| 冀州市| 伽师县| 肥城市| 石城县| 双柏县| 涟水县| 博湖县| 静乐县| 临潭县| 黄石市| 江川县| 石楼县| 凤阳县| 东乡族自治县| 车致| 林芝县| 门头沟区| 厦门市| 建水县| 科技| 东山县| 甘泉县| 革吉县| 抚宁县| 新源县| 乌拉特前旗| 湖南省| 板桥市| 乐清市| 尤溪县| 五大连池市| 连城县| 珲春市| 砀山县| 哈密市| 敦煌市|