官术网_书友最值得收藏!

3.1.1 原始數(shù)據(jù)清洗

操作數(shù)據(jù)存儲(Operational Data Store,ODS),又被稱為貼源層,是原始數(shù)據(jù)經(jīng)過ETL(Extract-Transform-Load)清洗后存儲的位置。ODS通常有如下幾個(gè)作用。

·在業(yè)務(wù)系統(tǒng)和數(shù)據(jù)倉庫之間做了隔離,將業(yè)務(wù)系統(tǒng)產(chǎn)生的原始數(shù)據(jù)備份的同時(shí),保證了兩個(gè)系統(tǒng)之間數(shù)據(jù)的一致性。

·存儲了業(yè)務(wù)側(cè)的明細(xì)數(shù)據(jù),方便后續(xù)的查詢和加工以及報(bào)表的產(chǎn)出。

·完成數(shù)據(jù)倉庫中不能實(shí)現(xiàn)的一些功能,相比于DW和DM層通常使用Hive查詢,ODS一般利用更底層的編程語言加工而成,可以實(shí)現(xiàn)一些更復(fù)雜和更高效的ETL操作。

此外,ODS層保留了大量的歷史明細(xì)數(shù)據(jù),通常約定只能增加不能修改,利用時(shí)間分區(qū)的方式進(jìn)行區(qū)分。

主站蜘蛛池模板: 抚顺县| 花莲市| 华宁县| 光山县| 金昌市| 赤水市| 海盐县| 东莞市| 阿瓦提县| 雷波县| 松桃| 巩义市| 武川县| 定结县| 房产| 上蔡县| 永川市| 黄龙县| 兴安盟| 长兴县| 黄骅市| 南宫市| 开鲁县| 河间市| 稷山县| 新巴尔虎左旗| 长治市| 二连浩特市| 图们市| 微山县| 绥滨县| 西藏| 兴仁县| 洛宁县| 门源| 湘阴县| 西乌珠穆沁旗| 泽普县| 上蔡县| 晋宁县| 建平县|