- 《架構世界》2020數據刊:打通企業數據應用的最后一公里
- 普元信息
- 472字
- 2020-09-03 11:21:56
.數據流向關系分析的缺陷
當前元數據產品對數據流向關系的分析是逐層分析,例如
、 、 元數據與 元數據有關系, 元數據與 、 、 元數據有關系,通過對 做影響分析的時候,我得出的是 —> —>( 、 、 )而實際上數據流向關系是 -> -> ,同理,我們對 進行血緣分析的時候,也會出現 的數據來源于 、 、 元數據。舉個實際的例子:這是指標管理模塊中的實際數據流向。用顏色來區分數據流向,同一顏色代表了數據流動路徑。

基于上圖展示的事實,從某一指標進行溯源,通常情況下(基于元數據)的溯源分析,首先找到匯總表,再往前追溯時,往往是基于匯總表進行溯源,找到匯總表所有的來源表,分析呈現泛化,導致分析結果不夠精確,缺乏指導意義,如下圖所示:

這個問題會讓使用元數據的人很糾結,數據明明沒有流到這里,怎么分析出對后面有影響呢。我想要的效果應該是這樣的:

那是不是現有的元數據分析沒用用處了嗎?從數據加工的角度想,還是有用處的,試想下如果
的數據結構發生了變化,刪除了一個字段, %的幾率會影響到 表數據加工過程。如何準確標注數據的的坐標,是將來元數據廠商要搶占的制高點。