官术网_书友最值得收藏!

2.數據流向關系分析的缺陷

當前元數據產品對數據流向關系的分析是逐層分析,例如ABC元數據與D元數據有關系,D元數據與EFG元數據有關系,通過對A做影響分析的時候,我得出的是A—>D—>(EFG)而實際上數據流向關系是A->D->E,同理,我們對E進行血緣分析的時候,也會出現D的數據來源于ABC元數據。

舉個實際的例子:這是指標管理模塊中的實際數據流向。用顏色來區分數據流向,同一顏色代表了數據流動路徑。

基于上圖展示的事實,從某一指標進行溯源,通常情況下(基于元數據)的溯源分析,首先找到匯總表,再往前追溯時,往往是基于匯總表進行溯源,找到匯總表所有的來源表,分析呈現泛化,導致分析結果不夠精確,缺乏指導意義,如下圖所示:

這個問題會讓使用元數據的人很糾結,數據明明沒有流到這里,怎么分析出對后面有影響呢。我想要的效果應該是這樣的:

那是不是現有的元數據分析沒用用處了嗎?從數據加工的角度想,還是有用處的,試想下如果A的數據結構發生了變化,刪除了一個字段,80%的幾率會影響到C表數據加工過程。

如何準確標注數據的的坐標,是將來元數據廠商要搶占的制高點。

主站蜘蛛池模板: 五指山市| 沾益县| 吉木萨尔县| 沁水县| 张家口市| 宁海县| 乳山市| 三门峡市| 陆河县| 玉山县| 台湾省| 红安县| 崇义县| 合水县| 娄烦县| 临猗县| 阳城县| 册亨县| 老河口市| 樟树市| 宝鸡市| 平邑县| 观塘区| 靖安县| 嘉峪关市| 曲松县| 怀宁县| 大荔县| 土默特右旗| 收藏| 桐梓县| 大洼县| 旬邑县| 阳高县| 漳浦县| 灵川县| 北川| 晋城| 讷河市| 项城市| 遵义市|