官术网_书友最值得收藏!

1.數(shù)據(jù)地圖關系定義與分類

從數(shù)據(jù)地圖關系來說,主流的元數(shù)據(jù)產(chǎn)品支持的是數(shù)據(jù)流向關系、數(shù)據(jù)模型關系兩類。

? 數(shù)據(jù)流向關系:從數(shù)據(jù)傳遞和加工的角度,表示數(shù)據(jù)在系統(tǒng)內(nèi)部或系統(tǒng)之間邏輯流向和邏輯變化的關系。

? 數(shù)據(jù)實體關系:數(shù)據(jù)實體之間的一對一,一對多,多對多的關系以及實體間的繼承等關系。

? 數(shù)據(jù)實體關系的來源:數(shù)據(jù)模型的設計工具,具體有ERWinPD以及ERArchitector等。采集的準確度較高,基本上采集到大部分的關系。

? 數(shù)據(jù)流向關系的來源:來源比較多,ETL工具、傳統(tǒng)的Sql腳本為核心的存儲過程、Shell腳本、Perl腳本以及大數(shù)據(jù)中應用的Spark sqlsqoop腳本等。關系解析比較復雜正確率有待提升。

有些廠商的元數(shù)據(jù)產(chǎn)品解析正確率較高,但通常是一種ETL工具深度綁定,并不適合做企業(yè)級的元數(shù)據(jù)關系方案。數(shù)據(jù)關系地圖的構(gòu)建依賴與強大的采集適配器。普元元數(shù)據(jù)產(chǎn)品提供的采集適配器能夠覆蓋企業(yè)大部分數(shù)據(jù)關系的采集。

主站蜘蛛池模板: 太原市| 东城区| 屯留县| 长寿区| 明星| 台安县| 横峰县| 钦州市| 精河县| 喀喇沁旗| 奉化市| 崇阳县| 荥阳市| 蓬安县| 长武县| 中西区| 怀柔区| 张家口市| 张家口市| 霸州市| 龙胜| 宁晋县| 延川县| 临朐县| 天津市| 新安县| 天长市| 房产| 洱源县| 江永县| 封开县| 禄劝| 延安市| 刚察县| 南平市| 博白县| 文登市| 宁化县| 枞阳县| 团风县| 漳浦县|