- 數據自助服務實踐指南:數據開放與洞察提效
- (美)桑迪普·烏坦坎達尼
- 387字
- 2022-05-20 19:18:51
第5章 數據遷移服務
在開發洞察來解決業務問題的過程中,我們已經討論了發現現有的數據集及其元數據,以及可用于開發洞察的可重用工件和特征。通常,必須將來自不同數據倉庫或應用數據庫的數據屬性進行聚合以構建洞察。例如,收入儀表盤要求將賬單、產品代碼和特價產品的屬性遷移到一個公共數據存儲中,然后對該數據進行查詢和寫入,每隔幾個小時更新儀表盤或實時更新儀表盤。數據用戶會花費16%的時間遷移數據(https://oreil.ly/qdbsF)。如今,數據遷移導致了以下痛點:在異構數據源之間協調數據移動、持續驗證源數據和目標數據之間的數據正確性以及適應數據源上通常發生的任何模式或配置更改。
確保及時提供不同來源的數據屬性是主要難點之一。在獲取數據上花費時間會降低生產力,并會影響整體的洞察耗時。理想情況下,遷移數據應該是自助式的,這樣數據用戶就可以選擇一個源、一個目標和一個時間表來遷移數據。此類服務的成功標準是減少數據可用性耗時。
推薦閱讀
- Hands-On Data Structures and Algorithms with Rust
- Voice Application Development for Android
- Learning JavaScriptMVC
- 工業大數據分析算法實戰
- 數據要素五論:信息、權屬、價值、安全、交易
- Python數據分析:基于Plotly的動態可視化繪圖
- 跟老男孩學Linux運維:MySQL入門與提高實踐
- 信息學競賽寶典:數據結構基礎
- 編寫有效用例
- Construct 2 Game Development by Example
- 大數據分析:數據倉庫項目實戰
- 爬蟲實戰:從數據到產品
- 區塊鏈+:落地場景與應用實戰
- Gideros Mobile Game Development
- 云計算寶典:技術與實踐