- 云原生數據中臺:架構、方法論與實踐
- 彭鋒 宋文欣 孫浩峰
- 1292字
- 2021-04-30 12:38:50
5.4 評判數據中臺建設效果
在建設一個項目之前,我們一般要先定義好評判這個項目建設效果的標準。那么,如何判斷我們建設的系統是不是成功的數據中臺呢?
目前來看,企業的數據平臺建設可能有以下形態。
·企業級數據倉庫:傳統的基于關系型數據庫的數據倉庫、BI、數據可視化。
·傳統大數據平臺:以Hadoop、Hive、Spark為代表的傳統大數據生態系統。
·云原生數據平臺:實時數據和流數據處理、數據流水線、數據服務及機器學習。
第1章介紹了評判一個大數據平臺能否承擔數據中臺任務的標準。簡單來講,一個大數據平臺能夠讓企業所有部門在同一個平臺上使用同一個數據管理體系和同一個數據應用體系來實現數據價值,就代表它能夠承擔建設數據中臺的任務。也就是說,同一套體系能支持全局的數據能力的抽象、復用和共享,我們就認為它實現了數據中臺的功能。阿里的OneID、OneModel講的就是同一個數據管理體系,OneService講的就是同一個數據服務體系。
我們認為,數據中臺建設的成功與否不應由一些名詞來評判,而應由數據中臺在企業中的使用方式及使用效果來評判。下面列出評判數據中臺使用效果的12個方面,大家可以從這些方面判斷數據中臺的建設是否成功。這些方面是指導性的指標,我們會在第6章介紹數據中臺建設方法論時詳細講述如何使用具體的指標來量化這些方面。
·數據能力復用度:系統中提供了多少種可以共享的數據能力?這些能力達到了何種復用程度?
·可協作程度:跨部門的協作是如何在系統中實現的?能否在各部門獨自開發的情況下達到全局的有序管理?
·可理解性:系統的當前狀況、數據和應用的使用情況、數據如何使用等,是否有直觀可理解的方式?對系統的理解和認識是僅個別人掌握還是存在系統的方法?
·可適應性:添加一個新的工具或處理框架所需操作的復雜性如何?多快能夠將其加入系統?添加一個新的數據源類型需要多長時間?
·自動化程度:系統中的手工操作有多少?有哪些人工操作是應該由系統自動完成的?系統是否能自動發現運行中的問題?
·可衡量性:系統的效率和ROI是否可衡量?系統的使用程度和資源消耗是否能精細化管理?
·管理程度:系統中的人員、數據、應用、資源是否完全在管理之下?在每個時刻系統的運行情況是不是明晰?日常管理需要進行哪些操作?
·系統復雜度:整個系統的復雜度會不會隨著數據、人員、應用的增加而不斷升高,最后導致不可管理?
·用戶易用程度:用戶需要多長時間的培訓才能使用系統?業務部門需要多長時間才能自助管理自己的數據和提供數據服務?在平時操作(例如導入新數據源、開發新的數據看板)中,需要多少專門的大數據開發人員支持?
·彈性和擴展性:系統的資源使用情況是不是合理(系統負載不能太高也不能太低)?是否可以隨時實現擴縮容?
·安全管理復雜度:系統里的數據和應用都需角色管理、權限管理,我們的系統是如何處理的?人員加入、人員離職都是如何處理的?是否能自動發現對系統的異常訪問?
·可靠程度:系統可靠程度如何?系統如何處理機器失效、數據錯誤、程序故障?出現需要人工干預才能恢復的故障的頻率是多少?一般多長時間能夠恢復系統正常運行?
可以為這個列表創建一個打分卡,看看我們在數據中臺建設中各個方面的表現,并在后續的工作中持續改善。
- Redis使用手冊
- 同步:秩序如何從混沌中涌現
- 數據庫技術與應用教程(Access)
- Test-Driven Development with Mockito
- Creating Mobile Apps with Sencha Touch 2
- Oracle RAC 11g實戰指南
- 卷積神經網絡的Python實現
- 大數據導論
- Microsoft Power BI數據可視化與數據分析
- 數據庫原理與應用(Oracle版)
- 實用數據結構
- SIEMENS數控技術應用工程師:SINUMERIK 840D-810D數控系統功能應用與維修調整教程
- 大數據與機器學習:實踐方法與行業案例
- 利用Python進行數據分析(原書第2版)
- 云原生架構:從技術演進到最佳實踐