- 主數據驅動的數據治理:原理、技術與實踐
- 王兆君 曹朝輝 王鉞
- 2154字
- 2019-12-09 14:53:38
前言
在過去的幾十年里,對數據的計算和存儲能力以及可用性的巨大進步,促成了當今數據驅動型的世界現狀。數據正在對整個人類社會產生巨大的積極影響,它不僅在改變著人們生活的各個方面,而且也使得企業的運營更加高效。互聯網數據中心(IDC)預測,到2025年,全球數據圈將擴展至163ZB(1ZB相當于1萬億GB),是2016年所產生16.1ZB數據的10倍,這些數據將給個人帶來全新的用戶體驗并且給企業帶來更多的商業機會。
雖然已經有部分企業認識到數據資產的重要性,但是隨著數據數量、種類以及重要性的不斷增加,收集、存儲和處理這些數據的難度也越來越大。如何從海量數據中挖掘出對制定決策有價值的信息,成為企業在管理和使用數據過程中面臨的主要挑戰。
數據治理的核心正是加強對數據資產的管控,通過深化數據服務以持續創造價值,企業領導者必須關注其中最重要的那部分數據,只有識別并充分利用這些至關重要的數據,才能發揮其巨大潛力。主數據管理就是從來源復雜的數據中捕捉關鍵數據,并且對這些具有高業務價值的、可以在企業內跨越各個業務部門被重復使用的數據進行管理,通過為跨構架、跨平臺、跨應用的系統提供一致的、可識別的主數據對象來支持整個企業的業務需求,從而提高企業的整體數據質量,提升數據資產價值,推動業務創新,全面增強企業競爭力。主數據管理是一個全面的戰略,涵蓋所有需要統一定義的、企業所需的核心數據和數據標準。主數據管理的有效途徑是建立一個包括主數據標準體系、主數據管控體系、主數據質量體系和主數據安全體系在內的、完整的主數據體系,建立持續長期的管理機制,這樣才能構建企業數據的核心治理能力,合理利用企業數據來尋求競爭優勢。
本書編者從事數據治理和主數據管理咨詢工作近10年,親身經歷了數據治理和主數據管理在中國企業信息化浪潮中的興起、演進和實踐的過程。目前,為了配合國家信息化發展戰略,很多企業把數據治理和主數據管理系統建設項目提上日程,并且開展了部分信息標準化工作。但是,從總體上看,國內企業的主數據體系建設工作仍然處在起步階段,很多企業管理者對數據治理和主數據管理的概念理解有限,對主數據管理體系建設的重要性認識不足。編者將在數據治理和主數據管理領域的從業經驗和知識積累進行總結,與大家分享和探討,并希望能回答什么是數據治理和主數據管理、為什么需要數據治理以及如何進行主數據管理等問題。
本書堅持“貼近用戶”的思路,回答用戶關心的核心問題,不僅介紹主數據管理的產生背景、概念、模型和技術等理論知識,同時涵蓋主數據管理項目的實施方法和過程、主數據管理的產品和應用案例,使讀者對主數據管理項目從底層技術知識到上層應用實踐都能有系統的理解。同時,本書有針對性地對行業主流廠家的主數據管理產品進行了全面介紹,讓讀者能夠更加深入地了解行業主流產品與趨勢。書中案例都是近幾年國內相關行業的領先企業的優秀實踐,對其他企業的主數據管理和數據治理工作具有很高的參考價值。另外,書中對大數據、云計算、人工智能和區塊鏈等新興技術與主數據管理的結合應用也進行了探討及趨勢分析。
全書通過對主數據管理的背景、概念、模型、技術、實施、產品、案例、發展等內容的全面介紹,為讀者揭開主數據管理這一新興概念的神秘面紗,為讀者進行數據治理、主數據管理實踐提供重要參考。全書分為4篇,共14章。第一篇數據治理概念,包括第1~3章,其中第1章介紹數據治理的背景、意義和核心內容,并且引入數據管理的成熟度模型,使用戶可以根據自評表得到成熟度評估和治理建議;第2章討論主數據和主數據管理的概念和意義,為讀者揭示主數據管理的必要性;第3章討論主數據驅動的數據治理,系統地介紹治理框架、治理過程和數據治理工具。第二篇數據治理實施,包括第4~8章,其中第4章介紹主數據治理項目的準備工作;第5章討論主數據體系規劃方法;第6章說明主數據治理項目的具體實施步驟;第7章介紹主數據項目的運維和管理;第8章介紹目前國內主流的主數據管理解決方案和產品,并分析國內主數據管理的先進案例。第三篇數據治理技術,包括第9~13章,其中第9章介紹數據架構和模型的相關技術知識;第10章討論數據集成技術及其企業應用;第11章介紹數據質量管理的定義、評估框架以及數據質量戰略;第12章討論數據生命周期管理的概念、內容和體系架構;第13章介紹數據安全管理和數據隱私保護。第四篇數據治理前景,包括第14章,主要展望主數據與大數據、云服務、人工智能和區塊鏈應用的發展趨勢。
本書既可補充從事信息化建設的IT部門人員的專業知識,更能為組織管理者提供信息化知識儲備和工作思路,助力IT架構的組織優化。本書也面向咨詢公司的顧問和實施人員,不僅針對主數據管理項目,而且對處理各類信息系統項目中可能出現的數據問題都具有一定參考價值。本書還可以作為企業管理軟件開發人員的自學參考書,以及相關專業在校師生開闊視野、理論聯系實踐的參考書。
在本書的編寫過程中參考和引用了國內外很多書籍和網站的相關內容,部分圖片素材和個別實例的初始原型也來源于網絡,部分互聯網相關資源無法一一列舉出處,在此向其作者一并予以感謝。眾所周知,一本書難免出現不足和疏漏之處,懇請廣大讀者將意見和建議反饋給我們,以便在后續版本中不斷改進和完善。有關數據治理的更多信息,可關注北京三維天地科技有限公司微信公眾號。
編者
2019年1月
- 課課通計算機原理
- 輕松學C語言
- Dreamweaver CS3+Flash CS3+Fireworks CS3創意網站構建實例詳解
- LabVIEW虛擬儀器從入門到測控應用130例
- Circos Data Visualization How-to
- Practical Data Wrangling
- VMware Performance and Capacity Management(Second Edition)
- 人工智能實踐錄
- 完全掌握AutoCAD 2008中文版:機械篇
- PVCBOT機器人控制技術入門
- Applied Data Visualization with R and ggplot2
- 啊哈C!思考快你一步
- TensorFlow Deep Learning Projects
- 大型機系統應用基礎
- Learning iOS 8 for Enterprise