- 大數據理論與工程實踐
- 陸晟 劉振川 汪關盛等編著
- 983字
- 2019-10-23 13:28:07
推薦序
汪關盛先生邀請我為本書寫序,粗粗翻閱后,我的第一個反應是,我可能沒有足夠的經驗和知識來寫;接著,細看之下,就被它的內容吸引,書中有許多我希望了解但不知道去哪里找的信息和知識。關于本書的定位、寫作過程和閱讀對象等,作者團隊已經做了很好的介紹,我在此就跟大家簡單分享一下我對本書獨到之處的一些粗淺看法。
與傳統數據處理相比,大數據由于其屬性和量級的不同,處理起來也需要遵循不同的理論和采用不同的手段。本書對數據的收集、存儲和處理, CPU及網絡等資源的分配和同步等做了全面和詳細的介紹,是一本關于大數據理論和工程實踐的不多見的好書,內容比我讀過的其他討論大數據技術的書要更廣泛和深入。本書有助于讀者了解大數據從藍圖設計到工程落地需要考慮和到位的各層技術。
在閱讀和學習的過程中,我覺得本書有以下幾個特點。
1.與現在許多為吸引眼球起個名頭大的標題而缺乏實質內容的作品相比,本書的做法正好相反。書中各章節的標題看似很普通,但下面包含的內容卻極為豐富,體現了作者對大數據理論和工程問題了解的深度。作者在各章節中引用了一些原創和權威資料,同時適當配置了一些程序作為例子,使我感動于他們的專業精神和為此付出的大量努力。
2.大數據的工程理論和實施技術十分復雜,本書進行了系統的講述。對工程的每一步、每一層均有詳細介紹但內容間并不孤立,一環扣一環,上下文有機關聯,從大數據的應用到配套的軟、硬底層基礎,一氣呵成。不少技術書往往就技術論技術,本書能結合應用和應用的需求談技術,也是它的獨到和可貴之處。
3.本書把大數據的工程理論和實踐與人工智能結合起來討論。我一直希望能把傳統的數據處理與大數據、人工智能關聯理解和融合,這本書的內容和設計對我有所啟發。雖然這三個領域各有各的側重點,但是最終,業務拓展、企業運營和市場開拓一定都需要基于數據的應用和技術,而不管它們需要及處理的數據類型或屬性是否相同。這本書為理解大數據、大數據處理及人工智能如何互聯互通搭建了一個橋梁。
數據行業經過多年的發展,已成為當前數字經濟的主要部分。同時,如所有專業和行業的發展過程一樣,它必然會發展出更細和更專門的子領域。我覺得這本書的出版可以加強從事各數據行業子領域的專業人士間的溝通和了解,對整個數據行業的協同發展也有很強的理論和現實意義。
胡本立
國際數據管理協會(DAMA)中國分會主席、世界銀行前首席技術官
2018年10月13日于華盛頓
- 數據要素安全流通
- 輕松學大數據挖掘:算法、場景與數據產品
- Python廣告數據挖掘與分析實戰
- Hadoop與大數據挖掘(第2版)
- Live Longer with AI
- 大數據:從概念到運營
- Mastering Machine Learning with R(Second Edition)
- LabVIEW 完全自學手冊
- Unreal Engine Virtual Reality Quick Start Guide
- Web Services Testing with soapUI
- Mastering ROS for Robotics Programming(Second Edition)
- 云計算寶典:技術與實踐
- SQL Server 2008寶典(第2版)
- AndEngine for Android Game Development Cookbook
- 大數據技術體系詳解:原理、架構與實踐