- 數據自助服務實踐指南:數據開放與洞察提效
- (美)桑迪普·烏坦坎達尼
- 827字
- 2022-05-20 19:18:42
譯者序
我從事大數據開發工作已有10余年,如果以工程視角從底層數據接入到上層數據應用來看,我過往的工作內容涵蓋了數據接入、離線/實時數據倉庫建設、數據ETL、數據挖掘(個性推薦、風控方向)、數據分析、數據可視化等完整數據鏈路的開發,并得以實踐落地,促使公司業務高效開展。其間多次燃起過把這些心得和經驗落成文字的念頭,也嘗試過多次對外技術分享,但這些技術分享都是從細分層面或者工程技術實踐來展開講解的,一直沒能找到一條主線把這些內容串起來,所以這個念頭遲遲沒有落地。
直到好友萬學凡突然問我是否有興趣翻譯一本有關大數據實踐方面的書(即本書),在了解大概內容后,我與擅長數據分析、數據運營、專業翻譯的好友熊暢和王曉倩一起接下了本書的翻譯工作。經過近半年的翻譯和校對,我們終于完成了本書的翻譯。
本書作者擔任Unravel Data Systems的工程副總裁兼首席數據官,在構建企業數據產品、商業分析與機器學習應用方面有近20年的經驗。本書基于“洞察耗時”記分卡方法展開,也就是說,為數據平臺的當前狀態定義記分卡,從源數據到洞察的過程包括發現、準備、構建、實施這四個關鍵步驟,對這四個關鍵步驟中各個環節的耗時進行度量,最后列出完整的路線積分卡,并從中識別洞察過程中的痛點,優化這些痛點,實現每個指標的自助服務,最終達到洞察提效的目的。書中每一章都專注于一個指標,并涵蓋自動化水平不斷提高的模式。書中沒有推薦太多當前流行的技術組件或者很快會過時的特定技術,而是關注實現模式,提供了一些現有技術最佳實踐的案例。
本書極具指導價值,致力于把數據用戶和數據工程師的觀點結合在一起,讀后必大有所獲。
我與本書的另兩位譯者熊暢和王曉倩一起克服了日常工作的壓力,同心協力完成了本書的翻譯工作。
感謝我們的家人,他們的理解和支持使我們得以心無旁騖地翻譯本書。同時感謝機械工業出版社華章分社的編輯李忠明,他的耐心解答讓我們在翻譯過程中少走了很多彎路,也感謝負責本書審校工作的編輯們,他們極大地提高了本書的質量。
吳瑞誠
2021年12月于武漢
- LibGDX Game Development Essentials
- 數據之巔:數據的本質與未來
- Test-Driven Development with Mockito
- 計算機信息技術基礎實驗與習題
- PySpark大數據分析與應用
- Mockito Cookbook
- Hadoop大數據實戰權威指南(第2版)
- 數據庫技術及應用教程
- Google Cloud Platform for Developers
- Oracle數據庫管理、開發與實踐
- 聯動Oracle:設計思想、架構實現與AWR報告
- 數據庫與數據處理:Access 2010實現
- Scratch 2.0 Game Development HOTSHOT
- 數據中心經營之道
- 數據分析思維:產品經理的成長筆記