- 數據科學實戰指南
- TalkingData
- 658字
- 2019-06-19 15:56:19
推薦序3
The Unknown Known 是一部記錄美國國防部前部長Donald Rumsfeld 的政治生涯的紀錄片,在影片中,Donald Rumsfeld 說過這樣一句話——There are known knowns, there are things we know that we know.There are known unknowns, that is to say there are things that we know we don't know.But there are also unknown unknowns, there are things we do not know, we don't know.
這句話的大概意思是,有些事,我們知道自己知道;有些事,我們知道自己不知道;還有一些事,我們甚至不知道自己不知道。
這句話恰巧揭示了大數據探索及數據科學的特性。當我們知道自己不知道的時候,我們可以從明確的問題開始,使用各種數據科學分析方法進行數據連接、數據準備、模型建立、統計查詢,直到得出結論。然而更具挑戰性的事情是,很多時候我們連具體的問題都搞不清楚就已經開始進行數據探索了,需要通過反復迭代數據分析的過程來明確問題,不斷優化模型和分析方法,進而獲得真正的數據價值。
當今數據的體量、維度、類別都在飛速增長,傳統數據分析面臨著巨大的挑戰,行之有效的數據科學方法和工具越來越被從業者迫切需求。
這本《數據科學實戰指南》沉淀了 TalkingData 近7年來的數據科學實踐經驗和探索心得。本書闡述了數據科學的來龍去脈、數據分析的安全和隱私保護,以及數據治理模式,并堅持以實戰落地為最終目的,分享了 TalkingData 數據科學平臺的能力及行業應用的最佳實踐。書中還詳細介紹了數據科學平臺工具DSS,呈現了從數據資產管理到數據連接,再到部署上線的操作閉環。
數據科學本質上是一場應用實戰,TalkingData在零售、金融及智慧城市等多領域都具有領先的數據科學能力。當然,數據科學仍然處于早期探索階段,離完全成熟還早。但我相信這本書能夠更好地推動數據科學進一步發展,幫助數據科學從業者探索到更多的“unknowns”。
王亭
TalkingData CTO
- Hadoop與大數據挖掘(第2版)
- 揭秘云計算與大數據
- Remote Usability Testing
- MATLAB Graphics and Data Visualization Cookbook
- AI時代的數據價值創造:從數據底座到大模型應用落地
- Python數據分析與挖掘實戰(第3版)
- 云數據中心網絡與SDN:技術架構與實現
- 編寫有效用例
- 探索新型智庫發展之路:藍迪國際智庫報告·2015(下冊)
- SQL Server 2012實施與管理實戰指南
- 區域云計算和大數據產業發展:浙江樣板
- 數據挖掘競賽實戰:方法與案例
- R Machine Learning Essentials
- Filecoin原理與實現
- 企業大數據處理:Spark、Druid、Flume與Kafka應用實踐