官术网_书友最值得收藏!

推薦序3

The Unknown Known 是一部記錄美國國防部前部長Donald Rumsfeld 的政治生涯的紀錄片,在影片中,Donald Rumsfeld 說過這樣一句話——There are known knowns, there are things we know that we know.There are known unknowns, that is to say there are things that we know we don't know.But there are also unknown unknowns, there are things we do not know, we don't know.

這句話的大概意思是,有些事,我們知道自己知道;有些事,我們知道自己不知道;還有一些事,我們甚至不知道自己不知道。

這句話恰巧揭示了大數據探索及數據科學的特性。當我們知道自己不知道的時候,我們可以從明確的問題開始,使用各種數據科學分析方法進行數據連接、數據準備、模型建立、統計查詢,直到得出結論。然而更具挑戰性的事情是,很多時候我們連具體的問題都搞不清楚就已經開始進行數據探索了,需要通過反復迭代數據分析的過程來明確問題,不斷優化模型和分析方法,進而獲得真正的數據價值。

當今數據的體量、維度、類別都在飛速增長,傳統數據分析面臨著巨大的挑戰,行之有效的數據科學方法和工具越來越被從業者迫切需求。

這本《數據科學實戰指南》沉淀了 TalkingData 近7年來的數據科學實踐經驗和探索心得。本書闡述了數據科學的來龍去脈、數據分析的安全和隱私保護,以及數據治理模式,并堅持以實戰落地為最終目的,分享了 TalkingData 數據科學平臺的能力及行業應用的最佳實踐。書中還詳細介紹了數據科學平臺工具DSS,呈現了從數據資產管理到數據連接,再到部署上線的操作閉環。

數據科學本質上是一場應用實戰,TalkingData在零售、金融及智慧城市等多領域都具有領先的數據科學能力。當然,數據科學仍然處于早期探索階段,離完全成熟還早。但我相信這本書能夠更好地推動數據科學進一步發展,幫助數據科學從業者探索到更多的“unknowns”。

王亭

TalkingData CTO

主站蜘蛛池模板: 周口市| 二连浩特市| 莲花县| 大田县| 沙坪坝区| 哈巴河县| 安徽省| 泊头市| 永仁县| 永康市| 颍上县| 文登市| 忻城县| 微山县| 毕节市| 托里县| 郧西县| 华宁县| 论坛| 安远县| 泌阳县| 柏乡县| 石林| 甘德县| 苏州市| 大港区| 双牌县| 民和| 高阳县| 宝应县| 西林县| 出国| 兰考县| 阿拉善右旗| 香港| 连平县| 饶阳县| 色达县| 吕梁市| 肇源县| 依兰县|