- 數據科學實戰指南
- TalkingData
- 1009字
- 2019-06-19 15:56:18
推薦序1
入行十幾年了,我一直在推廣數據思維。
關于數據思維,我銘記于心的是師父的話——用好大數據的前提是先假設任何數據都可以被獲取,不要被數據的多少限制想法。真正的大數據是你還未想通如何用它的數據。
大數據時代確實需要一種全新的思維方式,這遠比任何數據資源及算法重要。我認為在所謂的人和機器人的“戰爭”中,贏家應該是受數據驅動的、有數據信仰的人,科技發展的目的是讓我們的生活更加幸福美好。
當大家為人工智能與大數據技術興奮不已之時,是否想過為什么真正從中得利的企業屈指可數?其實大多數公司的大數據水平仍然處于發展初期,而像Google、阿里巴巴這些已經收獲大數據回報的公司,一般在十幾年前就走上了變革之路。
至今為止,我們依然不能準確形容大數據的全貌,大數據似乎還是一個“正在進行時”詞匯,但我堅定不移地認為,未來世界一定是一個高速運轉的世界,其命脈肯定依賴于海量數據驅動的實時決策與互動,大數據將從根本上改變人類的生活模式及企業的運營方式,甚至能催生出全新的產業乃至社會形態。
然而,利用海量數據和人工智能算法來幫助企業自動優化并實時執行運營任務的前提是,數據要高度流通且能即時響應。自主化企業要先獲得海量數據(內部數據、外部數據、結構化數據、非結構化數據),并具有能夠將這些資源轉化為智能決策的能力。有了這種數據科學范式,企業就能搶在事情發生之前做出決策。平心而論,這是一個頗有難度的系統工程,要想實現這一系統工程,需要參考詳細全面的資料,而本書恰恰提供了構建數據科學系統工程的實戰指南。
對問題進行定義并確定目標如何被量化。
獲取訓練數據并對其進行測試、探索,識別最佳的數據模式。
為數據分析做準備,包括清洗數據、增強數據等。
圍繞著定義好的量化目標進行數據分析及建模。
呈現問題解決步驟,找到問題解決方案。
根據量化結果優化以上過程。
雖說想法永遠比方法重要,但書中的實戰案例可以幫助讀者形成更全面的數據認知。根據我個人的經驗,凡是把數據科學嵌入公司“中樞神經系統”的企業,都將獲得全新視角,提前步入敏捷行動、預測閉環、自動化決策的管理時代。
但要牢記的是,數據科學平臺僅僅是一種工具,要想成為行業的領先者,探索如何釋放人類的潛能才是上策。
車品覺
車品覺,TalkingData專家顧問,阿里巴巴集團前副總裁,阿里數據委員會首任會長,紅杉資本中國基金專家合伙人,擁有十余年數據實戰經驗,并在實戰中形成了獨特的數據化思考及管理方式,對大數據的未來發展趨勢有著獨到的見解。
- Microsoft SQL Server企業級平臺管理實踐
- 卷積神經網絡的Python實現
- Hadoop與大數據挖掘(第2版)
- 云計算服務保障體系
- Lean Mobile App Development
- Learn Unity ML-Agents:Fundamentals of Unity Machine Learning
- 智能數據時代:企業大數據戰略與實戰
- Power BI商業數據分析完全自學教程
- SQL應用及誤區分析
- Apache Kylin權威指南
- Hadoop集群與安全
- 跨領域信息交換方法與技術(第二版)
- Expert Python Programming(Third Edition)
- 智慧城市中的大數據分析技術
- 數據產品經理寶典:大數據時代如何創造卓越產品