- 大數據分析與應用實戰:統計機器學習之數據導向編程
- 鄒慶士編著
- 1028字
- 2022-07-28 20:15:28
前言
本書醞釀已久,走筆至此,不敢說是完美,但總算告一段落了!大數據分析是一個寬闊迷人的交叉學科領域,至少包括計算機科學、統計學與運籌學,讓我到現在還不知道如何走出來。任何跨領域的新興學科,其實很少有人是專家,而我只是眾多對大數據充滿興趣的研究者中的一員。
知識探索的過程有時就像充滿驚奇變化的自助旅行一樣,抓住重要的基本方向,例如大數據分析背后的數學模型與計算機模型,先理論后實踐,不斷地相互交叉驗證,其他就順勢而為,且戰且走,享受意外的收獲了。關于數據科學工具的采用,我們經歷了R語言因統計機器學習而走紅,Python語言因深度學習而興起的過程,甚至要思考何時擁抱運算效率更好的Julia語言。就數據領域而言,氣象、交通、社群網絡、電子商務、金融科技、物理化學、制造技術、農漁養殖、綠能發電、環境輻射、生物醫學等,大數據研究永無止境。
道是本,術是末,因為物有本末,事有終始,知所先后,則近道矣,所以我們“重道輕術”了。但道是靈,術是體,術是道的具體實現,是看得見、摸得著的規律,也算是道的一部分,所以我們得“從術悟道”了。無論如何,筆者建議大數據分析的學習過程避免昨非今是、有我無你的文人相輕式學習。重視與慎選優質靈活工具,不斷地動手探索嘗試,并從失敗中積累經驗,努力思索跨領域的源頭,方能邁向術道兼修的至高境界。
本書特色:
· 文字說明、程序代碼與執行結果等交叉呈現,有助于閱讀理解。
· 提供來自不同領域的數據處理與分析范例。
· 同時掌握數據分析兩大主流工具——R與Python。
· 凸顯第四代與第三代程序語言的不同之處。
· 深入淺出地介紹統計機器學習理論與實踐。
大數據分析人才需要具備的特質是“謙卑與學習、固本但跨域”,筆者希望通過本書分享這幾年積累的學習方向:一數據、二工具、三模型。一心向著數據理解的根本要務前進,精通至少兩種彈性的分析工具(R與Python),掌握概率統計、機器學習與運籌學等三大類模型,大步邁向數據驅動的智能決策新紀元。
本書的完成首先要感謝家人們的支持與協助,讓我無后顧之憂,專心寫作與編程。工作單位臺北商業大學信息與決策科學研究所提供良好的研究環境,讓我這幾年在大數據領域鉆研。稿件整理與校閱工作多是在半年休假研究期間完成的,新加坡國立大學商學院分析與作業學系,以及南京理工大學經濟管理學院,為我提供了很好的寫作與住宿環境。最后,筆者才疏學淺,校稿期間一再發現許多誤謬、疏漏、錯置與不嚴謹之處,雖已努力改進,一定還有未竟之處,敬請廣大讀者給予建議與斧正。
鄒慶士
2021年1月于臺北市
- Functional Python Programming
- MySQL數據庫管理實戰
- Spring技術內幕:深入解析Spring架構與設計
- Mastering phpMyAdmin 3.4 for Effective MySQL Management
- HTML5 移動Web開發從入門到精通(微課精編版)
- 前端架構:從入門到微前端
- Java深入解析:透析Java本質的36個話題
- Learn WebAssembly
- CouchDB and PHP Web Development Beginner’s Guide
- 大學計算機基礎(第2版)(微課版)
- 深入淺出Serverless:技術原理與應用實踐
- 數據結構與算法分析(C++語言版)
- Create React App 2 Quick Start Guide
- Clean Code in C#
- HTML5+CSS3+JavaScript 從入門到項目實踐(超值版)