官术网_书友最值得收藏!

前言PREFACE

筆者在Loblaw Companies任職全棧數據分析師期間,深刻體會到了有時許多校內學習到的理論知識并非即刻適用。這樣的傳統零售業在走向數據驅動模式時,往往不需要使用龐大的深度學習模型,或其他消耗巨大算力的算法。一些可解釋性高,所需數據量較小的模型足以貢獻十分可觀的商業價值。相比起走學術路徑中理論基礎的重要性,在行業實操中更重要的是掌握數據分析的全過程,以及擁有足夠的經驗讓步驟間有節奏地配合,因此筆者決定寫這本書,將預測分析中重點的步驟和其間配合以可著手的方式展現給讀者。

本書的著重點在于預測分析與機器學習的實戰思路,其中加入算法或模型的理論知識介紹,讓讀者在學習如何運用的同時,更加深入地學習為何在該實踐場景下使用該特定算法或模型。書中側重講解實操中常用、回報率高的算法。內容簡單易懂,圖文搭配,借鑒實際例子讓學習過程更具實用感。

本書致力于幫助3類讀者在預測分析與機器學習這條路上有所成長。第1類,有Python編程基礎但缺乏數據科學背景,有意入門的讀者。書中不設置有關數據科學背景的閱讀門檻,每個相關背景都將先介紹再進行引用。另外,因本書偏向實操而非理論,內容對于這一類讀者將更加容易消化,書中的代碼注釋豐富,容易著手跟隨。第2類,有數據科學理論基礎知識,有意進入實操的讀者,例如缺乏業界經驗的學生。這類讀者已經掌握了許多理論背景知識,只是缺少實踐經歷。本書有效地展示理論算法如何在實操中運行,以及各理論知識運用的搭配。第3類,有數據科學理論基礎與實操經驗,但日常工作集中在數據分析管道中的數據分析師。本書可以幫助這類讀者了解在工作中如何與同事配合。在項目經理職位的讀者也可以通過閱讀本書更好地理解隊內成員的工作、難點,以及定位項目突破口。

本書還包含部分理論知識,希望通過介紹算法的運作原理,幫助讀者建立面對問題選擇解決方案的思路。瀏覽目錄便會發現,第4章不到100頁的內容包含了大量機器學習模型及算法,每種算法的介紹從其運作原理講起,到將其運用在一個實際例子中。筆者盡量平衡了理論深度與實踐思路的講解,希望可以在有限的篇幅中幫助本書面對的群體。

機器學習這一領域有著長達數十年的理論研究,其內容包羅萬象。筆者學識有限,書中難免存在疏漏,望得到各位讀者的指正。

王沁晨

2022年2月

主站蜘蛛池模板: 六安市| 手机| 竹山县| 大城县| 重庆市| 宁河县| 广饶县| 隆昌县| 潼关县| 合作市| 苗栗市| 简阳市| 青川县| 利津县| 靖江市| 将乐县| 新野县| 武宁县| 章丘市| 诸暨市| 五指山市| 鄂托克前旗| 顺平县| 得荣县| 芮城县| 色达县| 铅山县| 南涧| 肃北| 饶阳县| 余姚市| 石棉县| 如东县| 四川省| 太仆寺旗| 普安县| 六安市| 五指山市| 金沙县| 洛南县| 南投县|