官术网_书友最值得收藏!

前言

自2015年以來,“大數據時代”已成為最熱門的名詞之一。大數據在企業決策中扮演著越來越重要的角色,各個行業都不約而同地提出了大數據的口號,與大數據相關的新名詞、新產品不斷涌現,“統計分析和數據挖掘”躋身最受歡迎的求職技能行列,數據分析師的薪酬待遇也遠遠超過平均薪資水平。與數據分析技能之火爆相對應的是數據分析人才的缺失。麥肯錫公司的研究報告表明,截至2018年,全球面臨150萬數據分析人才方面的缺口。這意味著,有150萬的其他行業從業人員將有可能把握住機會,轉型為令人艷羨的數據分析師。

全面的數據改革迫在眉睫,但如何真正落實大數據的應用,仍然是一個富于爭議的話題。數據分析行業內部面臨著相同的困境,在大數據時代,新的數據分析方法層出不窮,原有的數據分析方法也在不斷完善,這些都導致數據分析師這一工作發生了令人措手不及的變化。為了幫助新的從業人員盡快熟悉數據分析這一工作,以及幫助原有的數據分析師盡快完成轉型,本書精心選擇了32個流行的數據分析算法,并佐以案例,供大家了解大數據時代下數據分析行業的最新動態。

本書特色

1.條理清晰,內容翔實,全面介紹了大數據時代下的數據分析算法體系

數據分析處于統計學、人工智能、模式識別、機器學習等多個領域的交叉處。本書分為8章,每章都有獨立的主題,涵蓋了數據分析所涉及的大部分學科。同時,本書不同章之間存在緊密的關聯,揭示了不同學科之間的異同,以及它們是如何豐富數據分析的內涵并影響數據分析學科發展的軌跡的。通過閱讀本書,讀者將站在制高點,一覽大數據時代下不同數據分析算法是如何彼此關聯而構成完整體系的。

2.語言通俗易懂,內容由易到難,適合各層次的讀者學習

本書語言詼諧有趣,對每個數學公式都不厭其煩地舉例講解,即使毫無高等數學基礎的讀者也能夠讀懂本書所講解的內容。同時,本書嚴格按照由易到難的學習規律編寫,從較為簡單的經典數據分析方法寫起,逐漸過渡到較為晦澀的模式識別、機器學習等內容,通過閱讀本書,讀者將從一個“數據分析小白”迅速進階為基礎扎實、能獨當一面的數據分析師。本書的內容涵蓋了每個算法的原理、公式、適用場景和優缺點。無論是數據分析菜鳥,還是有一定經驗的數據分析師,本書都能夠幫助你拓展、加深對數據分析的認識。

3.案例豐富精彩,應用貼近實際,滿足讀者的多重需求

本書為每個算法都配備了一個精心選擇(兼顧時效性)的商業案例,這些案例橫跨十幾個行業,將大數據時代為人稱道的經典案例一網打盡,滿足了讀者的三大需求:首先,結合案例能將算法講解得更加清楚,加深讀者對算法的認識;其次,這些案例展示了數據分析在各行各業的最新應用,讀者能夠通過它們切實感受到數據分析的魅力,激發讀者學習數據分析的熱情;最后,這些案例涉及多個領域,不僅能夠迎合從事不同領域工作的讀者的口味,也能夠讓讀者了解數據分析在不同領域的現狀,從而幫助讀者選擇進一步深入學習的方向。

第2版說明

第2版在第1版的基礎上,對每章的綜述部分內容進行了擴充,增加了諸如現實進展、應用初窺、算法類型介紹、技術發展歷程等內容。以便讀者能夠更加充分地了解這些算法及其落地應用的前世今生,清晰地把握算法是如何提出的、如何迭代的,以及如何應用在解決實際問題當中。此外,為了保證本書的時效性,第2版還修正和補充了一些新的案例和數據,添加了2015—2018年數據挖掘/數據分析領域中的一些新的進展和新的成果。這些努力的目的都是力圖使本書變得更加豐富和形象化,引起讀者對數據挖掘和數據分析相關方面的興趣。此外,鑒于作者水平有限,可能存在謬誤之處,希望您在閱讀本書之時,帶有一些批判的眼光,給予指正和批評。

本書內容及體系結構

第1章 經典的探索性數據分析案例

本章介紹了4種最基本的數據分析方法,分別是數據收集、數據可視化、異常值分析和對比分析。通過學習這4種數據分析方法,讀者將對數據分析師的工作內容有一個初步的了解,使讀者能夠完成初級的數據分析任務。

第2章 經典的相關分析與回歸分析案例

本章的主題是相關分析和回歸分析。這兩種分析方法經典、古老而有效,至今仍被廣泛應用。其中,相關分析能夠為回歸分析做準備,回歸分析又從側面驗證了相關分析結果的正確性。本章涉及1種最常見的相關分析方法和3種最常見的回歸分析方法,通過閱讀本章,讀者將獲得解決小數據樣本下的一大類數據分析問題的能力。

第3章 經典的降維數據分析案例

本章介紹了粗糙集算法、因子分析、最優尺度分析、PCA降維算法等4種降維算法。本章是小數據分析和大數據分析交界的一章,這4種降維算法既可以為小數據分析服務,也可以為大數據分析服務。本章展示了降維分析與相關分析、回歸分析的關聯,加深了讀者對小數據分析的理解,并為讀者打開了大數據分析的大門。

第4章 經典的模式識別案例

本章感興趣的問題是模式識別問題。模式識別算法研究的是如何讓機器像人一樣認識世界,它運用了較多的數學知識,并借助編程方法來實現。圖像分析、遺傳算法、決策樹、K均值是本章關心的主題,本章選取了與數據分析關系最密切的案例,旨在使讀者了解模式識別與數據分析的區別與聯系。

第5章 經典的機器學習案例

本章關心的內容是機器學習,機器學習學科致力于讓機器擁有和人類一樣的思考能力。通過閱讀本章的語義搜索、順序分析、文本分析、協同過濾4個算法,讀者將發現機器學習更多的是從機器的角度來思考問題,這要求讀者擁有更深入的編程思維方式,以便于更好地實現機器學習算法。

第6章 經典的深度學習案例

本章是對上一章的延伸,介紹了支持向量機、兩種神經網絡和RBM算法。深度學習是一個很大的命題,本章僅選取了與數據分析最相關的部分。另外,除向讀者介紹4種深度學習算法以外,還向讀者指明了機器學習未來的發展方向,這將同樣影響到數據分析未來的發展。

第7章 經典的數據挖掘案例

本章介紹了判別分析、購物籃分析、馬爾可夫鏈、AdaBoost元4種算法,實質上是對以上6章的查漏補缺。大數據時代加速了各個學科的融合,數據科學家借鑒了不同學科知識后創造出的數據分析算法也就具有了多種學科的特質。本章將這些“混血”算法集合起來,向讀者展示了數據分析最多變的一面。

第8章 經典的商業智能分析案例

本章是對數據分析的升華和總結,在真正的數據分析項目中,數據分析師總是會運用多種數據分析方法來構建模型,本章所介紹的案例就是這樣運用多種方法構建模型的例子。同時,本章還進一步辨析了數據分析和數據挖掘的異同,并隱含了作者對所有讀者的寄語,讀完本章后,讀者就能對大數據時代下的數據分析有一個全面深入的認識了。

本書讀者對象

● 剛剛入行的數據分析人員;

● 統計學、管理學、金融學、計算機技術與科學等專業的學生;

● 想要提高數據分析能力的數據分析師;

● 希望轉行做數據分析的從業人員;

● 想要增加對數據分析的了解的主管人員;

● 其他對數據分析感興趣的讀者。

主站蜘蛛池模板: 社会| 富源县| 江永县| 襄樊市| 盐池县| 图们市| 郁南县| 越西县| 理塘县| 元谋县| 平安县| 江城| 哈巴河县| 深水埗区| 孝昌县| 启东市| 利津县| 涡阳县| 武威市| 天全县| 井研县| 喀喇沁旗| 阿拉善盟| 丹寨县| 新巴尔虎右旗| 房产| 嘉善县| 甘泉县| 宁武县| 平顶山市| 广安市| 西林县| 天气| 磴口县| 大丰市| 浦东新区| 东兴市| 蓬安县| 驻马店市| 雷波县| 赫章县|