- 大數據分析:R基礎及應用
- 深圳國泰安教育技術股份有限公司
- 1313字
- 2021-03-19 19:26:14
引言
大數據時代,R被拉到了潮流尖端,作為免費的開源軟件,隨著加入的人數增多,R的計算引擎、性能、各種程序包都得到了改進和升級,其中R和Hadoop的結合RHadoop實現了大規模數據的分布式處理分析,RHive包將R語言與Hive連接,可以通過R快速訪問存儲在Hive的大數據集,這一切讓R獲得了新生。為了更好地適應新形勢,國泰安聯合中科院先進院于2014年10月成立了金融大數據研究中心。鑒于此,國泰安大數據事業部群組織專家學者推出了《大數據分析:R基礎及應用》一書,該書具有以下幾個方面的特色。
1.實訓性強
目前,市面上流通的R語言經濟金融建模系列教材不勝枚舉。本書的特色在于選取特定的專題來解決一些實際問題,讓讀者學習如何使用R語言進行實證建模。同時,本書也給出了一些非常有價值的總結和后續思考,以供讀者研究。
2.編排體系合理
整個的結構按照“大數據簡介→R語言基礎知識→數據分析功能→專題實證研究→RHadoop案例分析”這樣的思路組織全書,既方便讀者(特別是初學者)在了解大數據概念和技術的基礎上學習R軟件的操作和簡單編程,也幫助他們快速地用R語言建立模型,并作出分析和結果論證,有大量的案例可作參考。
3.考慮不同群體的閱讀偏好和水平
本書涉及面廣,在專題實證研究部分涵蓋了多個領域,包括金融時間序列建模專題、動態面板數據專題、大數據時代數據挖掘專題、機器學習專題和信息可視化專題,充分展示了當前該領域的需求和R的強大優勢。
本書適合沒有編程基礎的科研人員及大數據分析人員使用。從事經管類的學術研究往往都需要建模及數據作為支撐。本書分為三大部分進行介紹,即理論基礎+方法+實證。理論基礎分為兩個章節,主要介紹大數據的基礎知識和相關技術。方法部分分為4個章節,其中第3章主要對R語言進行簡單的介紹,第4章是R語言的操作講解;第5章將介紹R語言一大特色——可視化圖表及相關統計分析的R語言實現;第6章將對R語言數據分析處理進行一個簡單介紹。實證部分包括專題實證研究和RHadoop案例分析,其中專題實證研究介紹4個專題,給出不同的實際案例,循序漸進地講解如何利用R語言進行實證建模,包括時間序列模型、動態面板數據模型、數據挖掘及信息可視化。這些模型既涵蓋了理論的指導,又附有程序的說明及結果的驗證,同時還包括對模型進一步的延伸與思考。RHadoop案例分析部分介紹在RHadoop環境下R的基本操作及8個案例,包括回歸分析、logistic分析、判別分析、聚類分析、主成分分析、因子分析、商品推薦算法及差異分析,針對不同的分析方法介紹算法的原理和RMapReduce編程實現。
本書編寫組希望《大數據分析:R基礎及應用》一書可以對廣大讀者有所幫助,相信讀者能收獲以下幾點:
1.掌握大數據的基礎概念和R處理大數據的機制,并深入地了解R語言,能夠掌握R編程的基本技能,程序注釋非常清楚,易學易懂。
2.熟練掌握從建模到利用R語言對數據進行實證的整個過程。
3.可以學習金融時間序列建模,數據挖掘等領域的一些比較經典和前沿的熱門模型。
4.能夠學習到不同學科之間的交叉應用,包括統計學與金融,數學與金融等一系列知識。
5.熟悉RHadoop環境,掌握RMapReduce編程,實現在RHadoop環境下進行大數據分析。
限于編者的能力和時間,本書難免存在紕漏或不足之處,歡迎讀者批評指正。
深圳國泰安教育技術股份有限公司