- R語言游戲數據分析與挖掘
- 謝佳標
- 2012字
- 2019-01-05 05:21:38

前言
為什么要寫這本書
隨著大數據的概念越來越流行,越來越多的企業開始重視數據,期待從數據中尋找有價值的結論,以指導公司管理層決策,最終創造更大的價值。但是在游戲行業,數據分析的發展相對緩慢,很多游戲公司是在發現人口紅利消失后才逐漸重視數據,希望利用數據驅動產品。而在各種數據分析技術中,R語言作為一個可進行交互式數據分析和探索的強大平臺,擁有舉足輕重的作用。R語言的免費開源使得很多公司用它來處理數據、展示數據、分析數據、完成模型。
使用R語言可以進行游戲數據分析系統的搭建,可以對累積的海量游戲數據進行挖掘,找出其中的特征和規律。對于有志成為互聯網數據挖掘/分析師的讀者來說,R語言將成為他們未來必備的技能之一。
筆者在歷屆中國R語言會議演講時,都會遇到一些同學問類似這樣的問題:“是否學好數據挖掘工具就能勝任數據分析工作?”雖然這些學生都具備很好的理論和工具使用能力,但是缺乏對實際生產數據的處理能力,即學生們很少接觸到企業的真實數據,不知道如何將臟數據處理為可以建模的數據集。這也是筆者寫這本書的初衷。在本書中,筆者希望結合自己多年的數據挖掘實戰經驗,將R語言與游戲數據分析有機結合,真正做到“授之以漁”。
本書特色
本書從實際應用出發,結合實例及應用場景,通過對大量案例進行詳細闡述和深入分析,進而指導讀者在實際工作中通過R語言對游戲數據進行分析和挖掘。
本書的核心是游戲數據分析實戰,所以在案例講解過程中均會對分析結果進行業務解讀,進而幫助數據分析師提高“利用結果數據指導實際商務決策”的能力。
基于對業務的思考,本書從解決問題入手,以游戲為最佳切入點,輻射整個數據分析領域,并完成數據分析和挖掘建模工作,對其他行業的數據分析師如何做數據分析/挖掘也具有很大的啟發性。同時,本書內容涵蓋了R語言基礎、數據挖掘理論與實戰、交互式繪圖和Web網頁開發等,故也可以作為數據挖掘的入門書籍。
本書適用對象
?游戲產品運營人員
?游戲數據分析人員
?各行各業的數據分析師
?數據分析愛好者
?具有數據分析背景的數據科學家
?進行數據挖掘應用研究的科研人員
?相關專業的在校生
如何閱讀本書
全書一共13章,分為三篇:基礎篇、實戰篇和提高篇。基礎篇介紹了游戲數據分析的基本理論知識、R語言的安裝與使用、R語言中的數據結構、常用操作和繪圖功能。實戰篇主要介紹了游戲數據的預處理、常用分析方法、玩家路徑分析和用戶分析。提高篇介紹了R語言圖形界面工具Rattle和Web開發框架shiny包。
第一篇是基礎篇(第1~4章):第1章主要介紹了游戲數據分析的必要性和流程;第2章講解了R語言和RStudio的安裝及使用方法,并對數據對象和數據導入進行了介紹;第3章介紹了R語言繪圖基礎,包括常用圖形參數設置、低級繪圖函數和高級繪圖函數;第4章介紹了lattice和ggplot2繪圖包,并詳細介紹了一些基于R語言可用于生成交互式圖形的軟件包,包括rCharts、recharts、rbokeh、plotly等。
第二篇是實戰篇(第5~11章):第5章介紹了游戲數據預處理常用的手段,包括數據抽樣、數據清洗、數據轉換和數據啞變量處理;第6章介紹了游戲數據分析的常用方法,包括指標數據可視化、游戲數據趨勢分析、游戲數據相關性分析和游戲數據中的降維技術;第7章介紹了事件點擊行為常用的漏斗分析和路徑分析;第8章介紹了留存指標的計算、留存率計算與預測、常用分類算法原理和模型評估;第9章介紹了常用用戶指標計算、LTV計算與預測、用戶物品購買關聯分析、基于用戶物品購買智能推薦和社會網絡分析;第10章介紹了渠道數據分析的必要性和對渠道用戶進行質量評級;第11章介紹了常用收入指標計算、利用用戶活躍度衡量游戲經濟狀況、RFM模型研究。
第三篇是提高篇(第12~13章):第12章介紹了R語言的圖形界面工具Rattle,該工具能夠在圖形化的界面上完成數據導入、數據探索、數據可視化、數據建模和模型評估整個數據挖掘流程;第13章介紹了Web開發框架shiny包,使得R的使用者不必太了解CSS、JS,只需要了解一些HTML的知識就可以快速完成Web開發。
勘誤和支持
由于筆者的水平有限,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。你可以把意見或建議直接發至我的郵箱(jiabiao1602@163.com)。如果你有什么問題,也可以發郵件來提問,我將盡力為讀者提供滿意的解答,期待你們的反饋。書中全部數據及源代碼都可以從GitHub網站(登錄網站https://github.com/jiabiao 1602/Game_DataMining_With_R或掃描下方二維碼)進行下載。

致謝
首先,感謝樂逗游戲CEO陳湘宇的支持,讓筆者能把這幾年在游戲行業中的一些數據挖掘實戰寫進本書,使讀者能完整地看到如何對原始的數據源進行清洗轉換以達到建模需求。書中介紹了對游戲行業付費用戶行為研究的幾種模型算法,相信對其他行業進行付費用戶挖掘分析也可以起到很好地借鑒作用。
其次,感謝機械工業出版社華章公司副總編楊福川的信任,同時,也要感謝編輯李藝審閱本書的全部章節,有了他們的支持、鼓勵和幫助,本書才能得以順利出版。
最后,感謝家人,感謝你們一直以來的理解、陪伴和支持。
謹以此書獻給我最親愛的家人以及眾多R語言的愛好者和數據分析師們!
- C#高級編程(第10版) C# 6 & .NET Core 1.0 (.NET開發經典名著)
- Monkey Game Development:Beginner's Guide
- Ext JS Data-driven Application Design
- 薛定宇教授大講堂(卷Ⅳ):MATLAB最優化計算
- Windows Presentation Foundation Development Cookbook
- Java 11 Cookbook
- ASP.NET Core 2 Fundamentals
- Corona SDK Mobile Game Development:Beginner's Guide(Second Edition)
- Java編程從入門到精通
- MySQL數據庫應用實戰教程(慕課版)
- JavaScript Concurrency
- SCRATCH編程課:我的游戲我做主
- 深入大型數據集:并行與分布化Python代碼
- 讓Python遇上Office:從編程入門到自動化辦公實踐
- Scala實用指南