- R數據挖掘實戰
- (意)安德烈亞·奇里洛
- 349字
- 2024-05-24 17:51:22
第2章 數據挖掘入門——銀行賬戶數據分析
通過第1章的介紹,讀者應該弄清楚了值得在R語言上投入時間的原因:它是一門強大的語言,具有插件就緒以及數據可視化友好等諸多特性。嘗試利用如此強大的語言,是不是會讓人覺得很棒呢?
由此我們引出本章的內容:嘗試利用R語言來解讀讀者的數據、挖掘信息。
本章將對讀者的個人數據(特別是銀行賬戶數據)進行處理;利用R語言,對讀者的財務習慣進行挖掘并建模。通過對本章的學習,讀者將學會執行以下幾項任務,與此同時,會更加期待后續內容的學習。
● 通過dplyr程序包所提供的函數來匯總讀者的銀行賬戶數據(下文簡稱銀行數據)。
● 通過匯總數據,解答有關讀者財務習慣的問題。
● 針對銀行數據,使用ggplot2程序包來生成基礎可視化圖表和高級可視化圖表。
但在實際動手操作之前,需要先跟讀者討論一下將要處理的數據。