- 從零進階!數據分析的統計基礎(第2版)
- 經管之家主編 曹正鳳編著
- 477字
- 2021-10-29 11:59:49
1.5 重要知識點回顧
數據分析的概念:數據分析是指通過某種方法和技巧對準備好的數據進行探索、分析,從中發現因果關系、內部聯系和業務規律等分析結果,為特定的研究或商業目的提供參考。
數據分析的三方面:明確的目的、適當的數據分析方法、有價值的結果。
數據分析的步驟:明確分析目的和內容、數據預收集、數據預處理、數據分析、數據展現和報告撰寫共六個步驟。
數據分析方法根據使用的工具和理論的難度分成四個層次:單純的數據加工方法;數理統計分析方法;數據挖掘方法和大數據分析方法。單純的數據加工方法理論是簡單的數學知識,使用SQL+Excel就可以完成;數理統計分析方法的理論基礎是概率論和微積分,需要使用SPSS Statistics、SAS EG等分析工具;數據挖掘方法的理論基礎是高等數學,其基本原理比較簡單,是根據前期數據得出規則,然后根據規則進行預測和分析,需要使用SPSS Modeler、SAS EM和R軟件等分析工具;而大數據分析方法的理論基礎就是數據挖掘,使用的是Hadoop、Mahout、Spark、Storm等大數據分析工具。在實際的數據分析過程中,數據分析師應根據數據分析的目標,選擇適當的數據分析方法,如果能用簡單的數據分析方法解決問題,就不要選擇復雜高深的算法。
推薦閱讀
- 云數據中心基礎
- 數據可視化:從小白到數據工程師的成長之路
- Test-Driven Development with Mockito
- 從0到1:數據分析師養成寶典
- iOS and OS X Network Programming Cookbook
- 大數據:從概念到運營
- 深度剖析Hadoop HDFS
- 智能數據分析:入門、實戰與平臺構建
- MATLAB Graphics and Data Visualization Cookbook
- 大數據架構商業之路:從業務需求到技術方案
- 云數據中心網絡與SDN:技術架構與實現
- Oracle RAC日記
- Hadoop集群與安全
- 大數據分析:數據倉庫項目實戰
- SQL Server 2012實施與管理實戰指南