官术网_书友最值得收藏!

1.5 重要知識點回顧

數據分析的概念:數據分析是指通過某種方法和技巧對準備好的數據進行探索、分析,從中發現因果關系、內部聯系和業務規律等分析結果,為特定的研究或商業目的提供參考。

數據分析的三方面:明確的目的、適當的數據分析方法、有價值的結果。

數據分析的步驟:明確分析目的和內容、數據預收集、數據預處理、數據分析、數據展現和報告撰寫共六個步驟。

數據分析方法根據使用的工具和理論的難度分成四個層次:單純的數據加工方法;數理統計分析方法;數據挖掘方法和大數據分析方法。單純的數據加工方法理論是簡單的數學知識,使用SQL+Excel就可以完成;數理統計分析方法的理論基礎是概率論和微積分,需要使用SPSS Statistics、SAS EG等分析工具;數據挖掘方法的理論基礎是高等數學,其基本原理比較簡單,是根據前期數據得出規則,然后根據規則進行預測和分析,需要使用SPSS Modeler、SAS EM和R軟件等分析工具;而大數據分析方法的理論基礎就是數據挖掘,使用的是Hadoop、Mahout、Spark、Storm等大數據分析工具。在實際的數據分析過程中,數據分析師應根據數據分析的目標,選擇適當的數據分析方法,如果能用簡單的數據分析方法解決問題,就不要選擇復雜高深的算法。

主站蜘蛛池模板: 长沙县| 黄平县| 宁明县| 伊宁县| 交城县| 合川市| 苗栗县| 横山县| 南皮县| 景德镇市| 景泰县| 漠河县| 道孚县| 九台市| 宜黄县| 伊春市| 云南省| 庄浪县| 修文县| 项城市| 高密市| 儋州市| 余江县| 东城区| 陇西县| 富宁县| 衡水市| 个旧市| 连江县| 克什克腾旗| 五原县| 襄垣县| 丰顺县| 同心县| 德清县| 巴南区| 松阳县| 宜州市| 肥城市| 河曲县| 濮阳市|