官术网_书友最值得收藏!

任務二 認知數據分析

一、數據分析流程

數據分析通常需要遵循以下步驟,如圖1-2所示。

圖1-2 數據分析的流程

1.明確分析需求

明確分析需求是數據分析的起點。明確分析需求就是確定數據分析的目的,明確分析的主題。

2.設計分析框架

分析需求明確之后,需要設計開展數據分析的整體框架。具體包括:從哪些維度展開分析?采用什么方法進行數據分析?使用哪些指標闡釋問題?采用何種形式來呈現結果?

3.采集基礎數據

這是指根據確定的分析主題,利用各種數據采集技術從多種渠道收集數據分析的相關數據。

傳統的數據采集和大數據采集在數據來源、數據類型和數據存儲上都體現了不同。大數據采集具有全面性、多維性、高效性的特點;數據源包括所有格式的傳感器數據、互聯網數據、日志文件、企業業務系統數據、辦公文檔、文本、圖片、各類報表、圖像、音頻、視頻等信息。企業可以借助數據倉庫技術(Extract-Transform-Load,ETL)工具,把分散在不同位置的數據加載到企業數據倉庫中。

4.清洗(整理)數據

數據清洗是對采集到的數據進行識別,按照數據規范化的要求進行整理。需要清洗的數據包括:殘缺數據、錯誤數據、重復數據、空值等不規范的數據。數據清洗的內容是對數據的一致性進行檢查、對無效值和缺失值進行處理,使其滿足下一階段數據分析的要求。

5.分析展現數據

在完成數據清洗的基礎上構建數據模型,建立數據表之間的關聯,進行指標計算、數據挖掘。利用數據分析工具針對預先設定的分析主題,從不同的分析維度、選擇適當的形式對各項指標進行展現。可視化圖形是最直觀的展現方式之一,能夠幫助并啟發管理者發現問題。

6.撰寫分析報告

數據分析的目標是通過歷史和現狀分析,發現問題;定位問題原因,制定針對性措施加以改進,以期得到管理改善。而這些都可通過分析報告呈現。

主站蜘蛛池模板: 克什克腾旗| 岑溪市| 射洪县| 广水市| 梁平县| 新龙县| 泾源县| 汽车| 清苑县| 松原市| 鸡东县| 西乌| 大港区| 锡林郭勒盟| 张掖市| 鄂温| 色达县| 哈尔滨市| 海兴县| 洛浦县| 图木舒克市| 滦南县| 武宁县| 神池县| 宣汉县| 安达市| 鄂温| 淮北市| 元阳县| 无锡市| 上饶县| 黄龙县| 合山市| 丰原市| 延边| 杭锦旗| 阳谷县| 手机| 靖宇县| 全南县| 龙口市|