- 一本書玩轉(zhuǎn)數(shù)據(jù)分析(雙色圖解版)
- 海天電商金融研究中心編著
- 2938字
- 2021-03-26 18:52:57
2.1 操作步驟
數(shù)據(jù)分析師只有掌握好數(shù)據(jù)分析操作的步驟,才能在進行數(shù)據(jù)分析的過程中,盡量降低失誤率,將分析結(jié)論價值最大化。
2.1.1 清晰——分析目的
在生活中,人們都是有目的地去做某件事,如人們?nèi)タ措娪啊独吓趦骸罚陀锌赡苁菐е康娜ビ^影的,如圖2-1所示。

圖2-1 一部分觀影人群看《老炮兒》的目的
總之,人們帶著目的去做某件事,是世間常態(tài)。由此,數(shù)據(jù)分析師在進行數(shù)據(jù)分析工作時,更需要帶著一個清晰的目的進行數(shù)據(jù)分析操作,只有這樣才不會偏離方向,才能為企業(yè)決策者提供正確的、有意義的指導(dǎo)意見,這是確保數(shù)據(jù)分析過程有效進行的先決條件,并能為數(shù)據(jù)的采集、處理、分析提供清晰的指引方向。
2.1.2 獲取——數(shù)據(jù)來源
數(shù)據(jù)并不會憑空出現(xiàn)在數(shù)據(jù)分析師的面前,而是需要去挖掘、收集的。因此,數(shù)據(jù)分析師需要充分了解數(shù)據(jù)獲取來源,這樣才能確保在數(shù)據(jù)分析的過程中,能快速獲取正確的、實用的數(shù)據(jù)。
數(shù)據(jù)獲取渠道大體上可以分為兩類,如圖2-2所示。

圖2-2 大體上的數(shù)據(jù)獲取渠道
數(shù)據(jù)獲取渠道可細分為5類,如表2-1所示。
表2-1 細分的數(shù)據(jù)獲取渠道

專家提醒
其實很多企業(yè),存在“隱藏”數(shù)據(jù),很多數(shù)據(jù)都沒有被運用起來,對企業(yè)來說這是一種損失,對企業(yè)運營情況分析有一定的影響。由此,數(shù)據(jù)分析師需要全方位地了解自己所在企業(yè)的所有情況,閑暇時多研究企業(yè)的有關(guān)數(shù)據(jù),說不定能將那些“隱藏數(shù)據(jù)”公之于眾,成為數(shù)據(jù)分析師的好“伙伴”。
下面以用站長工具采集騰訊網(wǎng)的Alexa排名為例,進一步了解數(shù)據(jù)采集工作,其操作如圖2-3~圖2-7所示。
(1)打開站長工具的頁面,單擊“Alexa排名”按鈕,如圖2-3所示。

圖2-3 單擊“Alexa排名”按鈕
(2)進入Alexa排名,將騰訊網(wǎng)址輸入搜索欄中,并單擊“查詢”按鈕,如圖2-4所示。

圖2-4 單擊“查詢”按鈕
專家提醒
通過Alexa排名,企業(yè)能看到自己的網(wǎng)站在全球和中國的排名、被訪問比例和人均頁面瀏覽量、網(wǎng)站日平均Alexa排名走勢圖,其可以作為評價某一網(wǎng)站訪問量的指標。
(3)得到Alexa排名,如圖2-5所示。

圖2-5 騰訊網(wǎng)的Alexa排名
從圖2-5中可以看到,騰訊網(wǎng)在全球排名第8位,在中國排名第2位,其訪問速度為1264Ms/63分(頁面平均訪問速度載入時間是1264毫秒,比63%的網(wǎng)站訪問速度快)。通過這些數(shù)據(jù),可以分析出騰訊網(wǎng)在國內(nèi)屬于一個不錯的網(wǎng)站,在全球范圍內(nèi)排名也比較靠前,其訪問速度比較快,但還有往上提升的空間。
(4)還能得到騰訊網(wǎng)的日平均排名走勢圖,如圖2-6所示。

圖2-6 騰訊網(wǎng)的日平均排名走勢圖
(5)還能得到騰訊網(wǎng)每百萬人中日平均訪問人數(shù)走勢圖,如圖2-7所示。

圖2-7 每百萬人中日平均訪問人數(shù)走勢圖
通過以上的數(shù)據(jù),數(shù)據(jù)分析師能大致了解騰訊網(wǎng)的排名,能對網(wǎng)站分析工作起到一定的影響。
2.1.3 挑選——數(shù)據(jù)加工
數(shù)據(jù)加工是數(shù)據(jù)分析的前提。數(shù)據(jù)分析師在沒有進行數(shù)據(jù)分析操作之前,就需要將毫無順序、沒有邏輯關(guān)系的數(shù)據(jù),進行加工處理,并進一步將數(shù)據(jù)分組、組織等,以充分降低數(shù)據(jù)分析的復(fù)雜性,如圖2-8所示。

圖2-8 數(shù)據(jù)加工
專家提醒
一般需要進行加工的數(shù)據(jù),都具有以下幾個特點。
● 數(shù)量大。
● 碎片化。
● 難以理解。
2.1.4 進行——數(shù)據(jù)分析
數(shù)據(jù)分析是所有步驟中的重中之重,它能影響企業(yè)管理者的決策,能將數(shù)據(jù)最核心的價值體現(xiàn)出來。由此,數(shù)據(jù)分析師一定要牢牢掌握數(shù)據(jù)分析方面的知識。
一般企業(yè)都會把數(shù)據(jù)分析方式劃分為3種,如圖2-9所示。

圖2-9 數(shù)據(jù)分析的3種方式
數(shù)據(jù)分析師在進行數(shù)據(jù)分析時,需要在腦海中注入以下4種思維方式,才能更好地挖掘出數(shù)據(jù)背后的價值,如圖2-10所示。

圖2-10 數(shù)據(jù)分析的4種思維
專家提醒
數(shù)據(jù)分析師在進行數(shù)據(jù)分析時,需要注意以下幾個事項,才能保證評估分析過程和結(jié)果的有效性。
● 分析數(shù)據(jù)是否完整、有效、真實。
● 數(shù)據(jù)分析目的是否明確。
● 是否能有效實行數(shù)據(jù)分析結(jié)論。
2.1.5 實現(xiàn)——數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是一種高級的數(shù)據(jù)分析方法,如圖2-11所示。

圖2-11 數(shù)據(jù)挖掘的概念
若需要細化數(shù)據(jù)挖掘的步驟,可分為11步,如圖2-12所示。

圖2-12 數(shù)據(jù)挖掘的細分步驟
2.1.6 展示——數(shù)據(jù)體現(xiàn)
數(shù)據(jù)的形態(tài)非常的枯燥乏味,因此,數(shù)據(jù)分析師還需要將數(shù)據(jù)變得有趣、美觀,這樣可讀性會大大地增強。若將整理好的數(shù)據(jù)變成一張張色彩多端的圖,既便于管理者閱讀,又能快速理解數(shù)據(jù)背后的“故事”。
一般來說,常用的展現(xiàn)形式為柱形圖、折線圖、矩陣圖、雷達圖、條形圖、漏斗圖、SmartArt圖、餅圖等,如圖2-13所示。

圖2-13 數(shù)據(jù)常用的展現(xiàn)形式

圖2-13 數(shù)據(jù)常用的展現(xiàn)形式(續(xù))
2.1.7 制作——數(shù)據(jù)報告
制作數(shù)據(jù)報告是數(shù)據(jù)分析的最后一個步驟,是對之前所進行的工作做出的展現(xiàn)和總結(jié),更是實現(xiàn)數(shù)據(jù)價值的一個橋梁。
若數(shù)據(jù)報告有一個明確的主題,圖文并茂地闡述數(shù)據(jù)現(xiàn)象,條理清晰地展現(xiàn)出有價值的結(jié)論,能讓企業(yè)管理者快速、輕松地了解報告中的核心內(nèi)容,那么這份數(shù)據(jù)報告乃至整個數(shù)據(jù)分析操作就都是成功的。由此可見,數(shù)據(jù)報告在企業(yè)管理者的心理位置是比較重要的。
專家提醒
數(shù)據(jù)分析報告是通過全方位的科學(xué)分析,評估數(shù)據(jù)分析目的是否達到的一種表現(xiàn)方式,也是一種讓企業(yè)管理者認識企業(yè)業(yè)務(wù)發(fā)展趨勢、掌握信息、收集相關(guān)信息、解決相關(guān)問題的一種分析應(yīng)用載體。
一般來說,數(shù)據(jù)報告分為3個部分,如圖2-14所示。

圖2-14 數(shù)據(jù)報告的3個部分
專家提醒
大體上,數(shù)據(jù)分析報告均采用“總分總”的形式,并且數(shù)據(jù)分析報告必須要具有邏輯性,例如,從數(shù)據(jù)分析現(xiàn)象到總結(jié)問題出現(xiàn)的原因再到解決問題的結(jié)論,這樣淺顯易懂的邏輯關(guān)系,實質(zhì)上是在增加數(shù)據(jù)分析的可讀性。
一份優(yōu)秀的數(shù)據(jù)分析報告,一定要有一個明確的框架。好的框架能將數(shù)據(jù)背后的“故事”,有層次地進行展示,能讓閱讀者一目了然地了解數(shù)據(jù)報告的大概構(gòu)架以及核心內(nèi)容。
下面進一步了解優(yōu)秀的數(shù)據(jù)分析報告的幾大要素,如圖2-15所示。

圖2-15 數(shù)據(jù)分析報告應(yīng)有的要素
在撰寫數(shù)據(jù)分析報告時,還需要牢記4大原則,如圖2-16所示。

圖2-16 撰寫數(shù)據(jù)分析報告的4大原則
下面以分析企業(yè)銷售為例,進一步了解數(shù)據(jù)分析報告的撰寫方法。
(1)標題頁上的標題,需要有命中數(shù)據(jù)分析目的的效果,并且頁面可以做得精美一些,這樣從一開始就能勾起閱讀者的興趣,如圖2-17所示。

圖2-17 標題頁
專家提醒
標題頁的標題應(yīng)具有較強的概括性,可以用簡潔、準確的語言表達出數(shù)據(jù)分析報告的核心分析方向,還可以開門見山的方式直接將報告中的基本關(guān)系展現(xiàn)出來,從而加快閱讀者對報告內(nèi)容的了解。數(shù)據(jù)分析報告中的標題大體上能分為4種。
● 交代分析主題,展現(xiàn)出時間等客觀現(xiàn)象,如“2016年開拓企業(yè)業(yè)務(wù)”;
● 以提問的形式,展現(xiàn)出分析主題,如“產(chǎn)品被誰買走了?”;
● 體現(xiàn)中心內(nèi)容,如“企業(yè)今年總銷量增長了15%”;
● 直接展示觀點,如“企業(yè)需要開發(fā)新產(chǎn)品”。
(2)目錄頁要體現(xiàn)出報告的分析思路,因此目錄需要做得簡潔一點,這樣才便于閱讀,如圖2-18所示。

圖2-18 目錄頁
(3)前言頁一般包括數(shù)據(jù)分析的背景、目的、思路、結(jié)論等內(nèi)容,如圖2-19所示。

圖2-19 前言頁
(4)正文部分以圖文并茂的方式,將數(shù)據(jù)分析資料以及結(jié)論體現(xiàn)出來,如圖2-20所示。

圖2-20 正文部分
專家提醒
數(shù)據(jù)分析報告不僅需要美觀,而且還需要統(tǒng)一,不要加入太多的樣式,不然會給人留下不嚴謹?shù)母杏X。
(5)總結(jié)報告要具有實用價值的結(jié)論,其措辭須嚴謹、準確,如圖2-21所示。

圖2-21 結(jié)論與建議
(6)在附錄中補充應(yīng)用的分析方法、展現(xiàn)圖形、專業(yè)術(shù)語等內(nèi)容,幫助閱讀者更好地理解數(shù)據(jù)報告中的內(nèi)容,如圖2-22所示。

圖2-22 附錄
專家提醒
在數(shù)據(jù)分析報告中,附錄并不是必備的,數(shù)據(jù)分析師需要根據(jù)需求進行撰寫,根據(jù)具體問題進行安排,不要硬套案例。
- 大數(shù)據(jù)技術(shù)與應(yīng)用基礎(chǔ)
- Machine Learning for Cybersecurity Cookbook
- 大數(shù)據(jù)時代的數(shù)據(jù)挖掘
- 人工智能趣味入門:光環(huán)板程序設(shè)計
- Visual Basic.NET程序設(shè)計
- Applied Data Visualization with R and ggplot2
- R Data Analysis Projects
- Microsoft Dynamics CRM 2013 Marketing Automation
- RealFlow流體制作經(jīng)典實例解析
- C#編程兵書
- Effective Business Intelligence with QuickSight
- 分布式Java應(yīng)用
- 歐姆龍PLC應(yīng)用系統(tǒng)設(shè)計實例精解
- Learn T-SQL Querying
- Hands-On Data Analysis with Scala