官术网_书友最值得收藏!

1.3 數(shù)據(jù)分析師的能力要求

因為在數(shù)據(jù)化運(yùn)營中,數(shù)據(jù)分析師要深入業(yè)務(wù)背景,傾聽和發(fā)現(xiàn)業(yè)務(wù)需求,走到業(yè)務(wù)第一線,與業(yè)務(wù)團(tuán)隊并肩作戰(zhàn),所以要求數(shù)據(jù)分析師具備很強(qiáng)的組織協(xié)調(diào)能力,具有項目大局觀,懂得在不同階段調(diào)用不同的資源。從這點(diǎn)來看,業(yè)務(wù)理解力和溝通能力的重要性甚至要超過技術(shù)層面的能力(數(shù)據(jù)處理能力、數(shù)據(jù)統(tǒng)計分析能力、數(shù)據(jù)挖掘能力、數(shù)據(jù)應(yīng)用能力)。圖1-2是游戲數(shù)據(jù)分析師需要具備的關(guān)鍵能力。

圖1-2 數(shù)據(jù)分析師關(guān)鍵能力示意圖

首先數(shù)據(jù)分析師要具備組織能力。這體現(xiàn)在項目前期調(diào)研、方案制定、項目開發(fā)和項目落地的職責(zé)和能力要求。

?調(diào)研:深入業(yè)務(wù)背景,發(fā)現(xiàn)、傾聽業(yè)務(wù)需求。

?方案:通過前期調(diào)研,有效判別分析需求價值,根據(jù)需求能有效提供分析解決方案。

?開發(fā):針對制定的解決方案,能通過技術(shù)手段進(jìn)行項目開發(fā)。

?落地:將開發(fā)成果結(jié)合業(yè)務(wù)場景進(jìn)行落地,并持續(xù)跟蹤落地應(yīng)用效果,修正或優(yōu)化方案和模型。

數(shù)據(jù)處理能力、數(shù)據(jù)挖掘能力和數(shù)據(jù)應(yīng)用能力這三大塊能力需要數(shù)據(jù)分析師通過時間、項目經(jīng)驗去磨礪,不斷成長,懂得何時運(yùn)用哪種數(shù)據(jù)挖掘技術(shù)解決相應(yīng)的問題。

1.3.1 數(shù)據(jù)處理能力

剛剛收集上來的raw data(原始數(shù)據(jù))一般存在臟數(shù)據(jù),不能達(dá)到直接建模的要求。我們不能直接利用raw data進(jìn)行數(shù)據(jù)分析建模,所謂“垃圾進(jìn)垃圾出”,這樣得到的分析結(jié)果也不一定是可靠的。對于raw data,我們需要評估數(shù)據(jù)質(zhì)量,清洗臟數(shù)據(jù),通常包括缺失值和異常值的處理,使之達(dá)到數(shù)據(jù)分析的需求。假如現(xiàn)在有一份30萬的用戶調(diào)研數(shù)據(jù),由于某些玩家不愿意填寫自己的性別、收入等,導(dǎo)致這些變量存在數(shù)據(jù)缺失的情況。現(xiàn)在利用數(shù)據(jù)分析技術(shù)對缺失值模式進(jìn)行可視化探索,如圖1-3所示。

由圖1-3可知,有2萬位玩家沒有填寫性別信息,其中有609位玩家同時缺失性別、年齡信息,31位玩家同時缺失性別、年齡和收入的信息。掌握了數(shù)據(jù)缺失模式后,就知道應(yīng)該運(yùn)用何種技術(shù)處理這些缺失值。

圖1-3 對數(shù)據(jù)調(diào)研數(shù)據(jù)進(jìn)行缺失值可視化

針對異常值數(shù)據(jù),我們同樣希望能通過科學(xué)的方式甄別異常值并處理。例如,可以利用箱線圖發(fā)現(xiàn)異常值,并在圖上打印出異常值的樣本號和數(shù)值,直觀地對異常值進(jìn)行可視化展示。比如現(xiàn)在有某個月日新增用戶在第30日留存率的數(shù)據(jù),通過普通曲線圖很難發(fā)現(xiàn)是否有某些天的新增在第30日留存存在異常情況。此時可以借助箱線圖的方式甄別異常值,如圖1-4所示。

圖1-4 利用箱線圖甄別異常值

由圖1-4可知,這個月有三天的新增用戶在第30日留存率低于正常水平,分別是5日、6日和9日。

進(jìn)行數(shù)據(jù)清洗后,有時候還需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)整合轉(zhuǎn)換,使之符合建模前的數(shù)據(jù)需求,常用的一種方式是添加衍生變量。所謂衍生變量,其實就是指數(shù)據(jù)分析師在分析(建模)過程中人為增添的一些新變量,這些新變量產(chǎn)生之后,可以明顯提升模型的效果,或者可以有效提煉出有價值的分析結(jié)論。

1.3.2 數(shù)據(jù)挖掘能力

數(shù)據(jù)分析師在建模的過程中,需要根據(jù)業(yè)務(wù)需求和數(shù)據(jù)特點(diǎn)選擇合適的算法,利用專業(yè)的數(shù)據(jù)挖掘工具進(jìn)行建模,并評估模型效果。比如在面對用戶分析的需求時,可分別分析玩家點(diǎn)擊行為的路徑和玩家購買的道具,根據(jù)不同的方向和目標(biāo)選擇不同的算法和工具。

如圖1-5所示,在研究玩家的點(diǎn)擊行為時,如果是單路徑情況,可以使用漏斗圖查看每一步的轉(zhuǎn)化情況;如果是多路徑的點(diǎn)擊情況,可以使用sunburst事件路徑圖快速定位用戶的主要點(diǎn)擊路徑,也可以利用社會網(wǎng)絡(luò)圖對玩家間的點(diǎn)擊事件關(guān)系進(jìn)行可視化。

圖1-5 分析玩家點(diǎn)擊行為路徑

在研究玩家的購買行為時,可以利用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)購買物品之間的關(guān)系,如圖1-6所示。

圖1-6 關(guān)聯(lián)規(guī)則關(guān)聯(lián)圖形

1.3.3 數(shù)據(jù)應(yīng)用能力

由于業(yè)務(wù)團(tuán)隊的數(shù)據(jù)分析意識和能力不如專業(yè)的數(shù)據(jù)分析師,他們大多不懂解讀模型結(jié)果。此時需要數(shù)據(jù)分析師將模型得到的知識用樸素的業(yè)務(wù)語言表達(dá)出來,從而利用分析結(jié)果指導(dǎo)運(yùn)營和營銷活動。以圖1-6為例,業(yè)務(wù)團(tuán)隊一般看不懂這個圖傳遞的信息,需要幫他們解讀。比如圓圈越大表示兩者的關(guān)聯(lián)關(guān)系越強(qiáng),很多玩家都購買過超級大禮包和新手禮包這兩個道具,在做運(yùn)營活動時,可以將這兩個禮包進(jìn)行捆綁銷售,提高另外一個道具的銷量。

主站蜘蛛池模板: 湟源县| 商洛市| 云浮市| 赣州市| 彝良县| 布尔津县| 宣化县| 讷河市| 云龙县| 维西| 无极县| 育儿| 台东市| 华坪县| 左贡县| 隆昌县| 南召县| 亳州市| 建湖县| 连云港市| 鹤岗市| 北川| 札达县| 蒙自县| 阳朔县| 芜湖县| 龙陵县| 永定县| 宁陕县| 锡林郭勒盟| 女性| 安陆市| 牙克石市| 祁东县| 定结县| 外汇| 文成县| 仁寿县| 上犹县| 宁阳县| 苍溪县|