官术网_书友最值得收藏!

第1章 數據的“規則”

數據是一種工具。

工具是人類手腦功能的延伸,但人類的優越性還體現在有目的地制造工具和有計劃地使用工具。用一個復雜的工具——汽車來舉例。從準備原料到加工再到出廠,每一步都有明確的目的;而在駕駛汽車的過程中,又有一套完整的操作規范。如果違反這套規范,輕則達不到目的地,重則車毀人亡。

與其他工具一樣,數據也有自己的“玩法”。如何產生數據、搜集數據、應用數據,才能達到預期的目標?在這些過程中應該注重哪些邏輯性和規律性?這些正是人們在使用數據這個工具的過程中需要不斷探究和摸索的。

在這一章,我們將討論數據自身具有哪些特性,以及在與數據打交道的時候,需要注意哪些事情。

1.1 數據的應用是一個“拼圖游戲”

每種工具都是為了解決一類問題而存在的,數據應用也不例外。而每一類問題,都有自己的特點和最適合的解決思路。找到最適合的思路,才能最高效地解決問題。因此,在我們討論數據應用的具體方法之前,先來了解一下數據應用究竟是一類什么樣的問題。

隨著互聯網產品的同質化現象日趨嚴重、市場競爭愈演愈烈,對產品進行精準分析的需求也越來越強烈,對數據應用水平的要求也越來越高。不管是時下熱門的大數據技術,還是基于大數據進行的精準推薦、精準營銷等方法,都在圍繞數據應用的問題不斷深挖下去。但數據的應用并不像聽上去那么簡單易行。當我們身處其中,需要具體地去設計和執行每一個細節的時候,它的另一面就展現出來了——數據應用是一個嚴謹的、復雜的,甚至有時是讓人摸不著頭腦的工作。它要求相關人員既有對相關業務宏觀和微觀的理解,又要具備良好的數學計算、抽象思維等基本能力。

打開這本書,相信你多少接觸到了一些數據應用方面的工作。你可以試著回想一下,最開始自己是如何走上數據道路的呢?情況很有可能是,有一些很具體的業務問題擺在你的面前,等著你給出解決辦法。比如:

?產品上線初期,亟待獲得市場的反饋,并通過得到的數據驗證最初產品的構想,為產品下一步發展找到具體的方向。

?產品發展到一定階段開始遇到瓶頸,增長曲線趨于平緩,需要通過收集產品的數據,找到下一個突破口。

?一直運轉良好的業務,某天突然出現下滑或者激增,不知道問題出在哪里。

……

不難看出,這些問題有相似之處:

第一,每個問題的背后都有一個提前設定的“理想狀態”,在考慮現實情況的時候,這個“理想狀態”就被作為對比的基準。如果現狀不夠令人滿意的話,這個“理想狀態”又變成了下一步工作的目標。

在產品上線之前,我們對于產品上線后的狀態、未來的發展及市場對業務可能做出的反應都有所預期,甚至已經做了大量的前置研究,并通過各種可能的方式提早進行驗證。但不管前期準備多么充分,產品上線之后才是真正“用事實說話”的時候。我們需要通過市場真實反饋的數據,將現實狀態與理想狀態進行對比,進而思考下一步的工作。

在產品的發展趨于平緩的情況下,產品當前的發展速度要明顯低于預想的發展速度。在現實的工作場景中,未必像示例中的情況這么極端。只要我們能夠及時、準確、全面地獲得想要的數據,那么當現實情況與理想情況稍有偏差時,團隊會快速設計出優化方案,以應對這種“反常情況”。

當業績突然出現下滑的時候更是如此。如果發現最新的數據明顯不如日常的平均水平,必定會“驚動”整個團隊,此時需要立即抓住這個時間點的數據進行深入分析。很多時候,這類工作都等不到第二天天亮就已經開始了。

第二,如果現在的狀況偏離了工作的目標,我們就會進行一次次的優化嘗試,直到達到設定的目標為止。

如果產品上線之后,發現市場的反饋并不如預想的好,那么我們就會開始嘗試調整產品自身的形態、業務模式,或者調整產品觸達用戶的方式,再或者嘗試其他非產品化的運營方式,如通過各種形式教育用戶、教育市場等。每一次的嘗試,都會對產品自身及產品所處的市場環境產生不確定的短期影響和長期影響。我們只能根據獲得的最新數據來考慮下一步應該做什么。

在產品發展平緩的時候同樣如此。我們會把收集到的歷史數據拼接起來,再按照不同的分析角度詳細拆解,如按照不同的用戶群、不同的流程階段、不同的渠道等。然后根據拆分之后的產品模塊,找出哪個部分實現預期目標的可能性最大、成本最低、長遠影響最佳。

例如,隨著Growth Hacking(常翻譯為“增長黑客”)理念而一同大熱的分析模型——“AARRR模型”,便是采用了這種拆解之后逐個擊破的辦法。模型把用戶在產品上不斷演變的過程拆分開,逐個檢查其是否存在優化的空間。這種思路與企業管理領域中由以色列物理學家高德拉特(Eliyahu M. Goldratt)博士創立的TOC(Theory Of Constraint,中文譯為“瓶頸理論”“制約理論”或“約束理論”)理論不謀而合。

產品業績下滑的情況與前兩種類似,不再贅述。

第三,不僅每一次的嘗試會對產品產生影響,而且經過了一次次的嘗試之后,每一次嘗試之間也會相互影響。因為每一次嘗試優化之后,產品和環境都發生了變化。因此,下一次嘗試與前一次嘗試的目標和方向多少會有些差別。

比如,在產品上線之后,發現市場反饋與預期不一致。假設此時我們有三種備選方案:調整產品形態、調整業務模式及非產品化運營。為了簡化說明,我們將這三種方案簡稱為A、B、C方案。那么,不管我們使用哪種方案,三種方案面臨的狀況與想要達到的目標都是基本相同的。但是,如果我們首先選擇了A方案,并且最終發現效果并不理想,那么此時,對于B方案和C方案來說,產品和市場都已經發生了一些變化,必須針對新的產品狀況和市場環境重新調整,形成B+方案和C+方案,然后繼續。其他兩類問題也是如此。這就是數據應用中體現出的“觀察者效應”——隨著我們研究問題并進行各種方案的嘗試,我們也在改變著這個問題本身。

說了這么多拗口的話,不如我們用一個拼圖游戲來類比這個過程。

在玩拼圖的時候,最終預期結果是十分明確的,我們可以從拼圖的盒子上看到我們想要拼出的完整圖案的樣子。更重要的是,這幅圖案在整個游戲的過程中都是不會改變的。因此,在整個游戲過程中,這幅圖案就像大海上的燈塔一樣,我們可以根據這幅圖案來判斷每一片拼圖在整個圖案中的位置。隨著游戲的進行,整幅圖案被清晰地分成兩部分:已經拼好的部分和空缺的部分。而且更重要的是,已經拼好的部分會隨著游戲的進行而不斷改變。如圖1-1所示,假設A部分是已經拼好的部分,而B部分是沒有拼好的部分。可見,雖然最終的目標都是相同的,但圖1-1中的四種情況各有各的具體問題要處理。在拼圖中,針對一片拼圖應該放在什么位置,完整的圖案能提供的幫助非常有限,必須依據已經拼好的部分來決定。

圖1-1 拼圖中的具體問題

這個狀況就與前面所說的數據應用中的狀況非常相似了:每一次的產品調整方案都會受到上一次方案實施的影響。最終目標對方案細節的幫助比較有限。這些細節的調整,依賴于此時此刻具體的產品狀態和環境。甚至,就像“一片關鍵拼圖的出現,導致更多片拼圖需要調整自己的位置”一樣,一個關鍵的分析結論或新獲取到的數據也可能撼動之前所有的思路和方向。比如產品的目標用戶群設定為三十歲左右的用戶,結果上線之后突然增加了許多不到二十歲的用戶。再比如,團隊此前對銷量的影響因素已經有了比較一致的認知,但是獲取的最新數據表明,之前的認知荒謬得可笑。

這也就是數據應用問題復雜的地方。數據應用是一個復雜的過程,而不是公式化的過程。我們不大可能使用一套固定的、預先定義好的指標來評價任何情況(如一個全新設計的運營活動)。這聽上去就很不靠譜,但這樣做的團隊并不少見——同一套分析模板,應用到各種各樣的場景中。當我們接到一項數據分析任務的時候,就會去找那些耳熟能詳的分析指標(如研究頁面流量的PV/UV指標、研究用戶轉化時的漏斗模型等),然后把數據導入計算公式,計算出結果。之后,再把這些計算結果繪制成統計圖,配上文字說明。分析過程就這樣簡單粗暴地結束了。至于這些指標與數據分析的最終目的之間存在著怎樣的關系,似乎無人深究。

那些經典的指標固然重要,但它們不應成為我們做數據分析和應用的阻礙和界限。僅經典指標提供給我們的有限信息是遠遠不夠的,因為它們只能解決固定的、有限的、通用的幾個淺層次的問題,比如瀏覽頁面的人是多還是少,哪些內容的訪問人數更多,用戶的轉化程度是高還是低等,但是不會“自解釋”為什么會這樣。因此,對于諸如“為什么”這樣深層的、復雜的問題,獲得幾個指標之后,必定還有大量復雜的人工過程。

現在我們放松一下,從結束這一節的內容。蓋住后邊的內容,你能快速想出拼圖游戲的“規則”是什么嗎?試試看!這對梳理數據應用的思路很有幫助。

下面來看看我總結的一些規則:

第一,與空缺位置的形狀相符,才能放上去。(這才是有效的解決方案啊!)

第二,必須把拼圖拼在一起,并得到了完整、正確的圖案,游戲才算結束。(是公司上市?還是哪個“小目標”?)

第三,相鄰兩片拼圖的圖案應該能夠相互連接,并且能夠與完整圖案上相應位置的圖案對應。(既要符合現狀,也要對最終的目標有幫助,這才是好方案。)

第四,不能把任何一片拼圖放在整幅圖案之外。(提出的方案與問題無關且浪費資源,你要小心了!)

主站蜘蛛池模板: 台东县| 新乐市| 上蔡县| 龙泉市| 安图县| 台东县| 新营市| 大丰市| 滁州市| 嘉义县| 历史| 辛集市| 敖汉旗| 德安县| 蒙阴县| 陆良县| 九江县| 思茅市| 泸西县| 开原市| 宁安市| 长泰县| 沾化县| 宁南县| 大邑县| 桂平市| 甘德县| 鄱阳县| 汶川县| 怀来县| 鸡东县| 尼木县| 扎赉特旗| 星座| 清流县| 隆林| 菏泽市| 蒙山县| 桃源县| 青海省| 吴堡县|