官术网_书友最值得收藏!

01 大數據,為什么很多人只會談,不會做

眾說《決戰大數據》

林奕彰 eBay 大中華區CEO

我跟品覺相識多年。在大數據還沒流行以前,他就開始關注這個趨勢,研究數據應用的意義以及怎樣真正讀懂數據和利用數據。這本書深入淺出,把深奧的大數據講得生動有趣,非常好讀;書里面集中了很多品覺個人的真知灼見,非常值得一讀。讀此書是一種享受,正如我享受與品覺的友誼一樣。

人說,大數據就像國王的新衣,每個人都在國王面前說著動聽的話,國王信以為真,其實竟然不知道自己在裸奔。

的確,網絡上有很多人在談大數據,但是他們只會談,不會做,因為他們根本就沒有做過,包括那些所謂的“大數據專家”,他們真的做過嗎?沒有。

事實上,這些人對大數據內在的問題一點兒都不了解,更別說知道大數據的水有多深了。

目前,在大數據方面,無法深入應用的原因在于,從收集到使用的大數據價值鏈出現了問題。從理論上來說,從收到用的螺旋式循環是一個巨大的渦輪,只有先數據化運營,然后才能運營數據。而現在的情況是,用數據的人不知道大數據從哪里來,做數據的人不知道大數據如何使用。用的人不敢用,因為大數據的真實性;做的人不知道怎么用,因為大數據的復雜性。這一問題造成的結果就是,數據量變得越來越大,而且越來越無法有效地使用。

大數據從來不是免費的午餐

大數據從來不是免費的午餐。大數據的來源是多種渠道的,偏倚、隨機的誤差總是存在。

我先問一個數據管理上最現實的問題:“大數據如何備份?”毫不夸張地說,大數據已經這么龐大了,如果再備份一次,你的成本起碼會增加一倍。

做大數據基本上都要從大量地收集數據開始,因為這些數據在未來會大有用處。但是,你是不可能無止境地收集下去的。在這里,你已經看到了一個再清晰不過的偽命題——大數據的確能夠備份,但是成本會增加兩三倍……然而,“以前重要的數據肯定都需要備份啊,”你自然會問,“如果不能備份,我該怎么辦?”而這就是一個大數據管理中必然要遇到的問題。

我再問一個問題,如果你在數據使用方面一直得心應手,整個商業鏈條和數據緊密相關、相輔相成。但是,現在數據鏈忽然斷了,或者不再有效了,你該怎么辦?

你需要注意的是,這一問題說的不是你有沒有使用好數據,而是說曾經你可以得到的數據現在無從獲得了;或者說這些數據不能再在線上收集,只能從線下獲取,成本也就相應升高了;抑或說,這些數據存儲在其他地方,你不能使用了。在諸如此類的情況下,你該怎么辦?

當然,如果你對于數據的使用本來就很生疏,而且也覺得無關緊要,那么數據鏈消失了、斷了、失效了,你也不會有太大煩惱。但假如正是你將數據使用得風生水起的時候,如果出現這樣的問題,那你也就只能束手無策,眼睜睜地看著機會溜走。

大數據從來不是免費的午餐。伴隨著大數據熱潮的到來,關于大數據的一些新問題層出不窮——大數據會夾雜著虛假信息;大數據的數據量很大,但有用的信息不一定多,甚至還會破壞核心信息;大數據的來源是多種渠道的,偏倚、隨機的誤差總是存在。

但是,我們也需要客觀地認識到,大數據現在面臨的這些問題,其實就是把小數據中的一些問題放大了。小數據中難道就沒有噪音會破壞我們的核心信息嗎?當然也有,只不過當大數據把數據量放大和變多的時候,噪音的破壞性也相應增大。小數據中難道就沒有渠道偏倚和隨機的問題嗎?當然也有,但是在大數據的背景下,問題就被更明顯地放大了。

人的斷層

斷層才是大數據所面臨的最嚴重的問題。現在,收集數據的人并不清楚未來使用數據的人要做什么,這是目前大數據的一大關鍵命門。

說了這么多,事實上還沒有觸碰到如今大數據面臨的最大問題:人。

很多人都會問,大數據能帶來什么價值?怎么衡量大數據創造的價值?事實上,最直接的衡量標準就是,在經營上它為你賺了多少錢,帶來了多少實際的利潤提升。

對于這一問題的解決,現在很多人最傾向使用的方法是計算“在用了大數據之后,點擊率提高了多少,轉化率提高了多少”。但是要知道,轉化率和點擊率能提高的數據,可能根本不是投資人或者公司最高管理者對大數據的期望。對于業務人員來說,轉化率能提升5個百分點就已經非常好了,如果將轉化率從2%提高到3%,簡直就是奇跡了,但對于公司最高管理者來說,也許這并不是他想要的大數據。

你需要認識到,斷層才是大數據所面臨的最嚴重的問題。現在,收集數據的人并不清楚未來使用數據的人要做什么,這是目前大數據的一大關鍵命門。

在使用大數據時,我們通常的做法是先把數據收集起來,因為我們知道在未來的某一時刻,這些數據對我們可能有用。不過,“未來可能有用”就注定會引發一個問題——收集數據的人不知道未來使用數據的人要做什么。這時候,如果你再問收集數據的人“如何才能更好地收集數據”,那么,數據的使用就會陷入一個死循環。

事實上,不僅是收集數據的人,就連使用數據建模的人,同樣也不清楚當前的數據是如何獲得的。數據建模是數據使用的關鍵環節,使用數據建模,就是根據以往的經驗,從中尋找到一些潛在的規則,然后把這些規則結合起來去解決問題。

舉個例子來說,我現在身上只有10元錢,我可以用它買一本雜志,也可以用它坐幾次公交車,或者可以用它來買方便面充饑,這三種選擇在一般情況下都是可行的。但是,如果再加上一個“我沒有吃早餐”的場景時,在以上三種可能性中,我選擇去吃方便面的概率自然會比較大。這其實就是一個簡單的模型——輸入“擁有10元錢”和“沒有吃早餐,肚子餓”這兩個場景,輸出“買方便面”這個結論,它幫助我們快速地選擇了一條解決之路。

選擇“吃方便面”的這個場景雖然看上去很簡單,但同樣是一個經驗的總結,這個經驗就是“肚子餓了要吃飯”。把建模這個過程說得更加復雜或者專業一點,就是基于很多以往的經驗,進行總結,或者是對舊有數據使用規則的發現,將經驗和數據相結合,最后輸出一個可以被套用的業務規則。

不過,此時使用數據建模的人并不一定完全清楚數據是如何產生的,這是一個客觀存在的難題。因為就大數據研究來講,我們很多時候使用的都是他人的數據,而他人的數據你又怎么能夠保證會完全清楚地知道呢?

現在,在運用大數據時流行一個例子,比如我在搜索引擎里發現某個地方搜索“感冒藥”的頻率非常高,于是,我就斷定這個地方可能出現了流行性感冒。而這個數據源是從何而來的?我雖然知道很多人搜索了“感冒藥”這一詞語,但是卻完全不知道在搜索引擎里搜索這個詞語的人到底是誰。而提供數據的人既沒有責任要告訴我數據是怎么來的,也不必告訴我數據的質量如何,更不必告訴我數據到底會不會有偏差。這樣的結果推及到大數據領域就是,研究數據的人完全不清楚數據是怎么來的。

模型數據從何而來

創建模型的人也不知道自己所采用的數據在未來是否穩定,而使用模型的人也不知道整個數據的來路或加工過程。

當使用模型的人不知道模型數據從何而來時,其使用模型的角度就要發生改變,具體來說就是視場景而定。比如說,今天你要來杭州的淘寶城,有人告訴你“今天你應該從文一西路過來”。你問原因,他回答說:“因為模型是這樣提供路線的。”他不會跟你解釋,就說模型是這樣的,因為下午2點鐘到4點鐘,從文一西路過來比較快。這個例子就是模型使用的一個場景,選擇文一路則是模型的一個輸出。那么,你要不要走其他的路?走文二路或者文三路?可是,這種選擇的結果就是未知的了。

模型對于很多人來說是一個黑盒子,充滿神秘性和未知性。所以,即便是模型創建者將模型公開,也會因為創建者和使用者專業能力和知識背景的不同,使二者之間出現信息不對稱的情況,使用者自然也就不知道為什么會選用此種解決方法。也就是說,創建模型的人可能不知道此種模型效果好不好,而使用模型的人也不知道該怎么去反饋使用的結果。這樣一來,這種信息不對稱會越來越嚴重。

這一問題恰恰體現了如今大數據實踐中非常嚴重的斷層問題——不只是收集數據的人不知道將來的人怎么使用數據,就連創建模型的人也不知道自己所采用的數據在未來是否穩定,而使用模型的人也不知道整個數據的來路或加工過程,這些都是普遍存在且很現實的問題。

從公司管理層的角度來看,投資人了解數據的意義是什么嗎?高層管理者對數據的期望和中層管理者之間又有什么不同?他們知道數據能幫助企業做什么嗎?這些問題的答案完全會因立場而異。

中層管理者大都不知道數據能幫助他們做什么,他們沒有管理者的視野,相比之下,你只需要告訴他們數據能解決什么問題即可。相反,數據分析師可能就會更加困惑不解:“我做了這么多東西,為什么你們不用?”

每個層級和功能部門都是一個斷層,而且對數據價值的內在衡量都不一樣。所以,當我們講到數據價值時,沒有人能對此給出一個合理的定位,原因就在于有幾個關鍵問題沒有區分清楚。一是要明確這是誰心里的數據價值,投資人、管理者、中層、數據分析師們心中對數據的價值自然不同;二是要明確數據的分類,不同類型的數據所產生的價值各不相同。為什么我們在大數據應用方面存在障礙,一個重要的原因在于,應用人員對于數據價值和數據分類沒有明顯的界定。對于這個話題的探討,我們會在隨后的章節中重點講述。

更主動的管理,更多的創新

這是一個“從用數據到養數據”的過程;這是一個“從數據化運營到運營數據”的過程;這同樣也是一個“從看到真用”的過程。

在當下的大數據環境里,數據其實與商業模式密不可分,每個人都認識到它的經濟價值是巨大的,但今日的大數據發展趨勢之快,對于很多公司來說,變得更加虛無縹緲,難以把控,讓每個人抓狂,讓每個人手足無措。

而在這一方面,阿里巴巴已經對數據化運營做了不少有益的嘗試。從2005年開始,淘寶有了第一個數據分析師,并一直致力于一件事情,那就是用數據來幫助企業運營和解決問題。但在不斷使用數據的同時,也發現了數據本身的問題——大數據需要更主動的管理,也需要更多的創新。

數據化運營就是用數據去解決問題,但是如果我們想把數據做得更好,解決更多新的問題,就需要去做一件以前未曾做過的新事情——運營數據。對于阿里巴巴來說,這件事情是從2011年才有計劃地進行的,企業主動收集數據,并且以此去創造更優質的新數據,讓新數據更好地服務于企業的運營。這是一個“從用數據到養數據”的過程;這是一個“從數據化運營到運營數據”的過程;這同樣也是一個“從看到真用”的過程。

從數據化運營到運營數據是一個循環,今天的電商企業正走到了其中的一個節點上。在經歷了起初大數據的喧囂之后,大家終于感受到,要使大數據產生真正的商業價值,我們要關注的內容并非4個V4個V,是大數據的經典定義,包括海量的數據規模(Volume)、快速的數據流轉和動態的數據體系(Velocity)、多樣的數據類型(Variety)和巨大的數據價值(Value)。——編者注那么簡單,而應該將焦點放在如何真正讓數據落地之上,即從數據化運營到商業管理能力的提升。

數據化思考 問題就是答案

大數據改變了人類學習、工作和生活的方式,更改變了人類的思維方式,而今天我所談及的數據化思考正是在大數據的特色中產生的。

西方式的思考著重于系統性分析,因此對一件事情的理解過程,大都是利用數據來對之進行細分/歸類、對比、溯源,以及從三者的動態趨勢中去找出變化的規律。我們可以從以下幾點中看出:

●P——目的,我們的目的是如何讓自己更“好運”。

●I——定義,我們要定義什么是“好運”,例如可以細分為:財運、健康或者人緣。

●M——量化,如何量化“好運”?請參照前面的定義尋找可量化的目標:工資增長率、體檢中某項指標的高低等。量化了之后,我們可以從趨勢中預判出做什么可以更“好運”。

●A——評估,執行后,評估什么做對了、什么做錯了。

可見,西方式思考中的溯源,就是從事物中找出因果關系,尋找能夠有效地獲得成功的驅動力;而東方式思考中的溯源則是從本質找出根源,例如,“好運”的本質可能在經過分析后會體現為“快樂”,但量化出來的結果卻是“笑”。

然而,不管是東方,還是西方,要溯源,一切答案都得從問題開始。因此,良好的提問技巧能使我們在尋找答案的道路上事半功倍,好問題(Deep Question),可以使我們離答案更近一步。有一位知名CEO曾很得意地問了我老師一個問題:“你覺得到底是eBay的商業模式好,還是Amazon的商業模式好?”其言外之意是,今天Amazon比eBay做得好,是不是也就意味著它的商業模式比較好。我的老師并沒有直接回答這位CEO的問題,而是反問了一個問題:“你的問題也許跟商業模式無關,產生這樣的結果會不會只是因為Amazon的CEO比eBay的CEO做得好呢?”無須多言,問題就是答案。所以,對一件事情的認知,要看你是否具備了用問題解決問題的能力。

2011年的時候,我所在的公司要從數據化運營開始轉向運營數據。當時,我負責支付寶的運營數據工作,卻很是苦惱,毫無頭緒。我沒有任何思路,于是我打電話求助我的老師,咨詢他對于這個問題我應該如何思考。

接下來發生的事情讓我非常難忘,我的老師并沒有直接回答我,而是問了我三個問題。

現在你所在的公司,面對的3大問題是什么?公司未來3個月中,要解決的問題是什么?在過去的1個月中,你做對了什么,做錯了什么?

我現在給你5分鐘時間,如果你說不出來公司目前面臨的3大問題,而你作為商業智能部的負責人,就基本上不該繼續坐在這個位置上了。

當然,我明白這3個問題里面已經包含了答案。當你要做數據化運營或者運營數據的時候,你必須要問自己這些問題。如果你沒有問自己這些問題就去想如何收集數據的話,那肯定會出問題,這是很關鍵的一點。所以,思維方法很重要,在有了數據、有了對商業的理解的前提下,思維方法是不可或缺的關鍵。思考的方法是無窮盡的,就像兩個武林高手過招,假設一方面對的是功夫高手李小龍,作為局外人的我自然無法給出應該如何勝利的建議,而是需要他自己動態地去尋找答案。

尋找答案的過程中,有一個很重要的銜接點。很多時候,我們會受一些固有問題的影響,如果不懂得變通、不懂得如何提煉核心的話,就會產生思考的盲點。如果你的思考出現了盲點,就注定問不出一些非常關鍵的問題,就好比,對方明明是男性,還問他是不是男性,就顯得很沒有價值了。

有時,有些東西并非是你認為的那樣,所以,你才會連問問題都懶得思考,就問出像前面那位CEO的“eBay和Amazon誰的商業模式更好”那樣奇怪的問題。

話說回來,在知道自己的思考有盲點的情況下,即便問題問得不好也并不丟人。但如果自視很高,什么問題都不問,盲點注定會相伴一生。我曾經見識過一位頂級CEO,其厲害之處就是,凡事都說:“我不懂,麻煩你再解釋一下。”

最重要的是思考,盡管你懂,但如果在問問題、看問題的角度上沒有拓寬視野的話,想解決問題依然很難。就好像詠春拳里的“問手”,它并不能用于過招,而是尋找答案的一種方式。你一碰,它就有答案。你不動,它不動,而且它會避開,你只能尋找破綻再出擊。“問題”是用數據來拿數據,而“問手”就是用一個問題引出另一個問題。

在大數據的商業環境里,要既懂數據,又懂商業,還要擁有一套好的思維方法,而數據化思考正是這樣一個嶄新的事物。

當我們想知道問題的答案時,就要首先學會如何問對問題,因為一個好問題會引發出很多答案,這是一門藝術。在我看來,人的思考方式在大數據充斥的商業時代尤為重要。在后面的“數據化思考”中我將談到一些有關思考的例子,以供大家參考。

答案不重要,思考的角度才重要。可見,要習得一套巧妙的數據化思考方式,三分靠想法,七分靠實踐。所以,切勿空談。

主站蜘蛛池模板: 黑河市| 松滋市| 清远市| 西充县| 漳浦县| 德兴市| 米脂县| 太白县| 新密市| 新丰县| 博野县| 迁安市| 侯马市| 上高县| 竹山县| 南平市| 哈尔滨市| 莱州市| 定远县| 建昌县| 牙克石市| 达拉特旗| 永嘉县| 扎兰屯市| 吴堡县| 海宁市| 乌拉特中旗| 怀远县| 额尔古纳市| 平定县| 镇远县| 新化县| 凤阳县| 浦县| 厦门市| 利川市| 弥渡县| 浠水县| 深泽县| 班玛县| 和平区|