官术网_书友最值得收藏!

3.2 數據驅動

介紹完數字化轉型的4個階段之后,我們來看一下數字化轉型的一個主要目標——數據驅動。在一個數字化運營的企業里,所有的運營要素(如零售行業的人、貨、場,物聯網的傳感器、設備)都會有相應的數字化形態,這樣才能支持數字化的決策和數據驅動的產品迭代。不管是一袋橘子、一張健身卡還是一張電影票,這些產品的實體以及消費它們的用戶在網站、移動應用、內部ERP或CRM上都會有一個程序生成的對應對象。在對這些運營的要素進行數字化(也就是上面所說的信息化)之后,我們可以使用數據工具來驅動銷售和提供個性化服務,銷售和生產的流程可以根據數據來實現精細化管理,這樣的系統稱為數據驅動系統。

具體來說,數據驅動系統可根據當前全局數據產生的智能洞察來持續地動態決定最佳產品和管理決策。數據驅動系統是由程序來實現的,而程序=數據+算法,那么可以認為,傳統的信息化系統是使用預定好的算法來處理預定好的數據,而數據驅動系統則是基于智能、個性化、實時、自適應的算法來處理動態、持續變化、用戶輸入、多方聚合的數據,如圖3-2所示。

圖3-2 數據驅動的程序

例如,一個用戶來到一個網站:

·如果每次他看到的都是一樣的內容(如靜態網站),那么這就不是一個數據驅動系統的產品;

·如果他看到的內容隨著時間而改變,但是所有用戶在同一時間看到的內容都是一樣的,那么這也不是一個數據驅動系統的產品;

·如果他看到的是與他自己相關的一些簡單的局部數據(如存款余額),那么這也不能算是一個數據驅動系統的產品。

數據驅動系統的關鍵在于以下3個特點。

(1)持續(Continuous)

數據平臺必須是持續運行的,不斷自動處理最新的數據,產生最新的結果,這也就是常說的從T+1到T+0的需求。在萬物互聯的趨勢下,互聯網會連接越來越多的設備,隨著各種新業務、新模式的出現,會有越來越多的應用出現在互聯網上。同時,會有越來越多的用戶被連接進來,而這些設備、應用和用戶將會時時刻刻不斷產生大量的新數據,這就需要數據平臺能夠持續運行并自動處理所產生的最新數據,而不需要手動處理或者進行大量人工干預。

(2)洞察(Insight)

輸出必須利用數據分析的結果,而不是簡單地羅列或展示數據。數據驅動系統必須具有數據分析和機器學習的能力,能夠從海量的數據中挖掘出對于企業業務有價值的信息,從而支持更加個性化的服務,更好地指導企業進行決策。而這些如果僅僅依靠簡單的數據羅列和展示顯然是不行的。

(3)動態(Dynamic)

所有的輸出必須是根據數據動態生成的(包括批處理和實時處理),而不是固定的規則。因為數據的產生是動態的,所以數據驅動系統的輸出也必須是動態的。就像前文所述,一個網站應該能夠為用戶提供“千人千面”的體驗效果,而這離不開數據平臺的動態數據處理能力。

下面我們以互聯網企業為例來介紹一下數據驅動系統的功能以及它們是如何應用在公司的業務和管理之中的。

3.2.1 面向用戶的數據驅動產品及服務

數據驅動系統的第一個作用是為最終用戶提供數據驅動的產品及服務,其主要特征是個性化、智能化、精準匹配用戶需求。下面是一些例子。

(1)產品推薦

簡單來說,產品推薦就是向用戶推薦產品,比如Twitter推薦的是推文,Facebook推薦的是用戶帖子,Instagram推薦的是熱門圖片。產品推薦是一種用于預測及顯示用戶想要購買的商品的算法系統,它通過分析用戶的上網行為來判定用戶對何種商品會有購買興趣。

近年來推薦系統越來越火,并用于各種不同的領域,如電影、音樂、新聞、圖書等,而其中大多數是用于電商平臺,eBay、亞馬遜、阿里巴巴等都有專門的推薦系統來為用戶推薦產品。在合理的設置下,它不僅可以有效提升利潤、點擊率、轉化率等,還可以為用戶提供更好的體驗,吸引回頭客,這些對于電商是很重要的。

(2)用戶推薦

類似于Facebook、LinkedIn的People You May Know或者Twitter的Who To Follow,用戶推薦是根據用戶的社交圖譜來發現用戶可能的社交聯系,并將其推薦給用戶。用戶建立的連接越多,產品的黏性越強。

(3)內容搜索

所謂內容搜索就是根據用戶需求與一定算法,運用特定策略從互聯網中檢索出指定的內容信息并反饋給用戶的一門檢索技術。內容搜索依托于多種技術,如網絡爬蟲、檢索排序、網頁處理、大數據處理、自然語言處理等,為信息檢索用戶提供快速、高相關性的信息服務。內容搜索的核心模塊一般包括爬蟲、索引、檢索和排序等。

(4)數據指數

積累了大量用戶數據和消費數據的公司都會推出自己的數據指數產品,如騰訊的TBI指數、阿里巴巴的淘寶指數、百度的百度指數、微博的微指數。此類產品主要用來了解趨勢,對判斷一些產品及事件的趨勢很有用。

(5)個性化服務

根據用戶的主動設定,或對各種渠道的數據進行收集、整理和分類后挖掘用戶的需求,主動向用戶提供和推薦相關信息或服務,以滿足其個性化需求。用戶行為分析、用戶畫像、個性化推薦等都可以為精細化運營和戰略決策提供支持。

·基于地理位置的服務:基于GPS的實時地圖服務、云計算、人工智能、機器學習,使得實時匹配海量乘客和車輛成為可能,如Uber、滴滴等智能打車服務。

·基于用戶畫像的服務:基于多維度用戶數據及商品數據,通過畫像標簽系統抽象出用戶的信息全貌,從而進行定向廣告投放、個性化推薦、個性化廣告推送、精準營銷等活動。

·基于實時活動的服務:通過收集在端點和邊緣實時交付的數據,為對延遲敏感的行動提供信息參考,從而為數據消費者提供實時決策,加快業務響應并幫助其改進用戶體驗。

(6)產品線的交叉推廣

交叉推廣(Cross-Promotion)是一種市場推廣策略,一般是指向某一款商品或服務的消費者推薦與該商品或服務相關的另一款商品或服務。例如,我們在一些電子商務網站購物時,常常會看到“你可能會喜歡”或“購買了這款商品的人同時還看了”等信息,這些就是交叉推廣的一種。

3.2.2 面向內部業務部門的數據驅動服務

數據驅動系統的第二個作用是提供可供前端產品共享的內部服務,這實際上就是一般數據中臺的定義中包括的,可以在前端產品中復用的數據能力。但是值得注意的是,類似于產品推薦/用戶推薦的功能在某些場景下也會作為系統服務提供。所以,在前臺產品和中臺功能之間其實并沒有一個明確的界限。如果某個前端功能使用的場景多了,我們一般也會把它提煉出來作為系統服務提供。

(1)用戶畫像

用戶畫像作為一種勾畫目標用戶、聯系用戶訴求與設計方向的有效工具,在各領域均得到了廣泛應用。用戶畫像最初是在電商領域得到應用的,在大數據時代背景下,用戶信息充斥在網絡中,將用戶的每個具體信息抽象成標簽,利用這些標簽將用戶形象具體化,進而為用戶提供有針對性的服務,這就是用戶畫像的作用。一般用戶畫像的結果會以用戶標簽的形式為前端服務,例如年齡、性別、地區、愛好、收入等。

(2)內容情感分析

內容情感分析又被稱作文本情感分析、意見挖掘、傾向性分析。簡單而言,內容情感分析是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。互聯網(如博客、論壇)、社會服務網絡(如大眾點評)上產生了大量用戶對人物、事件、產品等的有價值的評論信息。這些評論信息表達了人們的各種情感色彩和情感傾向性,如喜、怒、哀、樂、批評、贊揚等。基于此,潛在用戶就可以通過瀏覽這些帶有主觀色彩的評論來了解大眾輿論對于某一事件或產品的看法。

(3)內容自動標簽

內容自動標簽又稱內容自動標注,是指將一些非標準化的內容自動打上標準化的標簽。例如,用戶點贊了一個包含貓的圖片,此時如果能夠識別出圖片中有貓,我們就可以自動給圖片打上“貓”的標簽,并且知道這個用戶對“貓”這個主體感興趣,進而對其進行相應的內容推薦或者廣告投放。

(4)知識圖譜

知識圖譜(Knowledge Graph),在圖書情報界稱為知識域可視化或知識領域映射地圖,描述了實體概念之間的聯系和因果。知識圖譜作為一個可共享的數據能力,能讓前端產品對用戶與產品的一些隱藏關系進行推理,提供支持個性化的服務。例如,我們知道體育產品中的跑鞋和可穿戴設備中的心率監控儀都是服務于跑步愛好者的,就可以在用戶購買跑鞋的時候推薦心率監控儀。

(5)趨勢預測

趨勢預測又稱時間序列預測分析法,是根據事物發展的連續性原理,應用數理統計方法或者機器學習的算法分析過去的歷史資料,然后再運用一定的數字模型來預計、推測計劃期產(銷)量或產(銷)額的一種預測方法,例如Uber預測需求,Airbnb預測房價。

(6)活躍用戶統計

雖然這是一項必需的基礎功能,但是在實際工作中,即使只是統計一下活躍用戶也是有不少挑戰的。這個難度主要在于多維度的統計、活躍用戶的定義以及新產品的加入。

(7)用戶增長分析(留存率、漏斗)

用戶增長分析不只是分析用戶數量的增長,用戶的獲客、激活、留存、變現、推薦等都屬于用戶增長探討的范疇。用戶增長是一個由行業、用戶、競品、痛點、產品、渠道、技術、傳播、創意、數據等構成的一體化、系統化的增長體系。用戶增長不是簡單地刷屏,也不單是運營或者市場部門的事情,它是以上各個要素綜合作用的結果。用戶增長分析的主要目的是判斷未來用戶的增長趨勢和增長空間,為增長是否能夠持久提供初步的判斷和依據。

(8)產品性能報告

一個產品上線后我們需要對其性能、用戶體驗、商業收益、用戶反饋進行實時追蹤。最好是產品上線之前就準備好,產品一上線就可以拿到實時的報告。更進一步,這種產品性能報告最好能做成一個通用工具,使業務部門只需簡單配置就能完成一個實時大屏或者性能報告。

(9)反欺詐

反欺詐是對交易詐騙、網絡詐騙、電話詐騙、盜卡、盜號等欺詐行為進行識別的一項服務。在線反欺詐是互聯網金融必不可少的一部分,常見的反欺詐系統有用戶行為風險識別引擎、征信系統、黑名單系統等。

(10)數據即服務/模型即服務

數據在系統之間以服務化/模型化的方式進行交互,而服務通常以API的形式存在。如自動數據服務發布使多源數據可在統一標準下進行管理、復用及監控。數據即服務/模型即服務的主要功能通常包括接口規范、數據網關、API數據鏈路、邏輯模型、API等。

(11)風控服務

金融的核心是風險控制(簡稱風控),互聯網金融也不例外,只是后者更加依賴于數據。大數據風控的核心是數據,阿里巴巴前首席數據官車品覺提出以“聯動”方式讓數據“動”起來,可以形象解釋大數據風控服務的實現方式。如利用IP地址結合上網時間,判斷用戶的家庭地址或公司地址,并根據其所在的地址結合公司發展狀況、職位、所在地房價等數據,判斷此用戶的收入,并對風險進行預測。這樣就可以通過“聯動”數據,指導全面、全流程的風控服務。

3.2.3 數據驅動的系統管理

數據驅動系統的第三種功能一般用于內部管理和決策。它們和內部業務數據服務的區別在于,這里的功能可能不直接與最終產品對接,但卻是公司數據驅動管理方式的另一形態——BI(商業智能)。除了第2章介紹過的商業智能工具、實時產品數據報表等之外,數據驅動系統還支持以下內容。

(1)數據資產管理

對數據進行關聯性分析,透視數據流轉的生命周期,對來自多源異構系統的數據進行統一管理,把數據從成本轉化為資產。數據資產管理可提供多維視角,包括數據被如何使用及使用過程中消耗多少資源、產生了多少價值,數據由誰來維護以及被哪些人訪問等維度的信息。

(2)數據探索

在公司內部進行數據探索,發掘數據價值,并快速實施和驗證各種大數據方案。數據探索為數據科學家或者業務專家提供平臺,使其能根據業務情況,基于實際工作中遇到的問題進行數據采集、處理、分析及展示,從而快速驗證商業問題。

(3)合規

合規涉及數據訪問、數據準確性等問題,如系統內的數據如何以及以何種顆粒度記錄所有數據的操作記錄、應用/程序間的數據訪問權限管理等。安全合規類產品可以應對用戶和數據、應用/程序和數據之間的審計及訪問控制。

(4)異常檢測

用更強的控制感掌握數據的健康狀態,并應用算法基于規則和模型自動發現系統運維中的問題或對風險、異常進行預警及警告。自動異常檢測的強度和滲透力直接關乎數據驅動決策的正確性。

主站蜘蛛池模板: 平潭县| 会理县| 武汉市| 彭泽县| 揭西县| 行唐县| 大洼县| 万年县| 漳平市| 临澧县| 绥阳县| 周至县| 澄城县| 琼结县| 社旗县| 靖江市| 昌平区| 沂南县| 宝清县| 九台市| 中阳县| 平安县| 翼城县| 威宁| 蒙山县| 青岛市| 满洲里市| 阿荣旗| 普格县| 宁蒗| 新绛县| 印江| 八宿县| 探索| 洪湖市| 犍为县| 灵川县| 孟村| 泸州市| 深泽县| 固原市|