官术网_书友最值得收藏!

1.1.2 數據產品組成

一個完整的數據產品通常由采集清洗、計算管理、分析展示和挖掘應用四個部分組成。

(1)采集清洗

采集指的是產品通過各種技術手段,將現實世界的信息線上化之后,再傳輸到企業的服務器和數據庫中。根據采集源頭的不同,可以分為日志信息采集和業務庫表采集兩種。前者主要是從各種聯網設備中采集,有App日志、服務器日志和智能設備日志等;后者一般從企業的業務數據庫中獲取,如電商企業中用戶的下單數據、支付數據等。為了準確采集這些內容,我們會構建一套埋點系統來進行規范和管理(具體參見第4章)。由于采集的信息一般會存在數據缺失或冗余、數據錯報等情況,因此不能直接使用,需要一個預定義的清洗流程進行整理和優化。

(2)計算管理

從嚴格意義上說,這些經過初步采集和清洗得到的信號尚不能稱為“數據”,因為此時人們并不能根據這些信號擴大自己對客觀世界的認知。這就仿佛川流不息的車輛在你面前呼嘯而過,但你卻不知道這意味著什么。這些信號,只有根據不同的業務場景和需求匯總計算之后,才能稱為“數據”。此時,你便可以知道,在剛才過去的10秒里你面前駛過了25輛車,和昨天同段時間對比略微偏高,因為今天是周五,大家下班早。

數據分為度量、指標和維度,它們隨著業務的進展會逐漸膨脹,變得十分復雜。我們可以構建一套元數據管理系統來更好地管理這些數據(詳見第8章)。

(3)分析展示

存放起來的這些數據,就像樂高積木一樣,需要經過合適的分析思維和展示方案進行組裝,才能變成漂亮的模型,發揮相應的數據價值。合適的分析模型可以大幅降低用戶使用數據的門檻,更好地獲取數據背后的洞察,如漏斗分析模型和留存分析等。同時,這些分析思維需要搭配一定的可視化工具才能更好地傳達。

(4)挖掘應用

除了分析展示外,數據的價值還體現在與業務結合的挖掘和應用上。通用的業務場景有搜索、推薦、排序和風控四種,數據通過構建合適的策略和模型來提高這些場景的業務效率,如用戶畫像、反作弊模型、推薦展示策略等(第11章系統介紹了用戶畫像)。同時,也有基于某些特定業務場景的數據應用,如針對銷售推廣人員的數字化績效系統和針對客戶留存喚醒的精細化用戶運營系統等。

主站蜘蛛池模板: 手游| 三门县| 锡林郭勒盟| 邵阳县| 平利县| 山东| 瑞昌市| 洱源县| 格尔木市| 明溪县| 惠水县| 新巴尔虎左旗| 开封县| 正阳县| 应城市| 府谷县| 武功县| 潞西市| 永丰县| 绥芬河市| 上林县| 遂平县| 光泽县| 青田县| 介休市| 湛江市| 禹城市| 文安县| 海口市| 依兰县| 南康市| 石泉县| 丰城市| 灵山县| 高邮市| 巢湖市| 合作市| 芜湖市| 台湾省| 泗阳县| 云霄县|