- 數據指標體系:構建方法與應用實踐
- 李渝方
- 1854字
- 2025-01-03 16:24:09
Preface 前言
為什么會寫這本書
數據指標體系是數據分析師基于對業務的理解,從BI工具入手將多個相關的數據指標通過一定規則組織起來的、反映業務發展現狀的評價體系。構建數據指標體系是數據分析師日常工作的重要組成部分。厘清各類數據指標之間的聯系以及整合多個數據指標使其變成有聯系的整體,以形成一套可以監控業務的體系,是數據指標體系構建的主要過程。在數據指標體系的構建過程中,掌握BI工具是基礎,依靠對業務的理解提煉數據指標,形成監控體系并分析數據異動原因是數據指標體系為業務賦能的重要體現。因此,構建數據指標體系不僅需要掌握BI工具,更需要理解業務,對數據有較高的敏感度。
市面上大部分與數據指標體系相關的書籍都僅介紹BI工具的使用方法,能夠將數據指標體系構建全流程融為一體的書籍少之又少,于是我萌生了寫一本以數據指標體系構建為主線的數據分析相關書籍的想法。前期我在自媒體上對數據分析文章的分享以及2022年《數據分析之道————用數據思維指導業務實戰》的出版為本書的寫作奠定了堅實的基礎,最終在孫海亮老師的邀請下我開啟了本書的寫作歷程。
本書的讀者定位
本書適合以下幾類人群閱讀:
? 工作1~3年的初級數據分析師。
? 數據分析初學者以及其他行業想要了解數據分析及指標體系構建的數據分析愛好者。
? 數據科學行業的人力專家和獵頭(用于評估候選人的數據分析能力)。
本書的特色
本書以數據指標體系構建為主線,將數據指標規劃、數據指標體系的框架設計、數據采集加工以及數據指標體系的應用等數據指標體系構建全流程融為一體。全書共5篇12章,由淺入深地介紹了一套通用的數據指標體系構建方法論,分享了已在多個行業實踐的數據指標體系構建方法,同時從數據源獲取出發,基于BI工具————Superset手把手教學數據指標體系構建,并結合統計學知識以及Excel、Python等工具分析數據指標異動原因及其對大盤的貢獻度,實現數據指標體系賦能業務。
第一篇是著重介紹數據指標體系的基礎知識,包括數據指標的定義、數據指標的分類、好的數據指標的評價標準以及多個零散的數據指標如何整合成一套完整的數據指標體系。
第二篇著重介紹數據分析師在數據指標規劃階段的工作內容,即根據業務目標進行拆解,抽象出能夠衡量業務現狀的關鍵指標,同時確定指標的統計口徑以構建數據指標字典,包括用戶規模數據指標、用戶行為數據指標、業務數據指標以及數據指標的分析維度。
第三篇著重介紹數據指標體系的框架設計,其中包括一套以“目標化、模塊化、流程化、層級化、維度化”為基礎的數據指標體系構建方法論,以及職場在線教育、電子閱讀工具、圖文內容社區、網約車、社交電商行業數據指標體系實踐方案。
第四篇主要介紹數據采集和加工,包括如何通過數據埋點獲取數據指標體系構建所需的原始數據,以及獲取原始數據后如何通過數據加工清洗完成數據指標開發及數倉模型構建。其中數據指標開發及數據倉庫模型構建階段的大部分工作都由數據倉庫開發工程師完成,數據分析師對這部分內容僅了解即可,因此本篇也只會對相關內容進行概括性的介紹。
第五篇介紹數據指標體系的應用,包括使用BI工具實現數據指標體系的構建,以及數據指標體系如何在實際場景下指導數據異動分析。本篇內容會從BI工具的安裝出發,詳細教學BI工具各個子模塊的使用方法,并通過實際案例完成數據指標體系的構建,同時介紹數據指標體系如何監控業務異動,定位異動原因,以及計算指標異動對大盤的貢獻度。
數據指標體系的構建并不是一蹴而就的,本書會總結數據指標體系構建方法論,同時分享實踐案例以引導讀者完成BI工具的使用和簡單的數據指標體系構建。當然這是遠遠不夠的,掌握構建數據指標體系以及分析數據異動原因最好的方式是在實戰中積累和總結。本書只是拋磚引玉為讀者建立一個系統框架,最終還是需要讀者在自己的工作中進行實踐和積累。
勘誤與支持
由于我的水平有限,書中難免會出現一些錯誤或者不準確的地方,懇請讀者批評指正。讀者可以將發現的錯誤、不準確的描述、代碼bug、文字問題及有疑惑的地方通過郵箱574233829@qq.com或者公眾號“數據萬花筒”反饋給我,我會及時解答。可在微信搜索頁面搜索“數據萬花筒”,或在公眾號搜索頁面搜索“DataArtScope”關注我的公眾號。
致謝
本書是我在長期的工作中總結出來的經驗和方法,所以我首先要感謝從實習到正式工作這幾年陪我一路走來的同事們,沒有他們的指導和付出也就沒有我的成長!
其次,感謝父母,他們給了我生命,給了我受教育的機會,在困難和挫折面前鼓勵我,幫助我,因此才有了今天的我。
當然,也要感謝公眾號的讀者,他們的支持讓我有了持續更新技術文章的動力,也才有了這本書的出版!