- Power BI零售數據分析實戰
- 鄭志剛
- 2383字
- 2023-06-29 17:36:57
前言
傳統零售數據分析的困局
傳統的零售數據分析方法,通常是由數據分析師根據業務分析需求,將分散在各個業務系統中的歷史數據導出到Excel表格,用Excel工具對數據進行加工處理,并將缺失的信息匹配完整后,進行數據透視,生成最終需要的分析報表。此種分析方法有以下幾大弊端。
(1)報表制作花費時間過長,數據分析師幾乎沒有時間對報表結果進行高價值的業務分析。一個業務報表,80%~90%的時間花費在數據的收集、處理及數據結果的核對上,而對報表結果的深入挖掘只占10%~20%的時間。
(2)報表的可復用性較差。雖然日報、周報、月報的制作方法類似,甚至相似主題的分析報表其邏輯框架也基本相同,但很多企業的數據分析專員依然是每日重復相同的工作,即收集、整理數據及核對結果。長期來看,數據分析專員對企業產生的價值有限,自身能力毫無提升。
(3)處理的數據量級有限。使用Excel進行數據處理和分析,幾萬行的數據基本上毫無壓力,但是當數據達到幾十萬行時,Excel的運行效率會顯著下降,出現嚴重卡頓。而對于百萬行量級的數據,由于超出了Excel工作表約104 萬行的限制,在Excel中甚至無法計算。在真實的企業環境下,如果分析得足夠深入,比如分析銷售額背后商品、會員、單據等數據的變化規律,或者分析的時間區間足夠大,比如分析一整年或者數年的銷售變化趨勢,那么基礎數據的量級很容易突破百萬行。以上這些分析場景都是難以通過Excel處理的。
(4)分析的指標相對簡單且數量有限。Excel 透視表中自帶的分析指標只有求和、計數、平均值、最大值、最小值及統計中常用的方差、標準差等,對于業務邏輯稍微復雜的指標,需要在透視表外進行二次計算。比如對于單據數的計算,由于在銷售表中單張單據可能包含多個商品,因此單據編號會重復出現,這樣在計算單據數的時候,就不能簡單地對單據編號計數,而要去重后再計數。在統計單據數的過程中,如果包含一些對于單據是否有效的判斷邏輯,數據處理過程會更加復雜。
(5)在一些相對高級的Excel 分析中,已經引入了比較成熟的模板概念,很好地解決了報表復用的問題。每次只要把新的數據追加到表格末尾,刷新后就會出現最新的分析報表,但這依然無法解決數據量大和分析指標簡單、有限這些痛點。而且在將新數據追加到分析模型之前,往往需要對數據做一系列的前期處理工作,將基礎數據進行聚合運算,分成幾個主題后再進行追加。這樣,一方面工作量會增加,另一方面,數據聚合的過程也會伴隨著數據顆粒度(即數據的細化程度)的增大而無法進行深入分析。
(6)如果既要保持基礎數據時間跨度足夠大,又要數據顆粒度足夠小,往往要借助IT的力量,使用數據庫或數據分析軟件。通常情況下,IT 人員擅長編寫代碼,對企業經營業務接觸較少,IT人員做出的報表往往難以滿足業務分析的需求,且一旦增加新的需求,分析周期也相對較長。這樣,分析報表在專業度、時效性、靈活性等方面都會大打折扣。
正是基于對傳統零售數據分析所存在的種種痛點的深刻反思,借助微軟強大的商業智能分析軟件Power BI,我們搭建了一套零售行業通用業務模型,以輔助業務人員準確、高效地進行零售數據分析,助力推進企業的數字化進程。
成書背景介紹
本書中虛構了一家專營女裝的大型服裝公司,公司日常的分析工作主要集中在運營分析、商品分析和會員分析三大領域。隨著市場競爭的加劇、業務需求的復雜化以及新型業務的不斷增加,公司管理者對業務報表的專業度和時效性的要求也在不斷提高。但是利用傳統的數據分析工具及分析方法,業務人員每天要花費大量的時間從諸如ERP、POS、SAP 等業務系統導出數據并進行數據清洗和整合,效率非常低;對于一些時間跨度較大或分析粒度過小的業務需求,數據量經常會超過單張Excel 表格的限制,只能將數據按照某個維度拆分后分別進行分析;同一個業務指標,不同部門匯總上來的結果往往有或多或少的偏差;對于公司管理者提出的一些高級業務需求,比如購物籃分析,業務人員完全沒有辦法實現。
現有的數據分析工具及分析方法已經遠遠無法滿足企業快速發展的需求,對散落在各個業務系統中的數據的高效整合,即時、專業、統一的業務報表及數據模型的構建,以及業務人員自主高效地通過拖曳來生成報表以解決一些臨時的問題等,是企業數字化轉型升級之路的迫切需求。基于對國內外商業智能分析工具的調研比較,筆者發現微軟推出的Power BI能夠非常完美地契合企業數字化轉型的需求。本書將詳細介紹利用Power BI搭建零售數據分析模型,以及運用數據分析模型指導企業業務運營的過程。
如何使用本書
不同于絕大多數講解Power BI技術的圖書,本書的側重點是講解Power BI 在零售行業內業務領域的實戰。書中各章講解的案例,“分”則是一個個獨立的業務應用場景,“合”則是一整套前后銜接、邏輯清晰的零售業務解決方案。無論您是在零售行業打拼多年的職場“老兵”,還是Power BI的技術“達人”,抑或是入門Power BI數據分析的新人,本書都會為您現有的知識結構提供強有力的補充和幫助。
本書使用的數據源以及數據源中所包含的業務字段均經過了仔細的考量、篩選,能夠涵蓋絕大部分零售數據分析場景。在閱讀本書之前,建議您首先在異步社區下載案例數據源,按照書中講解的操作方法,邊讀邊進行實操演練,從而加深理解。另外,我們還建立了零售數據分析學習交流群,通過掃描右側的二維碼即可入群學習、交流,探討與零售業務相關的問題及與Power BI相關的技術問題,以不斷拓展利用Power BI進行零售數據分析的各類應用場景。

最后,書中有幾點可能會使您在閱讀中產生一定的困惑,在此統一做說明。
(1)書中數據模型刷新日期是2019年8月20日,所有的業務發生日期都是截至該日,所以很多趨勢分析圖表中2019年的數據并不完整,只有1月到8月的數據,這個是由以上業務設定所導致的,并非數據缺失。
(2)書中部分圖表展示的數據,個體的總和與合計有微小差異,這是由于軟件對展示的小數位數進行了四舍五入處理,并非數據計算有誤。
(3)書中涉及“率”的公式,為了計算和表示方便,統一沒有乘以100%。
- Linux操作系統與服務配置
- Articulate Studio Cookbook
- Excel完全自學教程
- Word/Excel/PPT實戰技術大全
- Salesforce Platform Developer I Certification Guide
- 對比Excel,輕松學習Python報表自動化
- Office高級應用案例教程
- Excel辦公高手應用技巧
- 中文PowerPoint 2003應用基礎
- Office商務辦公實用教程
- 中文版Office2016大全
- 精通Excel數據統計與分析
- Excel數據透視表應用之道(雙色板)
- Word/Excel/PowerPoint三合一應用大全
- 新編Excel公式、函數與圖表應用大全(2016實戰精華版)