- 34招精通商業智能數據分析:Power BI和Tableau進階實戰
- 雷元
- 1028字
- 2020-04-24 15:01:48
1.2 派生維度的概念
在《三體》中,存活于三維空間的人類文明最終被來自更高維度的文明所毀滅。在面臨被滅種的災難時,人類甚至無法對敵人發起一次有效的反抗,甚至連對方的樣貌都看不到,因為二者的競爭力完全不是處于同一個水平(維度)。引用這個情景主要是為了陳述維度的重要性。在BI領域,這個原理也是適用的。
數據分析的核心概念其實只有兩個:數值與維度。
BI分析依據不同的維度(字段)(如國家維度、日期維度)將聚合數值(如銷售金額、銷售利潤)切割成具體的數據立方體,即分析結果,如某年某國家的銷售利潤。這個過程被稱之為切片??上攵?,切片越多,數值結果越詳盡,分析的角度就越廣,其所具有的洞察力就更強。因此,一款BI產品的執行力除了取決于其聚合能力,還取決于其創建維度的能力(見圖1.2.1)。

圖1-2-1
1.原生維與派生維
原生維的概念很直觀:一切直接來源于數據源,且可用于維度分析的字段,如案例文件中自帶的【客戶ID】【產品ID】字段,即為原生維。原生維可用于最基本的維度分析。但維度分析不僅僅局限于原生維自身。
在日常的分析場景中,分析師通過對原生維進行加工生成新的維度,即派生維。派生維的存在形式是依存于原生維的,例如在原生維【客戶ID】和【訂單ID】的基礎上,通過計算,衍生出的【客戶購買次數】維度,被稱為派生維。使用派生維,可增加分析維度。
在圖1.2.2所示的分析中,是對不同購買次數的顧客數量進行求和。其中X軸為【客戶購買次數】,是派生維。如之前所述,【客戶購買次數】維度并不直接存在于數據源中,需要派生。

圖1-2-2
需求強調的是,如果僅僅使用普通函數,則無法直觀生成派生維。
例如,在Tableau中,創建普通字段【購買次數】。將【購買次數】字段和【客戶名稱】字段分別放入【列】和【行】中,如圖1.2.3和圖1.2.4所示。

圖1-2-3

圖1-2-4
按住Ctrl鍵,將【購買次數】膠囊放入篩選器中并將值固定,單擊【確定】按鈕退出。
將【客戶名稱】字段放入【標簽】卡中,通過表計算完成匯總。
圖1.2.5顯示了購買5次的客戶人數是5人。雖然我們最終能得出部分答案,但是其過程煩瑣,效果也不直觀。

圖1-2-5
上述案例說明,如果僅僅依靠原生維,則分析會受到局限。派生維的應用為分析師帶來更加具有洞察力的分析結果。
回到工具應用層面,令人鼓舞的是,無論是Tableau還是Power BI,都有非常強大、成熟的功能用于創建派生維,而這也是自助式BI工具與傳統BI工具的一大區別。高度靈活的維度分析能力,使Tableau和Power BI更加適合探索性分析場景。
Tableau和Power BI在魔力象限圖中的Y軸(易用性)上的得分也正好印證了其具有強大的探索性分析能力。