官术网_书友最值得收藏!

1.2 派生維度的概念

在《三體》中,存活于三維空間的人類文明最終被來自更高維度的文明所毀滅。在面臨被滅種的災難時,人類甚至無法對敵人發起一次有效的反抗,甚至連對方的樣貌都看不到,因為二者的競爭力完全不是處于同一個水平(維度)。引用這個情景主要是為了陳述維度的重要性。在BI領域,這個原理也是適用的。

數據分析的核心概念其實只有兩個:數值與維度。

BI分析依據不同的維度(字段)(如國家維度、日期維度)將聚合數值(如銷售金額、銷售利潤)切割成具體的數據立方體,即分析結果,如某年某國家的銷售利潤。這個過程被稱之為切片??上攵?,切片越多,數值結果越詳盡,分析的角度就越廣,其所具有的洞察力就更強。因此,一款BI產品的執行力除了取決于其聚合能力,還取決于其創建維度的能力(見圖1.2.1)。

圖1-2-1

1.原生維與派生維

原生維的概念很直觀:一切直接來源于數據源,且可用于維度分析的字段,如案例文件中自帶的【客戶ID】【產品ID】字段,即為原生維。原生維可用于最基本的維度分析。但維度分析不僅僅局限于原生維自身。

在日常的分析場景中,分析師通過對原生維進行加工生成新的維度,即派生維。派生維的存在形式是依存于原生維的,例如在原生維【客戶ID】和【訂單ID】的基礎上,通過計算,衍生出的【客戶購買次數】維度,被稱為派生維。使用派生維,可增加分析維度。

在圖1.2.2所示的分析中,是對不同購買次數的顧客數量進行求和。其中X軸為【客戶購買次數】,是派生維。如之前所述,【客戶購買次數】維度并不直接存在于數據源中,需要派生。

圖1-2-2

需求強調的是,如果僅僅使用普通函數,則無法直觀生成派生維。

例如,在Tableau中,創建普通字段【購買次數】。將【購買次數】字段和【客戶名稱】字段分別放入【列】和【行】中,如圖1.2.3和圖1.2.4所示。

圖1-2-3

圖1-2-4

按住Ctrl鍵,將【購買次數】膠囊放入篩選器中并將值固定,單擊【確定】按鈕退出。

將【客戶名稱】字段放入【標簽】卡中,通過表計算完成匯總。

圖1.2.5顯示了購買5次的客戶人數是5人。雖然我們最終能得出部分答案,但是其過程煩瑣,效果也不直觀。

圖1-2-5

上述案例說明,如果僅僅依靠原生維,則分析會受到局限。派生維的應用為分析師帶來更加具有洞察力的分析結果。

回到工具應用層面,令人鼓舞的是,無論是Tableau還是Power BI,都有非常強大、成熟的功能用于創建派生維,而這也是自助式BI工具與傳統BI工具的一大區別。高度靈活的維度分析能力,使Tableau和Power BI更加適合探索性分析場景。

Tableau和Power BI在魔力象限圖中的Y軸(易用性)上的得分也正好印證了其具有強大的探索性分析能力。

主站蜘蛛池模板: 五莲县| 库车县| 恭城| 昌图县| 阜南县| 莱芜市| 扎赉特旗| 武清区| 洱源县| 苍梧县| 龙井市| 西乌| 西峡县| 哈巴河县| 杂多县| 雷山县| 卢氏县| 长治县| 垫江县| 大化| 乾安县| 蒲城县| 庆云县| 金塔县| 裕民县| 阿拉善右旗| 高陵县| 濮阳市| 资兴市| 白河县| 巩留县| 沈阳市| 洛宁县| 崇阳县| 临泽县| 延边| 卓尼县| 中卫市| 三台县| 沅江市| 乐业县|