官术网_书友最值得收藏!

1.2 Power Pivot在數據分析方面的優勢

盡管傳統的Excel數據透視表已經很強大了,但在學習了Power Pivot之后,你就會深深地體會到,Power Pivot中的Power確實是所言不虛。下面我們通過幾個數據分析場景來看看Power Pivot的特殊能力。

1.2.1 多表關聯能力

分析對象的原始數據通常稱為數據源。傳統Excel數據透視表只能對單一的表進行數據分析,它的數據源只能是一個獨立的大表。盡管后來傳統Excel數據透視表也提供了初步的多表關聯功能,但這個功能非常原始,遠遠滿足不了我們日益復雜的數據分析需求。

在一般情況下,作為傳統Excel數據透視表分析對象的大表(數據源)可能由公司IT部門提供,可能是我們直接鏈接公司數據庫中的表,也可能是本部門業務數據的積累。我們通常將這些不由自己控制的數據稱為外部數據。

此外,這個“大表”往往缺少一些滿足特定數據分析需求的、至關重要的信息。例如,本部門自定義的數據分組規則,一些績效指標等級劃分,等等。我們通常將這些由本部門自行維護的數據稱為本地數據。

在數據分析實踐中往往需要將這些本地數據與外部數據進行關聯,得出各種分組劃分標準下的數據分析結果。對于這種情況,不完美的解決方案是,利用Excel中的VLOOKUP()函數提取本地數據并將其合并到已經導入Excel中的外部數據表(簡稱表)中,然后進行數據透視操作。這種方法雖然可以暫時解決問題,但每次更新原始數據,我們都要檢查一次VLOOKUP()函數是否正確地計算了全部數據,明顯降低了數據分析工作的效率,并且有潛在的數據分析質量風險。

我們可以利用Power Pivot的多表關聯能力(也稱為Power Pivot的數據建模能力),將來自不同數據源的多個表按照表間的邏輯關系關聯到一起,從數據源頭建立起表間的關聯關系,使數據提取和分析的過程渾然一體。

就這樣,一旦建立數據分析邏輯,我們就可以用一鍵刷新的方式快速得到最新的數據分析結果,從而實現數據分析的流程化、自動化。在Power Pivot數據模型管理界面中將多個表按照表間的邏輯關系關聯起來,如下圖所示。

下圖是基于上圖所示的Power Pivot數據模型建立的Power Pivot超級數據透視表,它能夠建立數據模型,并且基于數據模型進行分析,是Power Pivot超級數據透視表和傳統Excel數據透視表的本質區別。因此,我們將基于Power Pivot數據模型建立的數據透視表統稱為Power Pivot。Power Pivot的特點是數據在Power Pivot數據模型中存儲和管理,數據分析結果在Power Pivot超級數據透視表中呈現。

單從外觀上來看,Power Pivot超級數據透視表和傳統Excel數據透視表似乎并沒有什么不同,但如果仔細觀察,會看到在上圖右側的“數據透視表字段”視圖中有五個表,每個表都包含各自的字段名稱,這明顯與我們常見的傳統Excel數據透視表不同。

在Power Pivot數據模型管理界面中,我們根據表內容間的邏輯關系建立了表與表之間的關聯,即建立了數據模型。在已經建立了數據模型的前提下,對于一些數據分析操作,我們就可以將本來比較復雜的多表關聯分析轉換為直接將不同字段拖曳至數據透視表的相應區域的簡單拖曳操作。

從數據建模的角度來看,Power Pivot實際上是一個可以對多表數據模型進行分析的工具(當然也可以只有一個表)。作為用戶,我們可以將Power Pivot超級數據透視表看成一個對Power Pivot數據模型進行高級查詢的工具。因此,我們對Power Pivot的學習,至少包含數據建模和數據分析兩方面內容。

事實上,區別于傳統Excel數據透視表,Power Pivot不僅能夠對多個表進行數據建模操作,而且提供了一套讓數據提取和分析更加靈活的DAX工具。在本書的前面章節中主要介紹Power Pivot單表數據模型和一些基本的DAX函數;在本書的后面章節中會詳細講解Power Pivot數據建模知識和相關數據分析方法。

1.2.2 功能更加豐富

在Power Pivot出現之前,傳統Excel數據透視表可謂是獨領風騷。傳統Excel數據透視表除了能夠對拖曳至值區域中的字段進行基本的批量求和計算,還能夠使用數據透視表的一些預置選項實現其他常用類型的匯總計算,如求平均值、求方差、計數等。

然而,這些在傳統Excel數據透視表中已經預置好的、不可改變的數據透視表匯總計算大大限制了傳統Excel數據透視表的能力。要滿足超出傳統Excel數據透視表預置匯總計算能力的、復雜的數據分析需求,我們不得不使用傳統Excel數據透視表之外的方法。例如,如果需要對數據源中某個字段進行不重復計數,或者對數據源中某文本字段按組別合并到數據透視表值區域中對應的單個單元格,則幾乎無法使用傳統Excel數據透視表的內置能力實現。但是Power Pivot超級數據透視表為我們提供了一套全新的DAX函數,利用它解決傳統Excel數據透視表的上述難題變得輕而易舉。

在Power Pivot的世界中,我們幾乎可以應對所有傳統Excel數據透視表無法解決的難題,唯一限制我們的是對Power Pivot數據模型理解的深度和對DAX表達式應用的熟練程度,而這些完全可以通過持續的學習和實踐來提升。

使DAX表達式實現在Power Pivot超級數據透視表值區域中的單元格中顯示每個圖書子類下所銷售圖書書名的不重復列表,如下圖所示。這種分析結果在傳統Excel數據透視表中是無法得到的,而在Power Pivot中,使用一個簡單的DAX函數即可得到。

1.2.3 更快的運算速度

傳統Excel數據透視表存在一個嚴重的問題,就是運算的執行速度。經常使用傳統Excel數據透視表的讀者可能都知道,如果分析的數據量較大,那么哪怕只是簡單地更改數據透視表的布局,也會等待相當長的時間。

其實Excel軟件的開發者也知道這個問題的存在,并且提供了一個并不優雅的解決方案。他們在傳統Excel數據透視表的“數據透視表字段”視圖下方設計了一個“延遲布局更新”的復選框,在勾選這個復選框后,當我們在“數據透視表字段”視圖中拖曳字段時,數據透視表不會在每次布局改變后立即實時顯示新的分析結果,而是在確定數據透視表的最終布局后,通過單擊旁邊的“更新”按鈕對數據透視表進行一次性的全面計算和更新。

在Power Pivot中,雖然“推遲布局更新”復選框和“更新”按鈕仍然存在,但由于Power Pivot采用了一種全新的內部數據組織方式,因此針對海量的數據處理、分析和展示速度明顯加快,從源頭上解決了數據處理的速度問題,明顯地減少了數據分析過程中的等待時間。

主站蜘蛛池模板: 玉门市| 长海县| 邛崃市| 延安市| 滨海县| 桦甸市| 定南县| 石首市| 荣昌县| 永寿县| 会东县| 马尔康县| 若尔盖县| 岚皋县| 金沙县| 新龙县| 上杭县| 磐安县| 青浦区| 阜城县| 平凉市| 临泽县| 泸溪县| 潜山县| 彭山县| 西平县| 清苑县| 改则县| 西峡县| 张北县| 长顺县| 临邑县| 宜君县| 芮城县| 亳州市| 东乡族自治县| 米易县| 格尔木市| 嘉兴市| 安化县| 清原|