- Tableau數據可視化分析從新手到高手
- 宋翔編著
- 762字
- 2024-12-24 10:13:44
2.1 適合分析的數據格式
由于數據的來源多種多樣,因此,不同來源的數據會以不同的格式存儲在表中。然而,并非所有格式的數據都適合在Tableau中進行分析。適合分析的數據至少需要符合以下格式要求:
·以一維表結構存儲數據。
·盡可能細化數據,而非聚合數據。
·表中的每一列都有列標題。
·表中沒有空行和空單元格。
1.以一維表結構存儲數據
表中的數據不能存儲為像數據透視表那樣的二維表,而應該像數據庫中的表結構一樣,即所謂的一維表,它是指每一列只存儲同一類數據,表中不能存在包含同類內容的多個列。
如圖2-1所示是一個二維表的示例,表中的最后3列雖然名稱不同,但是它們都同屬于商品,它們都是商品中的其中一種。為了使表中的數據適合分析,需要將最后3列轉換為兩列,其中一列存儲商品的名稱,另一列存儲商品的銷量,合并后的表如圖2-2所示。
圖2-1 以二維表結構存儲的數據
圖2-2 將二維表轉換為一維表
2.盡可能細化數據,而非聚合數據
表中的數據應該盡可能細化,而不是聚合后的數據。如圖2-3所示的最后一行對每種商品的銷量進行求和,求和運算是聚合的一種,聚合還包括求平均值、計數、求最大值、求最小值等。在Tableau中分析數據之前,應該刪除表中的聚合數據。
另一種情況是表中的數據應盡可能詳細。例如,表中包含按天記錄的數據要好于按月記錄的數據,數據級別越詳細,在Tableau中就可以進行更多的分析。
3.表中的每一列都有列標題
應確保表中的每一列都有列標題,以便在將這些數據導入Tableau Desktop時能夠顯示正確的字段名稱。
4.表中沒有空行和空單元格
表中的所有數據之間不能有空行,以便使所有數據位于一個連續的范圍之內。更重要的是,表中不能有空單元格。如圖2-4(a)所示,即使幾種商品具有相同的分類名稱,但是在“類別”列中也不能使單元格為空,而必須重復填入相同的類別名稱,如圖2-4(b)所示。
圖2-3 表中不應該包含聚合數據
圖2-4 表中不能有空單元格
- Vulkan學習指南
- HTML5 Multimedia Development Cookbook
- Swing Extreme Testing
- AutoCAD 2019中文版從入門到精通
- Drupal Multimedia
- 人臉識別算法與案例分析
- ADempiere 3.6 Cookbook
- BIRT 2.6 Data Analysis and Reporting
- Illustrator 2024從入門到精通
- AutoCAD 2019中文版計算機輔助繪圖全攻略
- Creo 4.0從入門到精通
- Photoshop網店圖片處理實訓教程
- 會聲會影視頻編輯實戰秘技250招
- Configuring IPCop Firewalls: Closing Borders with Open Source
- MATLAB在日常計算中的應用