官术网_书友最值得收藏!

2.1 適合分析的數據格式

由于數據的來源多種多樣,因此,不同來源的數據會以不同的格式存儲在表中。然而,并非所有格式的數據都適合在Tableau中進行分析。適合分析的數據至少需要符合以下格式要求:

·以一維表結構存儲數據。

·盡可能細化數據,而非聚合數據。

·表中的每一列都有列標題。

·表中沒有空行和空單元格。

1.以一維表結構存儲數據

表中的數據不能存儲為像數據透視表那樣的二維表,而應該像數據庫中的表結構一樣,即所謂的一維表,它是指每一列只存儲同一類數據,表中不能存在包含同類內容的多個列。

如圖2-1所示是一個二維表的示例,表中的最后3列雖然名稱不同,但是它們都同屬于商品,它們都是商品中的其中一種。為了使表中的數據適合分析,需要將最后3列轉換為兩列,其中一列存儲商品的名稱,另一列存儲商品的銷量,合并后的表如圖2-2所示。

圖2-1 以二維表結構存儲的數據

圖2-2 將二維表轉換為一維表

2.盡可能細化數據,而非聚合數據

表中的數據應該盡可能細化,而不是聚合后的數據。如圖2-3所示的最后一行對每種商品的銷量進行求和,求和運算是聚合的一種,聚合還包括求平均值、計數、求最大值、求最小值等。在Tableau中分析數據之前,應該刪除表中的聚合數據。

另一種情況是表中的數據應盡可能詳細。例如,表中包含按天記錄的數據要好于按月記錄的數據,數據級別越詳細,在Tableau中就可以進行更多的分析。

3.表中的每一列都有列標題

應確保表中的每一列都有列標題,以便在將這些數據導入Tableau Desktop時能夠顯示正確的字段名稱。

4.表中沒有空行和空單元格

表中的所有數據之間不能有空行,以便使所有數據位于一個連續的范圍之內。更重要的是,表中不能有空單元格。如圖2-4(a)所示,即使幾種商品具有相同的分類名稱,但是在“類別”列中也不能使單元格為空,而必須重復填入相同的類別名稱,如圖2-4(b)所示。

圖2-3 表中不應該包含聚合數據

圖2-4 表中不能有空單元格

主站蜘蛛池模板: 双柏县| 扶绥县| 新河县| 乐昌市| 肇庆市| 青岛市| 桐柏县| 泸州市| 富顺县| 兴山县| 乌审旗| 武清区| 蓝田县| 白玉县| 平远县| 郴州市| 通河县| 集贤县| 临夏市| 德保县| 龙游县| 玛纳斯县| 霍城县| 铜川市| 乡宁县| 河南省| 赤峰市| 郑州市| 南城县| 镇安县| 抚顺县| 丰都县| 灵石县| 平远县| 宝兴县| 扎鲁特旗| 兴国县| 邻水| 饶河县| 彰武县| 托克托县|