官术网_书友最值得收藏!

2.2 Power Query的Excel數據集成

Excel與CSV最大的不同在于,CSV數據格式中不需要任何的數據驅動就可以進行數據的訪問和集成,而如果格式為Excel,數據訪問與集成必須有相應的驅動才可以完成,即Excel之外的其他軟件在訪問Excel文件時必須擁有訪問Excel連接的驅動。

在安裝了Excel的訪問組件之后,就可以實現本書涉及的Excel和Power BI訪問Excel的功能,利用Excel和Power BI 進行Excel的數據集成。接下來我們分別通過Excel及Power BI進行Excel的多表集成。這里需要特別注意的是,Excel的數據格式有以下兩種類型。

■ XLS:2003或更早版本的Excel保存的文件格式。

■ XLSX:2007及以后版本的Excel保存的文件格式。

在實際的數據處理過程中,兩種版本的Excel文件還是會略有差別,導入過程的主要差別如下。

■ XLS格式導入的是格式化的數據,不是原始數據。

■ XLSX格式導入的是源數據,不管數據格式如何變化,導入的都是原始數據。

2.2.1 Excel中的Excel數據導入與集成

若在Excel界面的數據來源中選擇Excel數據進行導入,在Excel中選擇“數據”選項卡,然后單擊“獲取數據”的下拉按鈕,在彈出的下拉列表中選擇“來自文件”→“從工作簿”命令進行數據導入,如圖2.14所示。

圖2.14? Excel 獲取Excel文件所對應的菜單

與CSV格式文件相比,Excel格式文件支持多表的數據導入,如果希望支持多個數據表的導入,可以在導入的界面中選擇多個表進行數據導入。圖2.15所示為Excel表格的導入界面,可以選中多項進行多個表數據的選擇。

圖2.15? Excel表格導入界面

選擇需要導入的表格對象,通常不會直接進入加載數據的界面,而是單擊“轉換數據”按鈕進行數據的集成和清洗,完成數據的再處理。Power Query的整體處理界面如圖2.16所示。

圖2.16? Power Query整體處理界面

在Power Query中完成數據清洗和集成之后,單擊“主頁”選項卡中的“關閉并上載”下拉按鈕,將會出現以下選項。

■ 關閉并上載:如果選擇“關閉并上載”選項,可將數據直接加載到Excel當前的數據編輯區域中,所有的數據將被加載到當前的Excel表格中,當數據超過1048576行時則不適用。

■ 關閉并上載至:選擇“關閉并上載至”選項可以選擇數據保存的方式,在打開的“導入數據”對話框中,我們可以選擇“表”,即導入Excel的數據表中;或者選擇“僅創建連接”,即只建立數據連接進行建模。但是如果導入的數據量過大(超過1048576行),則選擇“僅創建連接”且作為建模的數據來源,如圖2.17所示。

圖2.17? 數據加載方式的切換

2.2.2 Power BI中的Excel數據導入與集成

使用Power BI進行數據的存儲和處理,所有的數據內容以緩存方式保存在Power BI中。當然,數據也能夠導入Power BI中進行預處理,在利用Power Query完成預處理之后,所有的數據將只能用于Power Pivot數據建模。在Power BI主頁中,我們首先單擊“獲取數據”下拉按鈕,在彈出的下拉列表中選擇“Excel數據導入”命令,再選擇相應的數據表,即可實現數據的導入,圖2.18所示為數據導入的操作界面。

圖2.18? Power BI導入Excel數據表

選擇好需要進行導入的表數據之后,進入Power BI的Power Query編輯器界面進行數據的清洗和重構,圖2.19所示為Power Query編輯器的界面。

圖2.19? Power Query編輯器界面

進行清洗和重構之后的數據將被保存到Power BI的數據緩存中,如果有需要的話,可以在Power BI的數據表界面中實現數據的再處理。圖2.20所示為數據保存后表處理的界面,在界面中可以完成數據格式的設置。

圖2.20? Power BI的數據編輯界面

當然,數據保存在緩存過程之前,如果數據的字段和格式需要二次處理,可以在Power BI的Power Query編輯器界面對數據進行二次修改后再保存。

主站蜘蛛池模板: 抚顺市| 巢湖市| 康平县| 广丰县| 柘城县| 荔浦县| 阿图什市| 正蓝旗| 弋阳县| 通许县| 怀化市| 济宁市| 田林县| 洛隆县| 宜丰县| 册亨县| 蒲城县| 陇川县| 扶风县| 黔西县| 文水县| 关岭| 拜城县| 依兰县| 原平市| 叶城县| 长葛市| 花莲县| 赤壁市| 三明市| 嵩明县| 普兰县| 华池县| 平昌县| 巴彦淖尔市| 大石桥市| 崇礼县| 穆棱市| 洪泽县| 遵义市| 屏山县|