- 對比Excel,輕松學(xué)習(xí)SQL數(shù)據(jù)分析
- 張俊紅
- 649字
- 2020-07-23 16:41:55
1.5 數(shù)據(jù)分析工具
1.5.1 Excel與SQL
一般的數(shù)據(jù)分析都是圍繞常規(guī)數(shù)據(jù)分析流程進(jìn)行的,在這個流程中,我們需要選擇合適的工具對數(shù)據(jù)進(jìn)行分析。
如果讀者對數(shù)據(jù)庫有一些了解,可能覺得數(shù)據(jù)庫是用來存儲數(shù)據(jù)的,而Excel可能是用來進(jìn)行數(shù)據(jù)處理的。這兩個怎么區(qū)分呢?
數(shù)據(jù)庫本身是存儲數(shù)據(jù)的,這個是沒有問題的,但是存儲的數(shù)據(jù)一般都是明細(xì)類的,或者是雜亂的數(shù)據(jù),我們在從數(shù)據(jù)庫獲取數(shù)據(jù)的時候需要對數(shù)據(jù)進(jìn)行一系列處理,最后得到我們真正需要的結(jié)果數(shù)據(jù)。
Excel是用來進(jìn)行數(shù)據(jù)處理的,這個也是沒有問題的,比如,我們在Excel表中對某一列去除重復(fù)值,對某兩列相加減,這些都是屬于數(shù)據(jù)處理。但是在數(shù)據(jù)處理之前,Excel中的數(shù)據(jù)其實也是存儲在Excel這個數(shù)據(jù)庫中的。我們可以把一個Excel工作簿本身當(dāng)作一個數(shù)據(jù)庫,一個Excel工作簿會包含多個Sheet,一個Sheet對應(yīng)數(shù)據(jù)庫中的一張表,而一個數(shù)據(jù)庫也會包含多張表。
在對數(shù)據(jù)進(jìn)行處理之前,數(shù)據(jù)庫和Excel都是用來存儲數(shù)據(jù)的,只不過現(xiàn)在很多互聯(lián)網(wǎng)公司的數(shù)據(jù)量太大,使用本地的Excel存儲數(shù)據(jù)已經(jīng)不能滿足日常業(yè)務(wù)需求,所以數(shù)據(jù)一般都會存儲在數(shù)據(jù)庫中。但是本質(zhì)原理還是一樣的。
在平時工作中,我們一般從數(shù)據(jù)庫中獲取數(shù)據(jù),對數(shù)據(jù)進(jìn)行一些處理變換以后導(dǎo)出到本地,然后在Excel或Python中進(jìn)行進(jìn)一步處理。
1.5.2 SQL與Python
雖然SQL可以實現(xiàn)我們在數(shù)據(jù)分析過程中需要的大部分操作,但是有些操作在SQL中實現(xiàn)起來還是比較煩瑣的,這個時候我們就可以使用SQL將數(shù)據(jù)提取出來,然后導(dǎo)入Python中進(jìn)行處理。
當(dāng)然,也可以直接用Python連接SQL,這就省去了導(dǎo)出數(shù)據(jù)到本地這個過程了,但是一般公司出于安全考慮,是不會直接用Python去連接數(shù)據(jù)庫的。
- 自己動手寫分布式搜索引擎
- Dreamweaver基礎(chǔ)與實戰(zhàn)教程
- Wordpress 3 Complete
- Pro/E Wildfire 5.0中文版入門、精通與實戰(zhàn)
- Rhino 6.0中文版入門、精通與實戰(zhàn)
- PPT 2016幻燈片設(shè)計與制作從入門到精通
- SketchUp/Piranesi印象彩繪表現(xiàn)項目實踐
- Android從入門到精通
- 攝影輕松入門:Photoshop后期處理
- ASP.NET 3.5 Application Architecture and Design
- SOLIDWORKS中文版實用教程
- SOA Patterns with BizTalk Server 2009
- Moldflow 2021模流分析從入門到精通(升級版)
- Spark Cookbook 中文版
- Altium Designer 20 中文版從入門到精通