- 輕松學大數據挖掘:算法、場景與數據產品
- 汪榕
- 478字
- 2019-12-04 19:10:01
2.1.1 初識SQL
簡單來說,SQL是一門編程語言,它是用來操作數據庫中的數據的。學習這門語言之前,要思考以下幾個問題。
1.為什么學習SQL
毋庸置疑,在大數據生態圈中需要處理很多結構化數據(如圖2-1所示),以及在數據挖掘前期的數據清洗和加工,都離不開SQL。

圖2-1 結構化數據(來自百度百科)
當然,有一點需要承認。在大數據生態圈里,我們接觸更多的是數據倉庫Hive的工具語言HQL。那么HQL與SQL的區別是什么呢?
它們除了常用的寫法類似,其他方面都不同。為什么需要先學習SQL,而不直接學習HQL呢?
一方面,HQL常用的語法都來源于SQL,學習SQL有助于理解HQL的知識;另一方面,學習SQL很方便,只需要安裝MySQL的服務端和客戶端,就可以操作數據庫中的結構化數據了。
2.學到什么程度呢
編程思想、動手能力、數據清洗和數據加工都是基礎知識,必須學得足夠扎實。“萬地高樓平地起”正是這個道理。每一門學問都不是兩三天能夠完全掌握的。對于我們而言,也不需要把它學得那么透徹。
所以學習這類學問,遵循以下三句話足矣。
第一句:去其糟粕,學我所需,用我所學。
第二句:活學活用,勤于動手,溫故而知新。
第三句:不戀戰,不鉆牛角尖,待它日,必將恍然大悟。
推薦閱讀
- 從0到1:數據分析師養成寶典
- 文本數據挖掘:基于R語言
- Dependency Injection with AngularJS
- Python金融實戰
- 網站數據庫技術
- Mastering LOB Development for Silverlight 5:A Case Study in Action
- 大數據時代系列(套裝9冊)
- 信息融合中估計算法的性能評估
- Microsoft Dynamics NAV 2015 Professional Reporting
- 大數據技術體系詳解:原理、架構與實踐
- Practical Convolutional Neural Networks
- AI Crash Course
- Scratch Cookbook
- Hands-On Java Deep Learning for Computer Vision
- 高效使用Redis:一書學透數據存儲與高可用集群