- 大數據技術基礎:基于Hadoop與Spark
- 羅福強 李瑤 陳虹君
- 467字
- 2020-09-18 18:29:36
第1章 大數據技術概述
本章目標:
● 了解大數據的發展過程以及大數據對國內外各行各業的影響。
● 掌握大數據的概念及其特征。
● 了解大數據的來源,理解大數據在技術、安全等方面面臨的挑戰和研究大數據的意義。
● 掌握大數據的存儲與計算模式的相關概念,了解其中的關鍵技術及基本思想。
● 了解大數據的典型應用場景,學會用創新性思維來看待大數據。
● 了解Hadoop的發展過程和優勢。
● 熟悉Hadoop的生態系統以及其中的基本概念。
● 了解Hadoop的版本發行狀況。
本章重點和難點:
● 大數據的概念與特征。
● 大數據的存儲與計算模式及其相關技術。
● Hadoop的生態系統及其基本概念。
我們生活在一個數據大爆炸的時代,很難估算全球電子設備中存儲的數據總共有多少。根據中國最大的企業級IT網站ZDNET(至頂網)的年度技術報告——《數據中心2013:硬件重構與軟件定義》,2013 年中國產生的數據總量超過0.8ZB(相當于8億TB),2 倍于2012年中國的數據總量,相當于 2009 年全球的數據總量。該報告預計,到 2020 年,中國產生的數據總量將是2013年的10倍,超過8.5ZB。本章將深入介紹大數據的發展、概念、特征、典型應用,以及Hadoop大數據平臺的發展、基本概念及體系結構。