Hadoop大數據開發實戰
本書將大數據技術生態圈主流技術框架的應用與發展、搭建Hadoop大數據分布式系統集群平臺、大數據分布式文件系統HDFS(HadoopDistributedFileSystem)、大數據分布式并行計算框架MapReduce、大數據汽車銷售數據統計分析項目5大模塊分為11章內容進行闡述。具體分布情況如下:第1章是大數據概論,介紹大數據的發展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系統入門、HDFS接口、HDFS的運行機制、HadoopI/O流操作;第7~10章是初識MapReduce編程模型、MapReduce應用編程開發、MapReduce編程案例、MapReduce運行機制與YARN平臺;第11章是汽車銷售數據統計分析項目實戰。本書將理論與實踐相結合,介紹了大數據的核心技術,并通過介紹一個企業的開發項目,深入講解大數據技術在實際工作中的應用。本書是為所有熱愛大數據、打算從事大數據相關工作的讀者而編寫的,適合有Java編程基礎的學習者參考使用,也適合作為高等院校、培訓機構的大數據技術教材。
·10.3萬字