官术网_书友最值得收藏!

前言

國家提出要加快5G網(wǎng)絡(luò)和數(shù)據(jù)中心等新型基礎(chǔ)設(shè)施建設(shè)(簡稱新基建)的進(jìn)度。其中,信息化新型基礎(chǔ)設(shè)施包含云計(jì)算、大數(shù)據(jù)、人工智能、區(qū)塊鏈、5G等內(nèi)容。大數(shù)據(jù)是指具有海量(volume)、多模態(tài)(variety)、變化速度快(velocity)、蘊(yùn)含價(jià)值高(value)和真實(shí)性(veracity)“5V”特征的數(shù)據(jù),使得傳統(tǒng)的數(shù)據(jù)存儲(chǔ)、管理、分析技術(shù)已經(jīng)無法滿足大數(shù)據(jù)的處理要求。大數(shù)據(jù)給傳統(tǒng)的數(shù)據(jù)處理和數(shù)據(jù)分析帶來巨大的挑戰(zhàn),已引起學(xué)術(shù)界和工業(yè)界的高度關(guān)注。Hadoop正是在這種背景下產(chǎn)生的一個(gè)大數(shù)據(jù)開源平臺(tái)。許多大型互聯(lián)網(wǎng)公司,如谷歌、阿里巴巴、百度、京東等互聯(lián)網(wǎng)公司都急需掌握Hadoop大數(shù)據(jù)技術(shù)的人才,而目前人才市場上大數(shù)據(jù)技術(shù)相關(guān)人才由于種種原因存在供不應(yīng)求的狀況,本書在這個(gè)背景下創(chuàng)作而成。

本書內(nèi)容

本書是一本關(guān)于Hadoop 3.2.2大數(shù)據(jù)平臺(tái)搭建和數(shù)據(jù)分析、生態(tài)體系主要組件的應(yīng)用和開發(fā)方面的實(shí)戰(zhàn)書籍,涉及的知識(shí)面比較廣,涵蓋了當(dāng)前整個(gè)Hadoop生態(tài)系統(tǒng)主流的大數(shù)據(jù)開發(fā)技術(shù)。本書從實(shí)踐操作與開發(fā)講起,在基本操作已經(jīng)掌握以后,再回過頭來講解理論知識(shí)。所以,本書是先實(shí)踐再理論,方便讀者快速掌握Hadoop大數(shù)據(jù)分析技術(shù)。

全書共分11章,第1章講解Hadoop框架簡介及新版本特性,并詳細(xì)介紹大數(shù)據(jù)環(huán)境的準(zhǔn)備工作,包括Linux操作系統(tǒng)的安裝、SSH工具使用和配置等;第2章講解Hadoop偽分布式的安裝和開發(fā)體驗(yàn),使讀者熟悉Hadoop大數(shù)據(jù)開發(fā)兩大核心組件,即HDFS和MapReduce;第3~9章講解Hadoop生態(tài)系統(tǒng)各框架HDFS、MapReduce、輸入/輸出、Hadoop集群配置、ZooKeeper、HBase、Hive、Flume數(shù)據(jù)采集系統(tǒng)、Kafka等,并通過實(shí)際案例加深對各個(gè)框架的理解與應(yīng)用。第10~11章分別通過影評大數(shù)據(jù)分析項(xiàng)目實(shí)戰(zhàn)和旅游酒店評價(jià)大數(shù)據(jù)分析項(xiàng)目實(shí)戰(zhàn),使讀者了解完整的大數(shù)據(jù)項(xiàng)目開發(fā)過程,并鞏固所學(xué)的知識(shí),使之掌握的內(nèi)容更加系統(tǒng)、全面。

本書目的

通過本書的學(xué)習(xí),讀者可以對照書中的步驟成功搭建屬于自己的Hadoop大數(shù)據(jù)集群,并掌握基于Hadoop的大數(shù)據(jù)分析與開發(fā)技術(shù),最終能夠獨(dú)立完成Hadoop大數(shù)據(jù)分析與開發(fā)項(xiàng)目。

本書適合的讀者

本書可作為Hadoop框架初學(xué)者的入門書以及大數(shù)據(jù)分析人員的參考手冊,也可作為高校開設(shè)大數(shù)據(jù)平臺(tái)搭建或大數(shù)據(jù)開發(fā)課程的參考教材。學(xué)習(xí)本書要求讀者有一定的Java編程基礎(chǔ)并了解Linux系統(tǒng)的基礎(chǔ)知識(shí)。本書每一個(gè)章節(jié)的實(shí)踐操作內(nèi)容都有詳細(xì)清晰的步驟講解,即使讀者沒有任何大數(shù)據(jù)基礎(chǔ),也可以對照書中的步驟成功搭建屬于自己的大數(shù)據(jù)集群,本書是一本真正提高讀者動(dòng)手能力、以實(shí)操為主的入門書籍。通過本書的學(xué)習(xí),結(jié)合每章配套的源代碼,讀者能夠迅速理解與掌握Hadoop大數(shù)據(jù)相關(guān)技術(shù)框架,并可以熟練使用Hadoop集成環(huán)境進(jìn)行大數(shù)據(jù)項(xiàng)目的開發(fā)。

配套源碼、PPT課件等資源下載

本書配套源碼、PPT課件、教學(xué)大綱與編程環(huán)境,需要用微信掃描下邊二維碼獲取,可按掃描后的頁面提示填寫你的郵箱,把下載鏈接轉(zhuǎn)發(fā)到郵箱中下載。如果下載有問題或閱讀中發(fā)現(xiàn)問題,請聯(lián)系booksaga@163.com,郵件主題寫“Hadoop大數(shù)據(jù)分析技術(shù)”。

作者

2022年9月

主站蜘蛛池模板: 红原县| 凤庆县| 镇安县| 台湾省| 永平县| 罗江县| 南陵县| 保亭| 炉霍县| 龙井市| 曲阳县| 荥经县| 濮阳县| 呼玛县| 那曲县| 泰兴市| 五寨县| 通化市| 尼木县| 石嘴山市| 晋江市| 孝感市| 台中市| 满洲里市| 襄城县| 砚山县| 凉山| 探索| 濉溪县| 扎鲁特旗| 兴城市| 武冈市| 金堂县| 通海县| 建始县| 象州县| 宁国市| 黑山县| 吴川市| 永春县| 方山县|