官术网_书友最值得收藏!

前言

近幾年,大數據技術迅猛發展,在各個領域都得到廣泛關注,推動了新一輪技術發展浪潮。大數據技術的發展,已被列為國家重大發展戰略。到2016年為止,大數據已經是第三次出現在政府工作報告中;而在過去的幾年里,無論是聚焦大數據發展的《促進大數據發展行動綱要》,還是“十三五”規劃中都深刻體現了政府對大數據產業和應用發展的重視。

大數據發展一般會經歷擴散期、加速期、轉型期、成熟期。目前國內發展還處于第二和第三階段,數據與傳統產業的融合還處于起步階段,各行業對大數據分析和挖掘的應用還不理想。但隨著市場競爭的加劇,各行業對大數據技術研究的熱情越來越高,未來幾年,各領域的數據分析都將大規模應用。本書在注重大數據時代應用環境前提下,考慮大數據處理分析需求多樣、復雜的基本情況,從初學者角度出發,以輕量級理論、豐富的實例介紹大數據常用計算模式的各種系統和工具,注重大數據分析實踐操作。本書主要特點如下。

1.內容豐富多樣,對比學習

考慮到當前大數據發展處于起步并逐步趕超先進的階段,其應用領域豐富廣泛,本書除了介紹典型開源大數據處理框架——Apache Hadoop框架之外,還介紹了批處理計算Spark、流式計算及典型工具(Storm、Apex、Flink)和事件流及典型工具(Druid)等,讓讀者了解不同類型工具系統的特點,并配以豐富簡單易上手的實例,讓讀者能夠切實體會和掌握各種類型工具的特點和應用。

2.輕量級理論,重在培養動手實踐能力

為了讓讀者能夠快速掌握技能并保證理論能夠適應實踐要求,本書本著輕量級理論原則,給出豐富的實例、詳實的實驗操作步驟,使讀者易于配置的實驗環境,讓讀者能夠快速上手,在做中學。

3.有效結合實際應用

除了各章節給出的配套實例外,本書在最后還給出電商領域的大數據分析綜合實例,以實際行業應用案例說明大數據處理和計算工具的使用,并進一步闡述大數據行業應用的重大意義。

為了方便讀者學習和使用,本書中所有實驗操作和實驗代碼均經過實際運行測試,可直接使用運行。

本書由陳志德、曾燕清、李翔宇共同完成,陳志德統編全稿。由于編者水平有限,書中不妥或錯誤之處在所難免,不當之處敬請讀者批評指正,并將反饋意見發送到郵箱feedbackbigdata@163.com,以便我們及時修正完善。

編者

2016年10月

主站蜘蛛池模板: 舞钢市| 吉林市| 富裕县| 景德镇市| 云霄县| 古浪县| 天柱县| 宣恩县| 珠海市| 玉门市| 寿光市| 昔阳县| 巩义市| 旬邑县| 安徽省| 钟祥市| 宁阳县| 大姚县| 东城区| 海原县| 从化市| 土默特右旗| 秦安县| 临颍县| 永州市| 太和县| 杨浦区| 察哈| 兰坪| 玉门市| 百色市| 新竹市| 沾益县| 沁阳市| 石景山区| 高台县| 云浮市| 米脂县| 赞皇县| 乌兰察布市| 巴彦淖尔市|