官术网_书友最值得收藏!

內容簡介

近年來,以Apache Spark為代表的大數據處理框架在學術界和工業界得到了廣泛的使用。本書以Apache Spark框架為核心,總結了大數據處理框架的基礎知識、核心理論、典型的Spark應用,以及相關的性能和可靠性問題。本書分9章,主要包含四部分內容。

第一部分 大數據處理框架的基礎知識(第1~2章):介紹大數據處理框架的基本概念、系統架構、編程模型、相關的研究工作,并以一個典型的Spark應用為例概述Spark應用的執行流程。

第二部分 Spark大數據處理框架的核心理論(第3~4章):介紹Spark框架將應用程序轉化為邏輯處理的流程,進而轉化為可并行執行的物理執行計劃的一般過程及方法。

第三部分 典型的Spark應用(第5章):介紹迭代型的Spark機器學習應用和圖計算應用。

第四部分 大數據處理框架性能和可靠性保障機制(第6~9章):介紹Spark框架的Shuffle機制、數據緩存機制、錯誤容忍機制、內存管理機制等。

本書將幫助大數據系統的用戶、開發者、研究人員等從理論層和實現層深入理解大數據處理框架,也幫助其對大數據處理框架進一步優化改進。

未經許可,不得以任何方式復制或抄襲本書之部分或全部內容。

版權所有,侵權必究。

主站蜘蛛池模板: 三原县| 于都县| 中西区| 大荔县| 苏尼特右旗| 重庆市| 静海县| 赣榆县| 池州市| 栾川县| 通许县| 衡山县| 北流市| 壤塘县| 登封市| 曲靖市| 泸西县| 韶关市| 星子县| 栾川县| 扎鲁特旗| 永登县| 文山县| 桂平市| 淮南市| 兴隆县| 武威市| 政和县| 利川市| 准格尔旗| 施秉县| 长治市| 佳木斯市| 靖西县| 谢通门县| 星子县| 克拉玛依市| 尼玛县| 盐池县| 商都县| 义乌市|