官术网_书友最值得收藏!

大數(shù)據(jù)處理框架Apache Spark設(shè)計(jì)與實(shí)現(xiàn)
會(huì)員

近年來,以ApacheSpark為代表的大數(shù)據(jù)處理框架在學(xué)術(shù)界和工業(yè)界得到了廣泛的使用。本書以ApacheSpark框架為核心,總結(jié)了大數(shù)據(jù)處理框架的基礎(chǔ)知識(shí)、核心理論、典型的Spark應(yīng)用,以及相關(guān)的性能和可靠性問題。本書分9章,主要包含四部分內(nèi)容。第一部分大數(shù)據(jù)處理框架的基礎(chǔ)知識(shí)(第1~2章):介紹大數(shù)據(jù)處理框架的基本概念、系統(tǒng)架構(gòu)、編程模型、相關(guān)的研究工作,并以一個(gè)典型的Spark應(yīng)用為例概述Spark應(yīng)用的執(zhí)行流程。第二部分Spark大數(shù)據(jù)處理框架的核心理論(第3~4章):介紹Spark框架將應(yīng)用程序轉(zhuǎn)化為邏輯處理流程,進(jìn)而轉(zhuǎn)化為可并行執(zhí)行的物理執(zhí)行計(jì)劃的一般過程及方法。第三部分典型的Spark應(yīng)用(第5章):介紹迭代型的Spark機(jī)器學(xué)習(xí)應(yīng)用和圖計(jì)算應(yīng)用。第四部分大數(shù)據(jù)處理框架性能和可靠性保障機(jī)制(第6~9章):介紹Spark框架的Shuffle機(jī)制、數(shù)據(jù)緩存機(jī)制、錯(cuò)誤容忍機(jī)制、內(nèi)存管理機(jī)制等。

許利杰等 ·數(shù)據(jù)庫 ·11.9萬字

數(shù)據(jù)革命:大數(shù)據(jù)價(jià)值實(shí)現(xiàn)方法、技術(shù)與案例
會(huì)員

在信息技術(shù)革命之后,我們將迎來數(shù)據(jù)革命。在大數(shù)據(jù)的概念、性質(zhì)和價(jià)值已得到政府和社會(huì)的認(rèn)可之后,大家關(guān)注的是數(shù)據(jù)如何獲取,以及有了數(shù)據(jù)以后如何挖掘數(shù)據(jù)的價(jià)值。僅適合特定行業(yè)、滿足特定需求的技術(shù)不足以應(yīng)對(duì)一場(chǎng)革命,大數(shù)據(jù)不但是超出計(jì)算機(jī)軟硬件處理的能力,更是超出人類的認(rèn)知能力。只有實(shí)現(xiàn)對(duì)數(shù)據(jù)的認(rèn)知,利用數(shù)據(jù)輔助決策,才是適合不同行業(yè)數(shù)據(jù)價(jià)值實(shí)現(xiàn)的通用手段。本書描述了數(shù)據(jù)革命的起源、實(shí)現(xiàn)的思路、所用的技術(shù)和要達(dá)到的目標(biāo),針對(duì)當(dāng)今社會(huì)熱點(diǎn)描述了在數(shù)據(jù)時(shí)代的應(yīng)對(duì)之策。本書宏觀和微觀、人文和技術(shù)、啟迪思想和關(guān)注實(shí)用并舉,既適合宏觀層面的領(lǐng)導(dǎo)啟迪思維,提出工作目標(biāo),又適合微觀層次的執(zhí)行人員找到實(shí)現(xiàn)的方法和路徑。本書介紹的理論和技術(shù)均可在智慧城市、智能制造領(lǐng)域?qū)嶋H使用。本書適合政府、企業(yè)決策者和CIO,及其他對(duì)大數(shù)據(jù)應(yīng)用感興趣的人閱讀。

范煜 ·數(shù)據(jù)庫 ·15.1萬字

檢索匹配:深度學(xué)習(xí)在搜索、廣告、推薦系統(tǒng)中的應(yīng)用
會(huì)員

《檢索匹配:深度學(xué)習(xí)在搜索、廣告、推薦系統(tǒng)中的應(yīng)用》主要介紹了深度學(xué)習(xí)在互聯(lián)網(wǎng)核心的三大類業(yè)務(wù)(搜索、廣告、推薦系統(tǒng))檢索系統(tǒng)中的應(yīng)用。書中詳細(xì)講述了檢索匹配的理論、演進(jìn)歷史,以及在業(yè)務(wù)中落地一個(gè)基于深度學(xué)習(xí)算法模型的全流程技能,包括業(yè)務(wù)問題建模、樣本準(zhǔn)備、特征抽取、模型訓(xùn)練和預(yù)測(cè)等,并提供了相應(yīng)的代碼。《檢索匹配:深度學(xué)習(xí)在搜索、廣告、推薦系統(tǒng)中的應(yīng)用》共11章,分為四大部分。第1部分(第1~2章)介紹了深度學(xué)習(xí)的相關(guān)理論知識(shí);第2部分(第3~6章)介紹了業(yè)務(wù)中如何上線一個(gè)深度學(xué)習(xí)模型,包括標(biāo)簽拼接、特征抽取、模型訓(xùn)練和預(yù)測(cè)等流程,采用單機(jī)實(shí)現(xiàn);第3部分(第7~9章)介紹了檢索算法基本理論以及演進(jìn)歷史,并以業(yè)內(nèi)應(yīng)用較為廣泛的雙塔模型DSSM為例進(jìn)行了詳細(xì)理論解析和代碼實(shí)現(xiàn);第4部分(第10~11章)介紹了如何將單機(jī)訓(xùn)練模式改造為分布式訓(xùn)練模式,以加快模型的訓(xùn)練速度,從而應(yīng)對(duì)具有海量樣本的業(yè)務(wù)場(chǎng)景。

康善同編著 ·數(shù)據(jù)庫 ·8.5萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 泰来县| 旬邑县| 化德县| 阜平县| 白水县| 石景山区| 庆阳市| 韶山市| 大同市| 平南县| 辽中县| 行唐县| 贡嘎县| 榆树市| 汉中市| 株洲市| 宿迁市| 工布江达县| 肥城市| 丰都县| 澳门| 图们市| 宝山区| 乌拉特前旗| 曲水县| 横峰县| 河北省| 鄂伦春自治旗| 浑源县| 怀远县| 河间市| 赤城县| 海丰县| 会昌县| 枞阳县| 淮阳县| 伊通| 岳阳县| 磐安县| 镇江市| 盖州市|