官术网_书友最值得收藏!

深入淺出存儲(chǔ)引擎
會(huì)員

全書分為3篇:第1篇首先會(huì)詳細(xì)講解存儲(chǔ)引擎的全貌,讓讀者能對(duì)存儲(chǔ)引擎有一個(gè)整體的思維框架,介紹存儲(chǔ)引擎的兩大分支:基于b+樹的存儲(chǔ)引擎、基于lsm派系的存儲(chǔ)引擎,其次對(duì)存儲(chǔ)引擎部分涉及的一些數(shù)據(jù)結(jié)構(gòu)、存儲(chǔ)介質(zhì)等概念做一個(gè)簡要的介紹,為后面內(nèi)容的深入學(xué)習(xí)做鋪墊。第二篇主要介紹基于b+樹的存儲(chǔ)引擎,在理論部分重點(diǎn)回答為什么選擇b+樹做存儲(chǔ)引擎索引結(jié)構(gòu)、b+樹存儲(chǔ)引擎解決哪些問題以及如何解決。在實(shí)踐部分選擇開源社區(qū)中比較有名的boltdb存儲(chǔ)引擎項(xiàng)目來講解其內(nèi)部核心源碼的實(shí)現(xiàn)細(xì)節(jié)。第三篇主要介紹基于lsm派系的存儲(chǔ)引擎,理論部分重點(diǎn)介紹lsmtree中各組件的功能及作用,并在此基礎(chǔ)上擴(kuò)展介紹其他幾類lsm派系存儲(chǔ)引擎的實(shí)現(xiàn)思路,幫助讀者開闊視野,實(shí)踐部分分別以bitcask、moss、leveldb等開源項(xiàng)目的核心源碼來展開,介紹其內(nèi)部實(shí)現(xiàn)細(xì)節(jié)。通過閱讀本書,讀者不僅能對(duì)存儲(chǔ)引擎,尤其是單機(jī)的存儲(chǔ)引擎有一個(gè)整體的框架,而且能對(duì)兩類存儲(chǔ)引擎的實(shí)現(xiàn)思路及背后原理有個(gè)深刻的掌握,只有深刻理解了存儲(chǔ)引擎的背后實(shí)現(xiàn)原理,讀者不僅可以自己動(dòng)手開發(fā)自己的存儲(chǔ)引擎,更可以很快掌握關(guān)系型數(shù)據(jù)庫或者NoSql這類組件的核心原理,對(duì)未來實(shí)際應(yīng)用與開發(fā)提供參考。

文小飛 ·數(shù)據(jù)庫 ·18.3萬字

劍指大數(shù)據(jù):企業(yè)級(jí)數(shù)據(jù)倉庫項(xiàng)目實(shí)戰(zhàn)(電商版)
會(huì)員

本書按照需求規(guī)劃、需求實(shí)現(xiàn)、可視化的流程進(jìn)行編排,通過項(xiàng)目開發(fā)的主要流程,介紹數(shù)據(jù)倉庫的搭建過程。在整個(gè)數(shù)據(jù)倉庫的搭建過程中,本書介紹了主要組件的安裝部署、需求實(shí)現(xiàn)的具體思路,以及各種問題的解決方案等,并在其中穿插了許多與大數(shù)據(jù)和數(shù)據(jù)倉庫相關(guān)的理論知識(shí),包括數(shù)據(jù)倉庫的概念、電商業(yè)務(wù)概述、數(shù)據(jù)倉庫理論和數(shù)據(jù)倉庫建模等。本書共14章,其中,第1~3章是項(xiàng)目的前期準(zhǔn)備階段,主要介紹了數(shù)據(jù)倉庫的概念和搭建需求,并初步搭建了本數(shù)據(jù)倉庫項(xiàng)目所需的基本環(huán)境;第4~7章是項(xiàng)目的核心部分,詳細(xì)介紹了數(shù)據(jù)倉庫的建模理論,并完成了數(shù)據(jù)從采集到分層搭建的全過程,是本書的重點(diǎn)部分;第8~14章是對(duì)數(shù)據(jù)治理各功能模塊的實(shí)現(xiàn),針對(duì)數(shù)據(jù)治理的不同功能需求分模塊進(jìn)行實(shí)現(xiàn)。本書適合具有一定編程基礎(chǔ)并對(duì)大數(shù)據(jù)感興趣的讀者閱讀。通過學(xué)習(xí)本書,讀者可以快速了解數(shù)據(jù)倉庫,全面掌握數(shù)據(jù)倉庫相關(guān)技術(shù)。

尚硅谷教育編著 ·數(shù)據(jù)庫 ·13.8萬字

推薦系統(tǒng)全鏈路設(shè)計(jì):原理解讀與業(yè)務(wù)實(shí)踐
會(huì)員

這是一本指導(dǎo)中高級(jí)從業(yè)者高質(zhì)量落地現(xiàn)代推薦系統(tǒng),圍繞現(xiàn)代推薦系統(tǒng)核心技術(shù)展開深度解讀的專業(yè)工具書,又是一套完整的推薦系統(tǒng)高質(zhì)量落地解決方案。本書基于推薦算法工程師實(shí)際工作場景規(guī)劃內(nèi)容,融合了作者在阿里巴巴、58同城等多家大廠做推薦系統(tǒng)設(shè)計(jì)和優(yōu)化的經(jīng)驗(yàn),是一本方法和實(shí)踐兼具的好書。本書不針對(duì)零基礎(chǔ)從業(yè)者,而是以幫助初級(jí)算法工程師向中高級(jí)進(jìn)階為目標(biāo)。書中從底層剖析推薦系統(tǒng)在實(shí)際業(yè)務(wù)場景中可能出現(xiàn)的各種問題,直指問題的本質(zhì),并按照推薦系統(tǒng)工作流程逐一破解。本書共包括11章:第1章主要介紹推薦系統(tǒng)在各個(gè)互聯(lián)網(wǎng)業(yè)務(wù)場景中的落地情況,包括構(gòu)建推薦系統(tǒng)可能面臨的問題,以及電商、視頻、電子書、廣告系統(tǒng)、信息流、拉活促銷等相關(guān)推薦系統(tǒng)落地指導(dǎo)。第2章介紹現(xiàn)代推薦系統(tǒng)的整體架構(gòu),以幫助讀者從宏觀層面整體了解推薦系統(tǒng)。第3章對(duì)推薦系統(tǒng)所需要的數(shù)據(jù)和特征處理進(jìn)行深度剖析,包括數(shù)據(jù)的收集、非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化清洗、連續(xù)特征處理和離散特征處理等重點(diǎn)內(nèi)容。第4章對(duì)推薦系統(tǒng)的在線指標(biāo)和離線指標(biāo),以及AB實(shí)驗(yàn)的設(shè)計(jì)進(jìn)行深度講解。第5章和第6章,主要對(duì)機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)和調(diào)參進(jìn)行詳細(xì)解讀。這是本書的重點(diǎn),也是很多推薦算法工程師的痛點(diǎn)。這部分包括XGBoost的重要參數(shù)調(diào)優(yōu)、集成學(xué)習(xí)最DA化推薦效果利用、DNN網(wǎng)絡(luò)深度和寬度的影響、激活函數(shù)的選擇、優(yōu)化器選擇、損失函數(shù)、過/欠擬合等內(nèi)容。第7~9章分別對(duì)召回層、精排層、粗排層進(jìn)行詳細(xì)解讀,包括5種召回方案、4種精排建模方式、2種粗排設(shè)計(jì)方案,以及模型可解釋性、近離線計(jì)算等重點(diǎn)內(nèi)容。第10章主要介紹精排模型的分析方法,重排模型(PRM、生成式重排模型)和混排(混排的原理和強(qiáng)化學(xué)習(xí)在混排的應(yīng)用)的原理。第11章主要介紹冷啟動(dòng)鏈路的設(shè)計(jì),主要包括新用戶如何冷啟動(dòng)、新物料如何冷啟動(dòng)和冷啟動(dòng)涉及的流量分配算法。這是本書的特色內(nèi)容。

唐楠烊 ·數(shù)據(jù)庫 ·13.8萬字

QQ閱讀手機(jī)版

主站蜘蛛池模板: 山阴县| 楚雄市| 常州市| 彩票| 胶州市| 五常市| 珲春市| 蓝田县| 桂林市| 炎陵县| 淄博市| 伊吾县| 贺州市| 凤山县| 高平市| 汶川县| 嘉善县| 吐鲁番市| 巴马| 象州县| 息烽县| 二连浩特市| 江都市| 从化市| 佛坪县| 青田县| 阿克苏市| 交城县| 额尔古纳市| 梁平县| 息烽县| 武宣县| 都匀市| 镇雄县| 大化| 明光市| 建平县| 集安市| 响水县| 长乐市| 广饶县|