官术网_书友最值得收藏!

數據科學工程實踐:用戶行為分析與建模、A/B實驗、SQLFlow
會員

這是一本將數據科學三要素——商業理解、量化模型、數據技術全面打通的實戰性著作,是來自騰訊、滴滴、快手等一線互聯網企業的數據科學家、數據分析師和算法工程師的經驗總結,得到了SQLFlow創始人以及騰訊、網易、快手、貝殼找房、谷歌等企業的專家一致好評和推薦。全書三個部分,內容相對獨立,既能幫助初學者建立知識體系,又能幫助從業者解決商業中的實際問題,還能幫助有經驗的專家快速掌握數據科學的Z新技術和發展動向。內容圍繞非實驗環境下的觀測數據的分析、實驗的設計和分析、自助式數據科學平臺3大主題展開,涉及統計學、經濟學、機器學習、實驗科學等多個領域,包含大量常用的數據科學方法、簡潔的代碼實現和經典的實戰案例。第1部分(第1~6章)觀測數據的分析技術講解了非實驗環境下不同觀測數據分析場景所對應的分析框架、原理及實際操作,包括消費者選擇偏好分析、消費者在時間維度上的行為分析、基于機器學習的用戶生命周期價值預測、基于可解釋模型技術的商業場景挖掘、基于矩陣分解技術的用戶行為規律發現與挖掘,以及在不能進行實驗分析時如何更科學地進行全量評估等內容。第二部分(第7~9章)實驗設計和分析技術從A/B實驗的基本原理出發,深入淺出地介紹了各種商業場景下進行實驗設計需要參考的原則和運用的方法,尤其是在有樣本量約束條件下提升實驗效能的方法及商業場景限制導致的非傳統實驗設計。第三部分(第10~12章)自助式數據科學平臺SQLFlow針對性的講解了開源的工程化的自助式數據科學平臺SQLFlow,并通過系統配置、黑盒模型的解讀器應用、聚類分析場景等案例幫助讀者快速了解這一面向未來的數據科學技術。

謝梁 繆瑩瑩 高梓堯 王子玲等 ·數據庫 ·13萬字

推薦系統全鏈路設計:原理解讀與業務實踐
會員

這是一本指導中高級從業者高質量落地現代推薦系統,圍繞現代推薦系統核心技術展開深度解讀的專業工具書,又是一套完整的推薦系統高質量落地解決方案。本書基于推薦算法工程師實際工作場景規劃內容,融合了作者在阿里巴巴、58同城等多家大廠做推薦系統設計和優化的經驗,是一本方法和實踐兼具的好書。本書不針對零基礎從業者,而是以幫助初級算法工程師向中高級進階為目標。書中從底層剖析推薦系統在實際業務場景中可能出現的各種問題,直指問題的本質,并按照推薦系統工作流程逐一破解。本書共包括11章:第1章主要介紹推薦系統在各個互聯網業務場景中的落地情況,包括構建推薦系統可能面臨的問題,以及電商、視頻、電子書、廣告系統、信息流、拉活促銷等相關推薦系統落地指導。第2章介紹現代推薦系統的整體架構,以幫助讀者從宏觀層面整體了解推薦系統。第3章對推薦系統所需要的數據和特征處理進行深度剖析,包括數據的收集、非結構化數據的結構化清洗、連續特征處理和離散特征處理等重點內容。第4章對推薦系統的在線指標和離線指標,以及AB實驗的設計進行深度講解。第5章和第6章,主要對機器學習和神經網絡的設計和調參進行詳細解讀。這是本書的重點,也是很多推薦算法工程師的痛點。這部分包括XGBoost的重要參數調優、集成學習最DA化推薦效果利用、DNN網絡深度和寬度的影響、激活函數的選擇、優化器選擇、損失函數、過/欠擬合等內容。第7~9章分別對召回層、精排層、粗排層進行詳細解讀,包括5種召回方案、4種精排建模方式、2種粗排設計方案,以及模型可解釋性、近離線計算等重點內容。第10章主要介紹精排模型的分析方法,重排模型(PRM、生成式重排模型)和混排(混排的原理和強化學習在混排的應用)的原理。第11章主要介紹冷啟動鏈路的設計,主要包括新用戶如何冷啟動、新物料如何冷啟動和冷啟動涉及的流量分配算法。這是本書的特色內容。

唐楠烊 ·數據庫 ·13.8萬字

QQ閱讀手機版

主站蜘蛛池模板: 伊吾县| 前郭尔| 慈溪市| 星子县| 海安县| 汉中市| 玛多县| 江永县| 海伦市| 神木县| 洞头县| 井研县| 敦化市| 曲周县| 靖宇县| 资中县| 崇礼县| 梅州市| 崇礼县| 榆树市| 建宁县| 华容县| 区。| 同德县| 河津市| 进贤县| 肇州县| 祁门县| 扶沟县| 喀什市| 正定县| 庄河市| 晋城| 娄烦县| 邮箱| 晋中市| 时尚| 文水县| 子长县| 蕉岭县| 棋牌|