- 推薦系統技術原理與實踐
- 文亮
- 787字
- 2023-12-21 17:34:14
1.2 推薦系統的作用和意義
站在互聯網企業的角度,在互聯網應用及用戶規模“爆炸式”增長的時代,如何做到千人千面,為每個用戶提供個性化的服務,從而提升產品的使用率和用戶黏性呢?這是推薦系統需要解決的問題。站在用戶的角度,面對海量的信息,如何高效檢索自己感興趣的內容呢?這也是推薦系統需要解決的問題。
和搜索引擎不同,個性化推薦系統需要依賴用戶的行為數據。對于不同的應用場景,推薦系統的優化目標是不一樣的,比如淘寶這樣的電商平臺關注的主要是用戶點擊后的轉化率(conversion rate,CVR);而YouTube這樣的視頻分享平臺關注的主要是用戶的觀看時長,這是因為YouTube的主要收入源于廣告,增加用戶的觀看時長可以提高廣告的曝光度。
為了更直觀地區分推薦系統在不同應用場景下發揮的作用,本章嘗試用兩個應用場景來描述。
第一個應用場景是今日頭條App新聞推薦頻道(見圖1-2)。2018年1月,今日頭條的算法架構師發文公布了今日頭條的算法原理,文中提到今日頭條關注的目標包含點擊率(click-through rate,CTR)、閱讀時間、點贊、評論、轉發等,而其中最主要的目標就是CTR。這主要是因為點擊量和公司的商業目標直接相關,而通過優化點擊率來提升點擊量是最直接的方法。

圖1-2 今日頭條App新聞推薦頻道
第二個應用場景是YouTube視頻推薦。YouTube是一個視頻網站,成立于2005年,每天要為全球成千上萬的用戶提供高水平的視頻上傳、分發、展示、瀏覽服務。圖1-3所示為YouTube網站首頁,里面包含各種形式的視頻。前面提到過YouTube主要優化的是用戶觀看時長,算法工程師需要根據業務指標調整模型結構和優化目標。早在2016年,YouTube的算法工程師在RecSys會議上發表了論文“Deep Neural Networks for YouTube Recommendations”非常明確地指出了將優化用戶觀看時長設為最終優化目標的建模方法。在隨后2019年的WSDM會議上,另一篇有關強化學習的論文“Top- KOff-Policy Correction for a REINFORCE Recommender System”提出的最終優化目標也是優化用戶觀看時長,模型上線后總的用戶觀看時長提升0.86%。后面的章節將會詳細介紹這兩篇論文的技術細節。

圖1-3 YouTube網站首頁