- Ray分布式機器學習:利用Ray進行大模型的數據處理、訓練、推理和部署
- (德)馬克斯·普佩拉等
- 408字
- 2024-08-06 17:07:28
序
過去10年,機器學習和數據應用程序的計算需求不斷攀升,即使運用了GPU和TPU等硬件加速器,計算量也遠遠超過了單臺服務器或單個處理器的能力。而且,這種趨勢愈演愈烈,迫使人們只能選擇進行分布式處理。不過,創建分布式應用程序一向都是非常困難的。
在過去幾年中,Ray已經成為開發分布式應用程序的首選框架,因為它擁有靈活的內核和一套強大的庫,使開發人員能夠輕松擴展各種工作負載,包括訓練、超參數調優、強化學習(Reinforcement Learning,RL)、模型服務和非結構化數據的批處理。Ray是當下非常受歡迎的開源項目,已有上千家公司利用Ray開發機器學習平臺、推薦系統、欺詐檢測、大模型等各種應用,其中就包括Open AI大名鼎鼎的ChatGPT。
在這本書中,Max Pumperla、Edward Oakes和Richard Liaw用通俗易懂的示例全面介紹了Ray。通過閱讀本書,讀者將掌握Ray的關鍵概念和方法,并能從筆記本計算機擴展到本地或云端的大型集群,開發并快速擴展端到端的機器學習應用程序。
——Ion Stoica
Anyscale和Databricks聯合創始人
加利福尼亞大學伯克利分校教授
2023年1月