官术网_书友最值得收藏!

1.2 什么是MLOps

為什么機器學習生產沒有快10倍?大多數解決問題的機器學習系統都涉及機器學習建模的所有環節:數據工程、數據處理、問題可行性和業務一致性。一個問題是關注代碼和技術細節,而不是用機器學習解決業務問題。還缺乏自動化手段和HiPPO的氛圍。最后,很多機器學習系統并不是云原生的,它們使用學術數據集與軟件包,從而無法擴展到大規模問題上。

反饋循環越快(參見Kaizen),關注諸如最近COVID的快速檢測、探測現實世界中掩碼與非掩碼的計算機視覺解決方案、快速藥物發現這類業務問題的時間就越多。解決這些問題的技術是存在的,但這些解決方案在現實世界不可用。為什么會這樣?

什么是Kaizen?在日語中這個詞意味著改進。Kaizen作為一種軟件管理哲學,它源于二戰結束后的日本汽車工業。它是很多其他技術的基礎,如看板、根因分析與5問法、六西格瑪。要實踐Kaizen,必須對世界狀態進行準確與現實的評估,并要在追求卓越的過程中每日追求增量的進步。

模型之所以沒有進入生產環境是因為MLOps作為關鍵行業標準的推動近期才出現。MLOps和DevOps是同宗的,因為DevOps本來就需要自動化。如果它不是自動化的,那么它就是壞掉的。類似地,對于MLOps,系統中不能存在人工操作的組件。自動化的歷史表明人在執行重復性任務時價值最低,但是在作為設計者和專門人才利用技術時價值最高。同樣,開發人員、模型和運營之間的協調必須依靠透明的團隊精神和健康的協作。我們可以把MLOps當成用DevOps方法自動化機器學習的過程。

什么是DevOps?它結合了最佳實踐,包括微服務、持續集成和持續交付,消除運營、開發和團隊合作之間的障礙。你可在我們的Python for DevOps(O'Reilly)一書中閱讀有關DevOps的更多信息。Python是腳本程序、DevOps和機器學習的主要語言。因此,本書側重于Python,就像DevOps書側重于Python。

對于MLOps,不僅軟件工程過程需要完全自動化,數據和建模也是如此。模型訓練和部署作為一個新的環節被添加到傳統的DevOps生命周期中。最后,額外的監控和儀器必須能解釋破壞了自上次訓練以來數據之間的變化,就像數據漂移。

將機器學習模型投入生產存在的一個根本問題是數據科學行業的不成熟。軟件行業已經用DevOps解決類似問題,現在機器學習社區也開始應用MLOps。讓我們深入了解如何做到這一點。

主站蜘蛛池模板: 分宜县| 夹江县| 杂多县| 三门县| 新泰市| 炉霍县| 正宁县| 定安县| 玉树县| 加查县| 镇巴县| 吴川市| 临安市| 抚顺县| 伊吾县| 洱源县| 隆回县| 肃宁县| 西畴县| 莱芜市| 阿拉尔市| 横山县| 奈曼旗| 隆子县| 乌兰察布市| 光泽县| 芒康县| 蛟河市| 拉萨市| 方正县| 蓬安县| 宁强县| 普洱| 津南区| 梅河口市| 淮阳县| 连平县| 枣强县| 锡林郭勒盟| 罗源县| 德清县|