- 元學(xué)習(xí):基礎(chǔ)與應(yīng)用
- 彭慧民編著
- 1716字
- 2021-06-10 14:41:19
2 元學(xué)習(xí)框架
正如在第1章中講到的,元學(xué)習(xí)是基于任務(wù)的,目標(biāo)是對不同的任務(wù)快速地給出準(zhǔn)確的學(xué)習(xí)器。元學(xué)習(xí)算法框架非常靈活,包含很多種不同的思路和方法,這些思路和方法并沒有嚴(yán)格意義上的分類,但是這些思路和方法都實(shí)現(xiàn)了元學(xué)習(xí)的理念——讓機(jī)器學(xué)會學(xué)習(xí)。為了對這些思路和方法進(jìn)行說明,分析它們的發(fā)展理念和應(yīng)用上的優(yōu)勢,筆者將這些方法包含的思想進(jìn)行了如下劃分。
(1)神經(jīng)網(wǎng)絡(luò)適應(yīng)法使用深度神經(jīng)網(wǎng)絡(luò)模型對任務(wù)的特性和共性進(jìn)行建模。視經(jīng)網(wǎng)絡(luò)模型的表示力強(qiáng),通過對數(shù)據(jù)進(jìn)行合適的選擇和關(guān)聯(lián),使用合適的深度學(xué)習(xí)模型,通過調(diào)參來適應(yīng)新任務(wù),得到的元學(xué)習(xí)模型效果十分不錯(cuò)。
(2)度量學(xué)習(xí)適應(yīng)法(Metric-Based Adaptation)使用度量函數(shù)來衡量任務(wù)之間的相似性(Similarity),任務(wù)之間的相似性即任務(wù)之間的共性。度量函數(shù)中含有的變量參數(shù)包括神經(jīng)網(wǎng)絡(luò)特征提取(Feature Extractor)、降維模型(Dimension Reduction)、設(shè)計(jì)的度量函數(shù)包含的參數(shù),度量函數(shù)中的可變參數(shù)反映的是對任務(wù)之間共性的建模。
(3)基礎(chǔ)學(xué)習(xí)器和元學(xué)習(xí)器適應(yīng)法將任務(wù)特性的學(xué)習(xí)和任務(wù)之間共性的學(xué)習(xí)進(jìn)行了解耦。基礎(chǔ)學(xué)習(xí)器的優(yōu)化實(shí)現(xiàn)了對任務(wù)特性的最優(yōu)擬合,元學(xué)習(xí)器的優(yōu)化完成了對任務(wù)之間共性的學(xué)習(xí),任務(wù)特性和任務(wù)共性的學(xué)習(xí)原本是共軛的任務(wù),通過解耦,基礎(chǔ)學(xué)習(xí)器和元學(xué)習(xí)器同時(shí)在這兩項(xiàng)上達(dá)到了最好的效果,并且通過基礎(chǔ)學(xué)習(xí)器和元學(xué)習(xí)器之間的溝通將二者有機(jī)結(jié)合了起來。
(4)貝葉斯元學(xué)習(xí)(Bayesian Meta-Learning)適應(yīng)法將貝葉斯方法融入元學(xué)習(xí)算法,擴(kuò)大了學(xué)習(xí)器的選擇范圍,對分布進(jìn)行抽樣或者近似,加速學(xué)習(xí)器的更新,通過生成式的抽樣方式,加入演化,使用有監(jiān)督學(xué)習(xí)方式對學(xué)習(xí)器進(jìn)行更新。
元學(xué)習(xí)的思路很多,與其他學(xué)習(xí)領(lǐng)域的結(jié)合非常多,初衷是讓機(jī)器學(xué)會使用其他學(xué)習(xí)框架進(jìn)行學(xué)習(xí),讓其他學(xué)習(xí)框架變得更加接近General AI的理念,以下只是很多這些結(jié)合中的部分例子。
(1)在線學(xué)習(xí)每次接收到的流式數(shù)據(jù)都是小樣本數(shù)據(jù),每次接收到的流式數(shù)據(jù)都被看作一個(gè)新任務(wù),機(jī)器需要根據(jù)小樣本新任務(wù)及時(shí)做出反應(yīng),尤其是遇到從未見過的小概率事件,此時(shí)考慮元學(xué)習(xí)提高原模型的泛化能力非常必要。
(2)強(qiáng)化學(xué)習(xí)(Reinforcement Learning)考慮機(jī)器與環(huán)境之間的交互,學(xué)會使用獎(jiǎng)勵(lì)機(jī)制(Reward Utility),采用序貫決策算法(Sequential Decision Making),根據(jù)獎(jiǎng)勵(lì)機(jī)制計(jì)算最優(yōu)的行動策略。考慮到環(huán)境是多變且有時(shí)是無法預(yù)測的,機(jī)器需要快速及時(shí)地更新此時(shí)的最優(yōu)策略,且已有的深度學(xué)習(xí)模型也需要泛化到新的環(huán)境下,元強(qiáng)化學(xué)習(xí)(Meta Reinforcement Learning,Meta RL)是元學(xué)習(xí)和強(qiáng)化學(xué)習(xí)結(jié)合產(chǎn)生的領(lǐng)域。
(3)模仿學(xué)習(xí)(Imitation Learning)是機(jī)器人對另一個(gè)機(jī)器人或者人類的行為進(jìn)行模仿,模仿人類或機(jī)器人的行為,估計(jì)獎(jiǎng)勵(lì)機(jī)制,然后根據(jù)獎(jiǎng)勵(lì)機(jī)制優(yōu)化策略。類似地,元模仿學(xué)習(xí)是元學(xué)習(xí)和模仿學(xué)習(xí)結(jié)合產(chǎn)生的領(lǐng)域,使機(jī)器人通過一次模仿學(xué)會新動作。這意味著機(jī)器人通過一個(gè)模仿數(shù)據(jù)更新了深度模仿學(xué)習(xí)模型,元學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)、在線學(xué)習(xí)往往結(jié)合起來解決機(jī)器人領(lǐng)域的復(fù)雜問題。
(4)聯(lián)邦學(xué)習(xí)(Federated Learning)注重在學(xué)習(xí)過程中的數(shù)據(jù)隱私保護(hù)(Data Privacy),每個(gè)用戶端的數(shù)據(jù)被認(rèn)為是一個(gè)任務(wù)數(shù)據(jù)集,所有用戶端的地位是同等的,不同任務(wù)中的數(shù)據(jù)集是只屬于這個(gè)用戶端的隱私數(shù)據(jù)。元學(xué)習(xí)器的功能是學(xué)習(xí)所有用戶端數(shù)據(jù)的共性,給基礎(chǔ)學(xué)習(xí)器提供初始值。例如,對于基于隨機(jī)梯度下降的基礎(chǔ)學(xué)習(xí)器來說,元學(xué)習(xí)器提供基礎(chǔ)學(xué)習(xí)器的參數(shù)初始值,基礎(chǔ)學(xué)習(xí)器提供任務(wù)數(shù)據(jù)集上目標(biāo)函數(shù)的梯度值。在基礎(chǔ)學(xué)習(xí)器和元學(xué)習(xí)器之間的溝通交流中,基礎(chǔ)學(xué)習(xí)器使用的是用戶端的隱私數(shù)據(jù),這些數(shù)據(jù)不能直接供給元學(xué)習(xí)器,只能將目標(biāo)函數(shù)的梯度值傳遞到元學(xué)習(xí)器。在不同隱私保護(hù)的法律條款要求下,元學(xué)習(xí)器和基礎(chǔ)學(xué)習(xí)器溝通交流的內(nèi)容和范圍受到限制,此時(shí),元學(xué)習(xí)模型變得更加復(fù)雜,元學(xué)習(xí)器在限制信息交流的情況下為新任務(wù)提供基礎(chǔ)學(xué)習(xí)器初始值。
深度學(xué)習(xí)對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行設(shè)計(jì)來達(dá)到模型效果的SOTA新高度,元學(xué)習(xí)領(lǐng)域的研究為提高模型泛化能力和解決實(shí)際問題提供模型框架,在框架中融合了許多現(xiàn)有的機(jī)器學(xué)習(xí)思想。元學(xué)習(xí)中考慮很多基礎(chǔ)理論,給出模型更新理論上的直觀指引,適用于不同的應(yīng)用場景。本書將對這些元學(xué)習(xí)框架進(jìn)行簡要介紹,讀者可通過閱讀這些方法的簡要介紹了解方法的應(yīng)用場景,并且在已有方法的基礎(chǔ)上進(jìn)行修改和組合,形成新的元學(xué)習(xí)方法,以解決讀者遇到的實(shí)際問題。
- 城堡里學(xué)無人機(jī):原理、系統(tǒng)與實(shí)現(xiàn)
- 玩轉(zhuǎn)ChatGPT:秒變AI文案創(chuàng)作高手
- 物聯(lián)網(wǎng)之云:云平臺搭建與大數(shù)據(jù)處理
- 深度學(xué)習(xí)與計(jì)算機(jī)視覺:項(xiàng)目式教材
- 智能浪潮:增強(qiáng)時(shí)代來臨
- 大話機(jī)器智能:一書看透AI的底層運(yùn)行邏輯
- 機(jī)器學(xué)習(xí)與數(shù)據(jù)科學(xué)(基于R的統(tǒng)計(jì)學(xué)習(xí)方法)
- 妙用DeepSeek:創(chuàng)意落地速通指南
- 開啟AI新紀(jì)元(全2冊)
- 通用人工智能:初心與未來
- 智能體時(shí)代
- 新機(jī)器智能
- AI賦能項(xiàng)目經(jīng)理:10倍提升項(xiàng)目管理效率
- DeepSeek快速上手
- 機(jī)器人傳感器及其信息融合技術(shù)