官术网_书友最值得收藏!

03 生成算法:實現內容生產智能化

近年來,由AI自動生成的繪畫作品、詩歌作品受到廣泛關注,掀起了AI創作的浪潮。2022年12月,由人工智能研究機構OpenAI推出的人工智能對話聊天機器人ChatGPT在社交媒體上迅速走紅,這預示著人工智能時代已經到來,其中所運用到的關鍵技術就是AIGC。

AIGC的發展速度之快令人驚嘆,根據其繪畫作品來看,僅用了不到一年時間,就從略顯生疏的階段成長到了專業階段,這讓許多領域的資深從業人員感到焦慮。而隨著深度學習模型的完善,AIGC“熟練度”的提高也為大規模的商業化應用提供了條件。

以AIGC圖像生成功能為例,視覺信息基于其容易被感知、被理解與記憶、傳播力強等特點,在多種場景中得到了廣泛應用,并且在網絡中跨平臺、跨社群、跨領域迅速傳播。隨著AI技術的進步,生成高質量的圖像信息成為人工智能系統的一個現象級功能。而要借助AI技術生成文字、圖像、語音、視頻等多種多樣的內容,離不開算法建模。目前GAN模型、CLIP模型[注]、Diffusion模型(擴散模型)等算法模型(如表2-2所示)不斷推陳出新,不僅在性能和穩定性等方面均有越來越優越的表現,其能夠生成的內容的質量也在不斷提高。

表2-2 AIGC相關深度學習模型

(1)GAN模型

2014年,AI深度學習模型“生成對抗網絡”(GAN)問世后,并在多個領域得到應用,同時也作為AI繪畫模型的底層技術,大大推動了AI繪畫的發展。

GAN模型的原理實際上是讓“生成器”(generator)和“判別器”(discriminator)兩個內部程序互相“對抗”,最后輸出二者相平衡的結果。在AI繪畫過程中,由生成器生成圖片,判別器判斷圖片是否屬于正確類別。但這一模型的缺點在于:生成圖像分辨率低;可能生成隨機圖像,對輸出結果控制力不足;輸出的圖像始終是對現有作品的模仿,難以通過文字描述創造出新的圖像。

(2)CLIP模型

2021年1月,OpenAI團隊開源了深度學習模型CLIP,它集成自然語言理解能力和計算機視覺圖像分析技術,通過約40億個“文本—圖像”數據的訓練,以獲得能夠精準匹配文本和圖像的能力。

CLIP模型開源后,加速了其在多個領域的應用推廣,CLIP模型可以嫁接到其他AI應用中,從而為相關領域技術人員的參與提供條件。CLIP可以直接進行圖像和文本之間的對比學習,并決定文字與圖像的匹配程度,例如把狗的圖像和“狗”這一名稱匹配起來。另一方面,供應給CLIP進行學習的“文本—圖像”素材并不來自通常使用的人工標注,而是利用廣泛散布在互聯網上的圖片,這些圖片通常帶有標題或文字描述,相當于互聯網用戶已經完成了標注工作。海量的數據能夠幫助CLIP獲得強大的圖像分析功能,同時節省昂貴的人工標注成本。

(3)Diffusion模型

在AI繪畫的風潮中,Diffusion模型逐漸受到重視。Diffusion模型是圖像生成的另一種解決思路。簡單地說,其原理是先在原始圖像數據中不斷加入高斯噪聲,擾動原始數據分布(即擴散階段);然后在噪聲中逐步修正轉化,構造所需樣本,再通過去噪點來還原數據(即逆擴散階段)。由于是在原始像素信息層面上做計算,去噪生成圖片的迭代過程很慢,且會占用大量內存資源,這導致了模型訓練效率較低,生成高分辨率圖像會帶來高昂的成本。

2022年7月,優化后的Stable Diffusion應用上線測試,它將數據迭代降噪的過程放在一個被稱為“潛在空間”(Latent Space)的低維空間里進行,大幅降低了對算力和內存要求,提高了計算效率和模型訓練效率。這一創新使AIGC技術有了突破性進展。Stable Diffusion應用在不到半年的時間內就出現了大量的二次開發,模型不斷得到優化,應用功能也不斷拓展,有效降低了用戶的使用門檻,目前已經成長為AIGC繪畫領域的最熱門應用。

總體來看,CLIP模型下的海量互聯網圖片為AIGC提供了訓練數據,GAN模型、Diffusion模型則為AIGC提供了算法思路,再到Stable Diffusion模型的算法創新,促使迭代效率、計算資源方面的問題得到解決。由此,我們可以看出,深度學習模型的不斷完善,推動了AIGC繪畫在短時間內有了跨越式發展。

在訓練數據集層面,AIGC繪畫應用的訓練需要大量圖像數據資源。全球非營利機器學習研究機構LAION于2022年3月開放了迄今為止規模最大的多模態“文本—圖像”數據集LAION-5B,以用于AI圖像模型的訓練,LAION-5B包含58.5億個文本—圖像對(Image-Text Pair),涵蓋多種類型的圖像、多種語言的文本,有助于AI模型的訓練和對其進行不同方向的研究。而正是CLIP和LAION的開源,構建了當前AI繪圖應用的核心。開源模式有助于充分調動社會資源,激發社會創造力,使技術創新快速推進,得益于此,AIGC將加快發展成熟。

主站蜘蛛池模板: 吴旗县| 万山特区| 卢氏县| 远安县| 司法| 芦山县| 武隆县| 贡嘎县| 南皮县| 呼玛县| 民县| 二连浩特市| 醴陵市| 柳河县| 会昌县| 卫辉市| 台中县| 阳城县| 白玉县| 乐安县| 嘉峪关市| 庄浪县| 三穗县| 汕头市| 昌图县| 滨州市| 库伦旗| 涟源市| 宁南县| 望城县| 泾阳县| 泗洪县| 商丘市| 冕宁县| 柳江县| 陇川县| 错那县| 贵德县| 昭苏县| 北海市| 宁国市|