- Transformer自然語言處理實戰:使用Hugging Face Transformers庫構建NLP應用
- (澳)路易斯·湯斯頓等
- 583字
- 2024-05-23 17:22:21
1.7 Transformer的主要挑戰
本章我們已經看到可以用Transformer模型處理的各種NLP任務。只看媒體頭條新聞,有時會覺得Transformer模型能力無限。然而,盡管Transformer模型很有用,但遠未能包打天下。以下是我們將在本書探討的一些與之相關的挑戰:
語言
NLP研究以英語為主。有一些支持其他語言的模型,但很難找到稀有或資源少的語言的預訓練模型。我們將在第4章探討多語言Transformer及其執行零樣本學習跨語言遷移的能力。
數據可用性
盡管我們可以通過遷移學習來顯著減少模型所需的標注訓練數據量,但與人類執行任務所需的量相比,依然差很多。我們將在第9章探討如何處理幾乎沒有標注數據可用的場景。
處理長文本
自注意力在段落長度的文本上效果非常好,但是在處理整個文檔這樣長度的文本時,將變得非常昂貴。第11章將討論緩解這種情況的方法。
不透明度
與其他深度學習模型一樣,Transformer在很大程度上是不透明的。人們很難或不可能解開模型做出某種預測的“原因”。當需要通過這些模型來做出關鍵決策時,這是一個特別艱巨的挑戰。我們將在第2章和第4章探討一些探測Transformer模型誤差的方法。
偏見
Transformer模型主要基于互聯網的文本數據進行預訓練。這會將數據中存在的所有偏見印入模型中。確保我們沒有把種族主義、性別歧視或更糟的偏見引入模型是一項具有挑戰性的任務。我們將在第10章更詳細地討論相關問題。
盡管這些挑戰令人生畏,但是其中許多挑戰都是可以克服的。除了以上提到的章節外,我們將在后面的幾乎每一章中觸及它們。
推薦閱讀
- UG NX10.0從新手到高手
- 爸媽微信e時代
- PS職場達人煉成記:人人都能學會的Photoshop辦公設計技巧
- AutoCAD 2018實用教程(第5版)
- After Effects CC影視后期制作實戰從入門到精通
- MySQL Admin Cookbook LITE: Configuration, Server Monitoring, Managing Users
- DWR Java AJAX Applications
- Illustrator CC 2018中文版入門與提高
- Magento 1.4 Themes Design
- Creo 4.0從入門到精通
- 中文版Photoshop CS6全能修煉圣經(移動學習版)
- 手機/電腦雙平臺剪映短視頻后期編輯從新手到高手
- MATLAB R2024a完全自學一本通
- AutoCAD 2024室內設計從入門到精通(升級版)
- 攝影師的后期必修課(RAW格式篇)