- 深度學習從0到1
- 覃秉豐編著
- 917字
- 2021-07-23 17:52:19
1.4 深度學習的應用
深度學習最早興起于圖像識別,在最近幾年可以說是已經深入各行各業。深度學習在計算機視覺、語音識別、自然語言處理、機器人控制、生物信息、醫療、法律、金融、推薦系統、搜索引擎、電腦游戲和娛樂等領域均有應用。
圖像識別——圖像識別可以說是深度學習最早實現突破性成就的領域。如今計算機對圖片的識別能力已經跟人類不相上下。我們把一張圖片輸入神經網絡,經過網絡的運算,最后可以得到圖片的分類。如圖1.15所示,我們可以看到,對于每一張圖片,神經網絡都給出了5個最有可能的分類,排在最上面的可能性最大。圖1.15中的置信度表示的就是該圖片的概率值。

圖1.15 圖像識別
目標檢測——利用深度學習我們還可以識別圖片中的特定物體,然后對該物體進行標注,如圖1.16所示。

圖1.16 目標檢測[1]
人臉識別——深度學習還可以識別圖像中的人臉,判斷是男人還是女人,判斷人的年齡,判斷圖像中的人是誰等,如圖1.17所示。

圖1.17 人臉識別
目標分割——目標分割可以識別出圖中的物體,并且可以劃分出物體的邊界,如圖1.18所示。
描述圖片——把一張圖片輸入神經網絡中,就可以輸出對這張圖片的文字描述,如圖1.19所示。

圖1.18 目標分割[2]

圖1.19 圖片描述
圖片風格轉換——利用深度學習實現一張圖片加上另一張圖片的風格,然后生成一張新的圖片,如圖1.20所示。
語音識別——深度學習還可以用來識別人說的話,把語音數據轉換為文本數據,如圖1.21所示。
文本分類——使用深度學習對多個文本進行分類,比如判斷一個評論是好評還是差評,或者判斷一篇新聞是屬于娛樂新聞、體育新聞還是科技新聞,如圖1.22所示。

圖1.20 圖片風格轉換[3]

圖1.21 語音識別

圖1.22 文本分類
機器翻譯——使用深度學習進行機器翻譯,如圖1.23所示。

圖1.23 機器翻譯
詩詞生成——把一個詩詞的題目傳入神經網絡,就可以生成一篇詩詞,如圖1.24所示,其就是AI寫的一首詩。雖然這首詩有些看不太懂,但是已經“有內味了”。

圖1.24 詩詞生成
圖像生成——深度學習還可以用來生成圖片。比如我們可以打開網站https://make.girls.moe/#/,設置好動漫人物的頭發顏色、頭發長度、眼睛顏色、是否戴帽子等信息就可以生成符合條件的動漫人物,并且可以生成無數張不重復的照片,如圖1.25所示。

圖1.25 圖像生成
這里只是列舉了非常少量的例子,深度學習的已經逐漸深入各行各業,深入我們的生活中。