- MATLAB計算機視覺經(jīng)典應用
- 丁偉雄編著
- 193字
- 2022-05-06 19:59:46
2.4.4 視覺問答
視覺問答(Visual Question Answering)簡稱VQA,是近年來非常熱門的一個方向。一般來說,視覺問答系統(tǒng)需要將圖像和問題作為輸入,結合這兩部分信息,產(chǎn)生一條人類語言作為輸出。針對一幅特定的圖像,如果想要機器以自然語言處理(NLP)來回答關于該圖像的某個特定問題,就需要讓機器對圖像的內(nèi)容、問題的含義和意圖、相關的常識有一定的理解。就其本性而言,這是一個多學科研究問題。圖2-5為視覺問答過程圖。

圖2-5 視覺問答過程圖
推薦閱讀
- 社會科學數(shù)據(jù)處理軟件應用
- UG NX 12.0中文版完全自學一本通
- Beginning Swift
- Excel圖表與表格實戰(zhàn)技巧精粹
- vtiger CRM Beginner's Guide
- AIGC輔助數(shù)據(jù)分析與挖掘:基于ChatGPT的方法與實踐
- ADOBE FLASH PROFESSIONAL CS6 標準培訓教材
- Photoshop電商設計與產(chǎn)品精修實戰(zhàn)(微視頻版)
- Photoshop手繪從新手到高手
- Moodle Course Conversion: Beginner's Guide
- Adobe創(chuàng)意大學Premiere Pro產(chǎn)品專家認證標準教材(CS6修訂版)
- 構筑敏捷的開發(fā)團隊:微軟Visual Studio 2010實戰(zhàn)兵法
- 從紙片人到虛擬主播:Live2D模型制作教程
- Photoshop CC新媒體圖形圖像設計與制作(全彩慕課版)
- Instant BlueStacks