官术网_书友最值得收藏!

2.4.4 視覺問答

視覺問答(Visual Question Answering)簡稱VQA,是近年來非常熱門的一個方向。一般來說,視覺問答系統(tǒng)需要將圖像和問題作為輸入,結合這兩部分信息,產(chǎn)生一條人類語言作為輸出。針對一幅特定的圖像,如果想要機器以自然語言處理(NLP)來回答關于該圖像的某個特定問題,就需要讓機器對圖像的內(nèi)容、問題的含義和意圖、相關的常識有一定的理解。就其本性而言,這是一個多學科研究問題。圖2-5為視覺問答過程圖。

圖2-5 視覺問答過程圖

主站蜘蛛池模板: 天台县| 固安县| 明溪县| 农安县| 凤山县| 白河县| 五原县| 长春市| 浠水县| 上虞市| 安徽省| 方山县| 姜堰市| 常德市| 金乡县| 县级市| 吴旗县| 兴海县| 沙雅县| 凤翔县| 泗洪县| 会东县| 峨山| 宁夏| 平南县| 利辛县| 基隆市| 东明县| 福海县| 资中县| 科技| 诸城市| 龙里县| 唐山市| 肥城市| 孝昌县| 泸西县| 安岳县| 尉犁县| 富裕县| 临湘市|