- 深度學(xué)習(xí)與機器人
- 張銳主編
- 8字
- 2023-09-07 19:10:29
2.2 圖像識別的任務(wù)
2.2.1 視覺感知
視覺信息的處理始于人眼,人類視覺系統(tǒng)主要由角膜、虹膜、晶狀體及視網(wǎng)膜組成,如圖2.7所示。

圖2.7 人類視覺系統(tǒng)的結(jié)構(gòu)示意圖
人類視覺系統(tǒng)的信息處理機制是一個高度復(fù)雜的過程,科學(xué)家們從生物學(xué)、解剖學(xué)、神經(jīng)生理學(xué)、心理物理學(xué)等方面做了大量的研究,接下來將主要說明視覺關(guān)注機制、亮度及對比敏感度、視覺掩蓋、視覺內(nèi)在推導(dǎo)機制這4個特性。
(1)視覺關(guān)注機制(Visual Attention):在紛繁復(fù)雜的外界場景中,人類視覺總能快速定位重要的目標(biāo)區(qū)域并進行細(xì)致的分析,而對其他區(qū)域僅進行粗略分析甚至忽視。視覺關(guān)注可由兩種模式引起。一種是由客觀內(nèi)容驅(qū)動的自底向上(bottom-up)關(guān)注模式,那些與周圍區(qū)域具有較大差異性的目標(biāo)容易吸引觀察者的視覺關(guān)注;另一種是由主觀命令指導(dǎo)的自頂而下(top-down)關(guān)注模式,該模式可將視覺關(guān)注強行轉(zhuǎn)移到某一特定區(qū)域。
(2)亮度及對比敏感度:人眼對光強度具有某種自適應(yīng)的調(diào)節(jié)功能,即能通過調(diào)節(jié)感光靈敏度來適應(yīng)范圍很大的亮度,同時這也導(dǎo)致了對絕對亮度的判斷較差。因此人眼對外界目標(biāo)亮度的感知更多依賴于目標(biāo)跟背景之間的亮度差。換言之,人類視覺系統(tǒng)對亮度的分辨能力是有限的,只能分辨具有一定亮度差的目標(biāo)物體,而差異較小的亮度則會被認(rèn)為是一致的;人類視覺系統(tǒng)非常關(guān)注物體的邊緣,往往通過邊緣信息獲取目標(biāo)物體的具體形狀、解讀目標(biāo)物體等。由于視覺系統(tǒng)具有魯棒性,無法分辨一定程度以內(nèi)的邊緣模糊,這種對邊緣模糊的分辨能力則稱為對比靈敏度。
(3)視覺掩蓋:視覺信息間的相互作用或相互干擾將引起視覺掩蓋效應(yīng)。常見的掩蓋效應(yīng)如下所示。
①由于邊緣存在強烈的亮度變化,人眼對邊緣輪廓敏感,而對邊緣的量度誤差不敏感,即對比度掩蓋;
②圖像紋理區(qū)域存在較大的亮度以及方向變化,人眼對該區(qū)域信息的分辨率下降,即紋理掩蓋;
③視頻序列相鄰幀間內(nèi)容的劇烈變動(如目標(biāo)運動或者場景變化),導(dǎo)致人眼分辨率的劇烈下降,即時域的運動掩蓋及切換掩蓋。
(4)視覺內(nèi)在推導(dǎo)機制:最新的人腦研究指出,人類視覺系統(tǒng)并非原原本本地去理解進入人眼的視覺信號,而是存在一套內(nèi)在的推導(dǎo)機制(Internal Generative Mechanism)去解讀輸入的視覺信號。
- 機器人構(gòu)建實戰(zhàn)
- 機器學(xué)習(xí)的算法分析和實踐
- 機器人設(shè)計與制作
- 人工智能3.0:大智若愚
- TensorFlow知識圖譜實戰(zhàn)
- 為機器立心(通用人工智能的中國藍(lán)圖系列)
- 深度學(xué)習(xí)與計算機視覺:項目式教材
- COMSOL Multiphysics工程實踐與理論仿真
- 妙用DeepSeek:創(chuàng)意落地速通指南
- 智能汽車軟件功能安全
- Unity虛擬現(xiàn)實開發(fā)實戰(zhàn)
- 終極智能:感知機器與人工智能的未來
- 機器學(xué)習(xí)實踐指南:案例應(yīng)用解析
- 知識圖譜實戰(zhàn):構(gòu)建方法與行業(yè)應(yīng)用
- 3小時吃透DeepSeek智能辦公