mg不朽的情缘滴血最大奖

書名：深度學(xué)習(xí)與機器人
作者名：張銳主編
本章字?jǐn)?shù)： 8字
更新時間： 2023-09-07 19:10:29

2.2 圖像識別的任務(wù)

2.2.1 視覺感知

視覺信息的處理始于人眼，人類視覺系統(tǒng)主要由角膜、虹膜、晶狀體及視網(wǎng)膜組成，如圖2.7所示。

圖2.7 人類視覺系統(tǒng)的結(jié)構(gòu)示意圖

人類視覺系統(tǒng)的信息處理機制是一個高度復(fù)雜的過程，科學(xué)家們從生物學(xué)、解剖學(xué)、神經(jīng)生理學(xué)、心理物理學(xué)等方面做了大量的研究，接下來將主要說明視覺關(guān)注機制、亮度及對比敏感度、視覺掩蓋、視覺內(nèi)在推導(dǎo)機制這4個特性。

（1）視覺關(guān)注機制（Visual Attention）：在紛繁復(fù)雜的外界場景中，人類視覺總能快速定位重要的目標(biāo)區(qū)域并進行細(xì)致的分析，而對其他區(qū)域僅進行粗略分析甚至忽視。視覺關(guān)注可由兩種模式引起。一種是由客觀內(nèi)容驅(qū)動的自底向上（bottom-up）關(guān)注模式，那些與周圍區(qū)域具有較大差異性的目標(biāo)容易吸引觀察者的視覺關(guān)注；另一種是由主觀命令指導(dǎo)的自頂而下（top-down）關(guān)注模式，該模式可將視覺關(guān)注強行轉(zhuǎn)移到某一特定區(qū)域。

（2）亮度及對比敏感度：人眼對光強度具有某種自適應(yīng)的調(diào)節(jié)功能，即能通過調(diào)節(jié)感光靈敏度來適應(yīng)范圍很大的亮度，同時這也導(dǎo)致了對絕對亮度的判斷較差。因此人眼對外界目標(biāo)亮度的感知更多依賴于目標(biāo)跟背景之間的亮度差。換言之，人類視覺系統(tǒng)對亮度的分辨能力是有限的，只能分辨具有一定亮度差的目標(biāo)物體，而差異較小的亮度則會被認(rèn)為是一致的；人類視覺系統(tǒng)非常關(guān)注物體的邊緣，往往通過邊緣信息獲取目標(biāo)物體的具體形狀、解讀目標(biāo)物體等。由于視覺系統(tǒng)具有魯棒性，無法分辨一定程度以內(nèi)的邊緣模糊，這種對邊緣模糊的分辨能力則稱為對比靈敏度。

（3）視覺掩蓋：視覺信息間的相互作用或相互干擾將引起視覺掩蓋效應(yīng)。常見的掩蓋效應(yīng)如下所示。

①由于邊緣存在強烈的亮度變化，人眼對邊緣輪廓敏感，而對邊緣的量度誤差不敏感，即對比度掩蓋；

②圖像紋理區(qū)域存在較大的亮度以及方向變化，人眼對該區(qū)域信息的分辨率下降，即紋理掩蓋；

③視頻序列相鄰幀間內(nèi)容的劇烈變動（如目標(biāo)運動或者場景變化），導(dǎo)致人眼分辨率的劇烈下降，即時域的運動掩蓋及切換掩蓋。

（4）視覺內(nèi)在推導(dǎo)機制：最新的人腦研究指出，人類視覺系統(tǒng)并非原原本本地去理解進入人眼的視覺信號，而是存在一套內(nèi)在的推導(dǎo)機制（Internal Generative Mechanism）去解讀輸入的視覺信號。

官术网_书友最值得收藏!

深度學(xué)習(xí)與機器人

2.2 圖像識別的任務(wù)

2.2.1 視覺感知