官术网_书友最值得收藏!

2.2 圖像識別的任務(wù)

2.2.1 視覺感知

視覺信息的處理始于人眼,人類視覺系統(tǒng)主要由角膜、虹膜、晶狀體及視網(wǎng)膜組成,如圖2.7所示。

圖2.7 人類視覺系統(tǒng)的結(jié)構(gòu)示意圖

人類視覺系統(tǒng)的信息處理機制是一個高度復(fù)雜的過程,科學(xué)家們從生物學(xué)、解剖學(xué)、神經(jīng)生理學(xué)、心理物理學(xué)等方面做了大量的研究,接下來將主要說明視覺關(guān)注機制、亮度及對比敏感度、視覺掩蓋、視覺內(nèi)在推導(dǎo)機制這4個特性。

(1)視覺關(guān)注機制(Visual Attention):在紛繁復(fù)雜的外界場景中,人類視覺總能快速定位重要的目標(biāo)區(qū)域并進行細(xì)致的分析,而對其他區(qū)域僅進行粗略分析甚至忽視。視覺關(guān)注可由兩種模式引起。一種是由客觀內(nèi)容驅(qū)動的自底向上(bottom-up)關(guān)注模式,那些與周圍區(qū)域具有較大差異性的目標(biāo)容易吸引觀察者的視覺關(guān)注;另一種是由主觀命令指導(dǎo)的自頂而下(top-down)關(guān)注模式,該模式可將視覺關(guān)注強行轉(zhuǎn)移到某一特定區(qū)域。

(2)亮度及對比敏感度:人眼對光強度具有某種自適應(yīng)的調(diào)節(jié)功能,即能通過調(diào)節(jié)感光靈敏度來適應(yīng)范圍很大的亮度,同時這也導(dǎo)致了對絕對亮度的判斷較差。因此人眼對外界目標(biāo)亮度的感知更多依賴于目標(biāo)跟背景之間的亮度差。換言之,人類視覺系統(tǒng)對亮度的分辨能力是有限的,只能分辨具有一定亮度差的目標(biāo)物體,而差異較小的亮度則會被認(rèn)為是一致的;人類視覺系統(tǒng)非常關(guān)注物體的邊緣,往往通過邊緣信息獲取目標(biāo)物體的具體形狀、解讀目標(biāo)物體等。由于視覺系統(tǒng)具有魯棒性,無法分辨一定程度以內(nèi)的邊緣模糊,這種對邊緣模糊的分辨能力則稱為對比靈敏度。

(3)視覺掩蓋:視覺信息間的相互作用或相互干擾將引起視覺掩蓋效應(yīng)。常見的掩蓋效應(yīng)如下所示。

①由于邊緣存在強烈的亮度變化,人眼對邊緣輪廓敏感,而對邊緣的量度誤差不敏感,即對比度掩蓋;

②圖像紋理區(qū)域存在較大的亮度以及方向變化,人眼對該區(qū)域信息的分辨率下降,即紋理掩蓋;

③視頻序列相鄰幀間內(nèi)容的劇烈變動(如目標(biāo)運動或者場景變化),導(dǎo)致人眼分辨率的劇烈下降,即時域的運動掩蓋及切換掩蓋。

(4)視覺內(nèi)在推導(dǎo)機制:最新的人腦研究指出,人類視覺系統(tǒng)并非原原本本地去理解進入人眼的視覺信號,而是存在一套內(nèi)在的推導(dǎo)機制(Internal Generative Mechanism)去解讀輸入的視覺信號。

主站蜘蛛池模板: 朝阳区| 永定县| 肃南| 博爱县| 二手房| 怀安县| 富蕴县| 康保县| 桃江县| 安陆市| 上杭县| 谢通门县| 拉孜县| 上蔡县| 丹凤县| 富蕴县| 莆田市| 理塘县| 贡嘎县| 兴化市| 报价| 醴陵市| 景宁| 孝昌县| 嘉义市| 舞阳县| 维西| 含山县| 安陆市| 昂仁县| 丹凤县| 彰化市| 来安县| 沭阳县| 兴安盟| 抚顺市| 土默特左旗| 汤阴县| 涟水县| 保亭| 盐边县|