官术网_书友最值得收藏!

1.1 視覺基礎(chǔ)

計(jì)算機(jī)視覺基于人類視覺,并與人類視覺密切相關(guān)。

1.1.1 視覺

人類視覺一般簡稱為視覺。視覺是人類用眼睛觀測周圍世界,并用人腦感知周圍世界的一種能力。視覺系統(tǒng)提供了觀察世界、認(rèn)知世界的重要功能手段,是人類從外界獲得信息的主要途徑。據(jù)統(tǒng)計(jì),人類從外界獲得的信息約有75%來自視覺系統(tǒng),這既說明視覺信息量巨大,也表明人類對視覺信息有較高的利用率。

先簡單介紹幾個(gè)常用的視覺術(shù)語。

眼睛(人眼):人對可見光照起反應(yīng)的一種視覺器官,主要包括晶狀體(眼球)、瞳孔、視網(wǎng)膜等,是接收入射光的感光器官。一般在眼睛——相機(jī)的比擬中,常將晶狀體、瞳孔和視網(wǎng)膜與鏡頭、光圈和成像表面相對應(yīng)。

視網(wǎng)膜:晶狀體周壁上最后面的一層薄膜,是眼睛后面的光敏表面層,含有光感受器和神經(jīng)組織網(wǎng)絡(luò)。視網(wǎng)膜上分布著感光細(xì)胞,可將入射光轉(zhuǎn)化為神經(jīng)脈沖并送至大腦。視網(wǎng)膜中心也稱為中央凹,此處感光細(xì)胞最集中,是眼睛內(nèi)對光最敏感的區(qū)域。

大腦(人腦):視覺系統(tǒng)中處理信息的功能單元。大腦利用從視網(wǎng)膜傳感器中獲得的、經(jīng)過視神經(jīng)傳到腦內(nèi)的神經(jīng)信號生成神經(jīng)功能模式,這些模式最終被感知為圖像。

可見光:眼睛能感受到的在一定波長范圍內(nèi)的電磁波。對正常人來說,這個(gè)范圍最大為380~780nm,最小為400~700nm,對應(yīng)的彩色大致在亮藍(lán)白色與暗紅色之間。

彩色顏色):視覺系統(tǒng)對不同頻率或不同波長的電磁波有不同的感知結(jié)果。彩色既是一種物理現(xiàn)象,也是一種心理現(xiàn)象。

視力:視覺器官(眼睛)的空間分辨能力,也是對物體大小、形狀等的精細(xì)辨別能力。視力通常以可分辨視角的倒數(shù)(1/度)為單位。正常人的最小可辨視角閾值約為0.5。

視野視場):人在頭部和眼球固定不動(dòng)的情況下,在觀看正前方物體時(shí)所能看見的空間范圍。正常人的最大視覺范圍約為200°×135°(寬×高)。

1.1.2 視感覺和視知覺

從語義角度來看,可認(rèn)為“視覺”包括“視”和“覺”兩部分,所以可進(jìn)一步將視覺分為“視感覺”和“視知覺”。

人類的視感覺主要發(fā)生于物體在視網(wǎng)膜上成像的過程中,主要涉及物理、化學(xué)等相關(guān)原理和理論,從分子的角度來理解人們對光(可見輻射)的基本性質(zhì)(如亮度、顏色)的反應(yīng)。在視感覺中,主要關(guān)心的內(nèi)容有①光的物理特性,如光量子、光波、光譜等;②光刺激視覺感受器官的程度,涉及光度學(xué)、眼睛構(gòu)造、視覺適應(yīng)、視覺的強(qiáng)度和靈敏度、視覺的時(shí)空特性等;③光在作用于視網(wǎng)膜后,經(jīng)視覺系統(tǒng)加工而產(chǎn)生的感覺,如明亮程度、色調(diào)等。

人類的視知覺主要研究人在從客觀世界接收視覺刺激后如何將物像轉(zhuǎn)變?yōu)樯窠?jīng)反應(yīng),以及反應(yīng)所采用的方式和獲得的結(jié)果(如人在受到強(qiáng)光照射時(shí),會(huì)瞳孔縮小或閉眼等),研究如何通過視覺形成關(guān)于外在空間的表象(如物體尺寸的大小、表面的平滑/粗糙等),所以兼有心理因素。視知覺是在人腦神經(jīng)中樞內(nèi)進(jìn)行的一組活動(dòng),它把視野中一些分散的刺激加以組織,構(gòu)成具有一定形狀和結(jié)構(gòu)的整體,并據(jù)此認(rèn)識(shí)客觀世界(如觀察到地面上的馬和馬上的人,從而判斷人在騎馬行進(jìn))。人利用視覺感知的客觀事物具有多種特性,對它們進(jìn)行光刺激,視覺系統(tǒng)會(huì)產(chǎn)生不同形式的反應(yīng),所以視知覺又可分為亮(明)度知覺、顏色知覺、形狀知覺、空間知覺、運(yùn)動(dòng)知覺等。

從認(rèn)知角度來看,人類不僅需要從外界獲得信息,還需要對信息進(jìn)行加工,之后才能做出判斷和決策,因而視覺功能可分為視感覺和視知覺兩個(gè)層次。視感覺處于較低層次,主要接收外部刺激;視知覺則處于較高層次,將外部刺激轉(zhuǎn)化為有意義的內(nèi)容。一般來說,視感覺基本不加區(qū)別地接收外部刺激,而視知覺則要確定外部刺激的哪些部分應(yīng)組合成所關(guān)心的“目標(biāo)”,或?qū)ν獠看碳ぴ吹男再|(zhì)進(jìn)行分析并做出判斷,從而了解客觀世界。

1.1.3 視覺過程

視覺是一個(gè)復(fù)雜的過程,涉及光學(xué)、幾何學(xué)、化學(xué)、生理學(xué)、心理學(xué)等多個(gè)方面的知識(shí)。例如,從光源發(fā)出輻射到大腦獲得場景信息涉及一系列步驟(見圖1-1):光源照射到客觀世界的物體上并發(fā)生反射(可能還有折射、透射),遵循一定的光學(xué)規(guī)律進(jìn)入人眼;人眼接收到的輻射能量會(huì)經(jīng)過人眼內(nèi)的折光系統(tǒng)(包括晶狀體、瞳孔、角膜、房水、玻璃體等)并最終按照幾何規(guī)律成像于視網(wǎng)膜上;視網(wǎng)膜上的感光細(xì)胞受到刺激并產(chǎn)生響應(yīng),將光能量根據(jù)化學(xué)反應(yīng)的規(guī)律轉(zhuǎn)換為相應(yīng)的神經(jīng)信號(將光刺激所包含的視覺信息轉(zhuǎn)變成神經(jīng)信息);這些神經(jīng)信號按照生理學(xué)的規(guī)律在人體的神經(jīng)通道內(nèi)傳遞,將信息送入大腦;在大腦視覺中樞的處理和加工下,結(jié)合心理學(xué)的規(guī)律,人才能獲得對場景的認(rèn)知、解釋信息(如外界物體的大小、位置、明暗、顏色、動(dòng)靜、趨向、態(tài)勢等)。

圖1-1 視覺流程和步驟示意

通常可將視覺過程分為三個(gè)子過程:光學(xué)過程、化學(xué)過程和神經(jīng)處理過程。

1. 光學(xué)過程

光學(xué)過程的物理基礎(chǔ)是人眼。從成像的角度可將眼睛和相機(jī)進(jìn)行簡單比擬。眼睛本身是一個(gè)平均直徑約為20mm的球體,球體前端有一個(gè)晶狀體,對應(yīng)相機(jī)的鏡頭;晶狀體前的瞳孔對應(yīng)相機(jī)的光圈,控制進(jìn)入眼睛的光通量;球體內(nèi)壁有一層視網(wǎng)膜,它是含有光感受器和神經(jīng)組織網(wǎng)絡(luò)的薄膜,對應(yīng)相機(jī)中傳感器的感光面(早期相機(jī)內(nèi)的膠片)。外來光線在通過瞳孔后被晶狀體聚焦而在視網(wǎng)膜上成像。光學(xué)過程基本確定了成像的尺寸,這可借助圖1-2來說明。晶狀體的屈光能力從最小變到最大時(shí),晶狀體聚焦中心和視網(wǎng)膜間的距離可以從約17mm變到約14mm。以17mm為例,在觀察一個(gè)100m外高度為15m的柱狀物體時(shí),如果用x表示以mm為單位的視網(wǎng)膜上的成像尺寸,根據(jù)圖1-2中的幾何關(guān)系,15/100=x/17,可算得x=2.55(mm)。

圖1-2 光學(xué)過程確定成像尺寸示意

2. 化學(xué)過程

視網(wǎng)膜表面分布著許多光接收細(xì)胞(感光單元),它們可接收光的能量并形成視覺圖案。光接收細(xì)胞分為兩類:錐細(xì)胞柱細(xì)胞

每個(gè)眼睛內(nèi)有600萬~700萬個(gè)錐細(xì)胞,它們對顏色很敏感。錐細(xì)胞又可分為三種,對入射的輻射有不同的頻譜響應(yīng)曲線,三種錐細(xì)胞的共同作用是使人感知到彩色。人類能借助錐細(xì)胞區(qū)分細(xì)節(jié)的主要原因是每個(gè)錐細(xì)胞各自連接自己的神經(jīng)末梢。錐細(xì)胞視覺也稱為適亮視覺,因?yàn)殄F細(xì)胞僅在較亮的環(huán)境下工作。

每個(gè)眼睛內(nèi)的柱細(xì)胞要比錐細(xì)胞多得多,在視網(wǎng)膜表面上有7500萬~15000萬個(gè)柱細(xì)胞。柱細(xì)胞分布面大,但分辨率比較低,這是因?yàn)閹讉€(gè)柱細(xì)胞連接同一個(gè)神經(jīng)末梢。柱細(xì)胞僅在非常暗的環(huán)境下工作,對低照度較敏感。柱細(xì)胞主要提供視野的整體視像,因?yàn)橹挥幸环N柱細(xì)胞,所以不產(chǎn)生顏色感受。例如,在日光下(由錐細(xì)胞感受到的)顏色鮮艷的物體在月光下變得無色,就是由于在月光下只有柱細(xì)胞在工作,這種現(xiàn)象稱為適暗視覺

錐細(xì)胞在中央凹區(qū)域內(nèi)的密度很高。為了便于解釋,我們可把中央凹看作一個(gè)1.5mm×1.5mm的方形傳感器矩陣。錐細(xì)胞在這個(gè)區(qū)域內(nèi)的密度約是15萬個(gè)/mm2,所以近似估計(jì),中央凹里的錐細(xì)胞約有33.7萬個(gè)。目前的電子成像傳感器已經(jīng)可以在其接收陣中集中更高密度的光電感受元件。

錐細(xì)胞和柱細(xì)胞均由色素分子組成,其中含有可吸收光的視紫紅質(zhì),這種物質(zhì)在吸收光后會(huì)產(chǎn)生化學(xué)反應(yīng)而分解。一旦化學(xué)反應(yīng)發(fā)生,分子就不再吸收光。反之,如果不再有光通過視網(wǎng)膜,化學(xué)反應(yīng)就反過來進(jìn)行,分子可重新工作(這個(gè)轉(zhuǎn)換過程通常需要幾十分鐘才能全部完成)。當(dāng)光通量增加時(shí),受到照射的視網(wǎng)膜細(xì)胞數(shù)量隨之增加,分解視紫紅質(zhì)的化學(xué)反應(yīng)增強(qiáng),從而使產(chǎn)生的神經(jīng)元信號變得更強(qiáng)。從這個(gè)角度來看,可將視網(wǎng)膜看作一個(gè)化學(xué)實(shí)驗(yàn)室,在其中將光學(xué)影像通過化學(xué)反應(yīng)轉(zhuǎn)換成其他形式的信息。視網(wǎng)膜各處產(chǎn)生的信號的強(qiáng)度反映了場景中對應(yīng)位置的光強(qiáng)度。由此可見,化學(xué)過程基本確定了成像的亮度或顏色。

3. 神經(jīng)處理過程

神經(jīng)處理過程在大腦中樞神經(jīng)系統(tǒng)里進(jìn)行。

(1)借助突觸,每個(gè)視網(wǎng)膜接收單元都與一個(gè)神經(jīng)元細(xì)胞相連,每個(gè)神經(jīng)元細(xì)胞借助其他突觸再與其他細(xì)胞連接,從而構(gòu)成光神經(jīng)網(wǎng)絡(luò)。

(2)光神經(jīng)網(wǎng)絡(luò)進(jìn)一步與大腦中的側(cè)區(qū)域連接,并連接大腦中的紋狀皮層。在紋狀皮層中,對光刺激產(chǎn)生的感覺響應(yīng)經(jīng)過一系列處理最終形成關(guān)于場景的表象,從而將對光的感覺轉(zhuǎn)化為對場景的知覺響應(yīng)。

(3)在大腦皮層中要完成一系列處理工作(從圖像存儲(chǔ)到做出響應(yīng)等)。

以上三個(gè)過程構(gòu)成了視覺的全過程,其流圖如圖1-3所示。

圖1-3 視覺全過程流圖

視覺過程從光源刺激眼睛開始。光通過反射進(jìn)入視覺感受器官(左、右眼)并同時(shí)作用在視網(wǎng)膜上引起視感覺;光刺激在視網(wǎng)膜上經(jīng)神經(jīng)處理產(chǎn)生神經(jīng)沖動(dòng),沿視神經(jīng)纖維傳出眼睛,通過視覺通道傳到大腦皮層,在經(jīng)過一系列處理后最終引起視知覺,或者說在大腦中對光刺激產(chǎn)生響應(yīng),從而形成關(guān)于場景的表象和解釋。

主站蜘蛛池模板: 临邑县| 丰城市| 大竹县| 乌什县| 菏泽市| 长顺县| 宁化县| 隆回县| 北宁市| 名山县| 库伦旗| 宜宾县| 同仁县| 敦化市| 且末县| 广饶县| 江川县| 新营市| 迁安市| 遂平县| 永定县| 京山县| 岳阳市| 慈利县| 阳谷县| 武冈市| 县级市| 开远市| 德江县| 防城港市| 双峰县| 成武县| 曲麻莱县| 玉田县| 互助| 桑日县| 平果县| 东丽区| 施秉县| 镇江市| 孟连|