官术网_书友最值得收藏!

1.3 視覺系統和圖像技術

視覺系統是通過觀測世界獲得圖像,進而實現視覺功能的系統。人的視覺系統包括眼睛、神經網絡、大腦皮層等。隨著科技的進步,由計算機和電子設備構成的人造視覺系統越來越多,它們試圖實現并改善人的視覺系統。人造視覺系統主要將數字圖像作為系統的輸入。

1.3.1 視覺系統流程

從功能來看,2D視覺系統需要能夠采集客觀場景的圖像,對圖像進行加工(預處理),改善圖像質量,再將其中對應感興趣物體的圖像目標提取出來,并通過對目標的分析獲取客觀物體的有用信息。2D視覺系統流程如圖1-9所示。

圖1-9 2D視覺系統流程

1.3.2 圖像技術層次

為完成視覺系統的功能,需要利用一系列技術。計算機視覺技術經過多年發展已有很大進展,種類很多。對于這些技術,已有一些分類方法,但目前看來還不太穩定和一致。例如,研究者均將計算機視覺技術分成3層,但結果并不統一。有的將其分為低層視覺、中層視覺、3D視覺,有的將其分為早期視覺(其中又分為兩部分:僅一幅圖像、多幅圖像)、中層視覺、高層視覺(其中又分為兩部分:幾何方法、概率和推論方法)。

相對來說,圖像技術的分類方法在近20多年來一直比較一致。該方法將各種圖像技術都集合在圖像工程學科(一門系統研究各種圖像理論、技術和應用的交叉學科)之下。圖像工程可分為圖像處理、圖像分析和圖像理解三個層次,如圖1-10所示,每個層次各有特點。

圖1-10 圖像工程層次示意

圖像處理(IP)著重強調在圖像之間進行的變換。雖然人們常用圖像處理泛指各種圖像技術,但比較狹義的圖像處理主要指對圖像進行各種加工以改善圖像的視覺效果,并為自動識別打基礎,或對圖像進行壓縮編碼以減少所需的存儲空間或傳輸時間,從而滿足給定傳輸通路的需求。

圖像分析(IA)主要是對圖像中感興趣的目標進行檢測和測量,以獲得它們的客觀信息,從而建立對圖像的描述。如果說圖像處理是一個從圖像到圖像的過程,則圖像分析是一個從圖像到數據的過程。這里數據可以是對目標特征進行測量的結果,也可以是基于測量的符號表示,它們描述了圖像中目標的特點和性質。

圖像理解(IU)的重點是在圖像分析的基礎上,進一步研究圖像中各目標的性質和它們之間的聯系,并得出對圖像內容的理解及對原來客觀場景的解釋。如果說圖像分析主要以觀察者為中心研究客觀世界(主要研究可直接觀察到的事物),那么圖像理解在一定程度上以客觀世界為中心,并借助知識、經驗等來把握和解釋整個客觀世界(包括不能直接觀察到的事物)。

綜上所述,圖像處理、圖像分析和圖像理解在抽象程度和數據量上各有特點,操作對象和語義層次各不相同,其相互聯系可參考圖1-10。圖像處理是比較低層的操作,它主要在圖像的像素層次上進行處理,處理的數據量非常大;圖像分析則進入了中層,通過圖像分割和特征提取,把原來對圖像中像素的描述轉換成比較簡潔的對圖像中目標的描述;圖像理解是高層操作,操作對象基本上是從描述中抽象出來的符號,其處理過程和方法與人類的思維推理有許多相似之處。另外,由圖1-10可知,隨著抽象性的提高,數據量是逐漸減少的。具體說來,原始圖像數據在經過一系列的處理過程后,逐步轉化得更有組織并被更抽象地表達。在這個過程中,語義被不斷引入,操作對象發生變化,數據量得到壓縮。另外,高層操作對低層操作有指導作用,能提高低層操作的效能。

在圖像工程的三個層次中,圖像處理和圖像分析是圖像理解的基礎,對二者的研究相較于圖像理解更加成熟,目前應用得也比較廣泛。本書主要介紹這兩個層次的內容,更深入的內容可見《3D計算機視覺:原理、算法及應用》一書。

1.3.3 圖像技術類別

在圖像工程的三個層次中,每個層次又包括若干個技術類別(共16個類別),如表1-1所示。

表1-1 圖像處理、圖像分析和圖像理解中的圖像技術

在圖像處理技術中,本書主要涉及圖像獲取、圖像增強/圖像恢復及圖像多分辨率處理等內容;在圖像分析技術中,本書主要涉及圖像分割和基元檢測、目標表達、目標描述、特征測量、目標特性提取分析及目標檢測和目標識別等內容,如表1-1中粗宋體所示(同時也是術語)。

主站蜘蛛池模板: 马山县| 岳普湖县| 象山县| 扶绥县| 柘荣县| 怀来县| 永丰县| 阳西县| 探索| 镇江市| 揭东县| 巴彦县| 安吉县| 公安县| 繁峙县| 建水县| 舞钢市| 红河县| 巴里| 新干县| 越西县| 清镇市| 司法| 中牟县| 荆门市| 万源市| 稷山县| 都昌县| 陇川县| 博白县| 和硕县| 长沙县| 孟州市| 汉源县| 柳林县| 大名县| 东乡族自治县| 江都市| 滦南县| 木兰县| 梅河口市|