- 2D 計算機視覺:原理、算法及應用
- 章毓晉編著
- 1981字
- 2021-10-29 23:40:32
1.4 本書架構和內容概況
本節介紹本書的結構框架和主要內容、各章概況,以及先修基礎。
1.4.1 結構框架和主要內容
根據圖1-9,本書選取了一些相關技術進行介紹。圖像處理技術基本對應早期視覺或低層視覺,圖像分析技術主要與中層視覺相關。
本書的結構框架和主要內容如圖1-11所示。從客觀場景出發到最后提取出物體信息,共分為4個模塊(實線框):圖像采集、圖像處理(或圖像預處理)、目標提取、目標分析,分別包含不同的技術(虛線框),括號中的數字對應本書的章次。附錄A介紹的二值數學形態學作為一種工具可以應用于不同模塊的不同技術(如箭頭所示);附錄B介紹的視覺恒常性主要與圖像處理模塊相關(如箭頭所示)。

圖1-11 本書的結構框架和主要內容
本書的主要內容可劃分在如圖1-11所示的四個單元中(如點線框所示)。第一個單元包括第2章,主要介紹了初步的圖像采集表達技術;第二個單元包括第3~6章,主要介紹基本的圖像處理技術;第三個單元包括第7~9章,主要介紹從圖像處理到圖像分析的轉換技術;第四個單元包括第10~13章,主要介紹擴展的圖像分析技術。
1.4.2 各章概況
本書共有13章和2個附錄。
第1章解釋了一些基本術語,給出了多種圖像示例,概括了圖像技術的總體情況,并具體介紹了圖像的表示和顯示方法及圖像存儲和文件格式,還提出了本書的使用建議。
第2章介紹圖像采集方法,包括幾何成像模型和亮度成像模型,以及為圖像數字化而進行的采樣和量化,這些都是獲取數字圖像的關鍵。另外,還討論了圖像中像素間的關系。
第3章介紹空域圖像增強方法,涉及的內容包括對圖像進行算術運算和邏輯運算的技術、灰度映射技術,以及基于直方圖的圖像增強方法和利用像素鄰域的空域濾波方法。
第4章介紹頻域圖像增強方法,在概述傅里葉變換的基礎上,具體介紹了多種低通、高通、帶阻和帶通濾波器,并結合亮度成像模型分析了同態濾波器的原理。
第5章介紹圖像恢復方法,分析了圖像退化示例,對基本的無約束恢復和有約束恢復技術進行了討論,介紹了對幾何失真進行校正的方法,并概述了圖像修補技術。
第6章介紹彩色視覺和彩色圖像增強方法,在討論彩色視覺基礎及基于物理的和基于感知的彩色模型的基礎上,給出了一些典型的偽彩色增強和真彩色增強方法。
第7章介紹基本的圖像分割方法,先對相關的定義、方法、分類等進行討論,然后具體介紹了微分邊緣檢測、主動輪廓模型、閾值分割、基于過渡區的閾值選取及區域生長技術。
第8章介紹圖像中的基元檢測方法,討論了幾種興趣點的檢測方法,以橢圓為例分析了目標檢測的思路,還介紹了可檢測多種基元的哈夫變換并推廣到廣義哈夫變換。
第9章介紹目標表達的基本方法,包括對輪廓的鏈碼表達、投影標志和多邊形近似,以及目標的層次表達、圍繞區域和骨架表達。
第10章介紹目標的描述技術,除了一些輪廓基本描述參數和區域基本描述參數,還討論了輪廓的傅里葉描述和小波描述、基于區域不變矩的描述及對目標關系的描述。
第11章介紹目標表面紋理的描述方法,分別對基于統計理論、結構模型和頻譜函數的三類紋理研究方法中的一些典型技術進行了討論。
第12章介紹目標形狀的描述,具體討論了四類形狀特性描述符,包括形狀緊湊性描述符、形狀復雜性描述符、基于離散曲率的描述符、拓撲結構描述符。
第13章介紹目標模式的分類問題,先以交叉比為例介紹了特征不變量,然后討論了幾種典型的統計模式分類器,最后分析了支持向量機的原理和特點。
附錄A介紹二值數學形態學,在回顧基本集合定義的基礎上,依次介紹了二值數學形態學基本運算、二值數學形態學組合運算和二值數學形態學實用算法。
附錄B介紹視覺恒常性,這是知覺恒常性的一種。在對視網膜皮層理論進行介紹的基礎上,還舉例描述了視覺恒常性在圖像增強中的兩個應用。
各章均附有“各節要點和進一步參考”,一方面歸納各節的中心內容,另一方面介紹可深入學習的參考文獻。除附錄外,各章均有一定數量的自我檢測題(均附有提示和答案)。
1.4.3 先修基礎
從學習圖像處理和分析技術的角度來說,以下三個方面的基礎知識是比較重要的。
(1)數學知識。值得指出的是線性代數,因為圖像可表示為點陣,需要借助矩陣來表達和解釋各種加工運算過程;另外,統計和概率的知識也很有用。
(2)計算機科學知識。值得指出的是計算機軟硬件技術,因為對圖像的加工需要使用計算機,一般通過編程利用一定的算法在給定的平臺上完成。
(3)電子學知識。值得指出的有兩個,一個是信號處理,因為圖像可看作1D信號的擴展,圖像處理是信號處理的擴展;另一個是電路原理,因為最終要實現對圖像的快速加工,常常需要使用一定的電子設備和器件(包括特殊的硬件)。
本書是以計算機視覺入門圖書的定位來編寫的,主要目標是介紹2D計算機視覺(對應圖像處理和分析)的基本原理、典型方法和應用技術,一方面,可使讀者能據此解決實際應用中的具體問題;另一方面,可為讀者進一步學習和研究3D計算機視覺(更接近圖像理解)打下基礎。