官术网_书友最值得收藏!

1.4 智能圖像處理基礎

上文介紹的應用都是使用傳統方法來實現圖像處理的。傳統方法涉及的核心問題有

● 選取合適的特征:要高度概括圖像特點,體現不同圖像間的差異。

● 合適的量化方式:將特征量化為合理的數值。

● 距離計算:選用合適的距離計算方式計算距離。

傳統方法的特點是,需要提取圖像的特征,并手動對特征進行分析、處理。在對特征進行分析、處理的過程中,距離的計算是非常關鍵的。為實現圖像的分類、識別等,人們提出了很多距離計算方式。

在圖像處理早期階段,傳統處理方式解決了非常多的問題。為了更高效地處理圖像,人們引入了機器學習。機器學習方法的首要工作仍是進行特征的提取和量化,但機器學習提供了更多對特征值進行處理的方式,讓我們能夠根據需要對特征進行不同維度的分析、處理,從而得到對圖像的分析處理結果。

簡單來說,在傳統方法中,我們常使用特征的距離來實現對圖像的分析處理(如圖像識別等)。在使用機器學習處理圖像時,機器學習提供了更多關于如何使用特征來完成圖像處理工作的成熟方案。我們可以直接采用已知的具體成熟方案來完成對特征的分析、處理工作,從而實現對圖像的識別、分類等。

也就是說,在傳統方式中,我們需要自己提取特征,然后選取一種有效的特征處理方式,如通過計算距離并對比結果等完成對特征的處理工作。而在機器學習中,我們要做的工作只是提取特征,在提取完特征后,直接把特征交給機器學習算法來處理即可。

機器學習提供了強大且多樣的特征處理方案。本書將介紹使用OpenCV通過K近鄰算法、支持向量機、K均值聚類等方式實現手寫數字識別等工作。

機器學習讓我們只需關注特征提取,無須關注如何處理特征,與傳統圖像處理方式相比,工作量減少了一半。但是,特征提取其實是一件非常困難的事,主要體現在如下兩方面。

1.如何選取特征

圖像的特征有很多,多到我們無法想象。因為從根本上講,任何像素之間的排列組合都能作為特征。那么哪些特征有用,哪些特征沒用呢?

有些特征是能夠一眼捕捉的,在這種情況下直接拿來用就好了。但是,有些特征可能并不直觀,屬于圖像隱含的高層次特征,無法直接被觀察到,在這種情況下就無法直接提取出這些特征。

因此選取有效的特征一直是圖像處理過程中面臨的一個非常復雜的問題。即使在機器學習階段,特征的選取仍是一個重要的研究方向。人們在這方面取得了很多突破,并提出了非常多的有效特征提取方式,如SIFT、HOG、SURF等。但是,通過這些方式提取的特征具有很強的針對性,在不同的場景下,如何選取有效特征成為一個難題。

2.如何處理特征

在找到合適的特征后,如何處理特征是一個非常棘手的問題。即使使用機器學習也面臨從眾多算法中選擇合適的算法來處理特征的問題。即使獲取了有效特征、選用了合適的算法,特征值的計算量也是巨大的。因此,即使機器學習能夠自動處理特征,同樣需要對特征進行有效的預處理,以減少計算量。這有點復雜,針對特征值的預處理,好像又讓我們回到了傳統圖像處理方式上,仍需要對特征進行復雜的處理工作。

這兩個問題一直困擾著圖像處理工作者,他們不斷尋找突破點,在這種情況下,他們提出使用深度學習來處理圖像。

在深度學習中,不需要直接提取特征,而是通過卷積操作等提取圖像的高層次特征,這些特征往往能夠更清晰地表述圖像的高層語義,甚至有可能包含我們不能直接理解或觀察到的特征。在深度學習中,我們重點關注卷積操作,通過變換卷積操作提取不同特征。通過卷積操作,可以提取到圖像的高層次特征,利用這些特征可以更好地進行圖像分析與處理。例如,識別圖像內的貓時,直接提取特征提取的可能是線條、邊角等基礎特征。而在深度學習中,通過卷積可以提取貓所特有的形態、外觀、姿勢等高層次特征,甚至可能包含不能被觀察到的、尚未被掌握的,甚至不能理解的更高層次、更抽象的特征。

卷積運算在深度學習中發揮著非常關鍵的作用,下文將專門對卷積神經網絡的基本方法和邏輯進行介紹。

不同圖像處理方式的比較如表1-2所示。

表1-2 不同圖像處理方式的比較

如果把不需要手動設計的部分表示為“黑盒”,那么可以使用圖1-23來表示各個階段。

圖1-23 不同圖像處理方式示意圖

當然,上文簡化了圖像處理的發展歷程,重點說明了傳統方式、機器學習方式、深度學習方式的區別。實際發展過程是一個不斷試錯的過程,是曲折的、反復的。

主站蜘蛛池模板: 承德市| 延安市| 绥江县| 乐昌市| 孟村| 江华| 盐源县| 陇西县| 白河县| 招远市| 黄骅市| 靖西县| 宜州市| 云安县| 新民市| 洞口县| 邵阳县| 白玉县| 胶南市| 天门市| 镇沅| 延寿县| 新邵县| 宜城市| 佛冈县| 合江县| 武功县| 长汀县| 商水县| 衡东县| 景洪市| 大埔区| 宁晋县| 临沧市| 金乡县| 祁东县| 富顺县| 茌平县| 建昌县| 玛多县| 宁武县|