官术网_书友最值得收藏!

1.3 應(yīng)用基礎(chǔ)

費曼學(xué)習(xí)法強調(diào),說明問題時要不斷地簡化它,一直將其簡化到小朋友能夠理解為止。本節(jié)我們朝著這個目標(biāo)努力,盡量將數(shù)字圖像處理過程中的一些問題簡化,以幫助大家快速理解數(shù)字圖像處理中解決問題的一些基本思路和方法。

1.3.1 量化

圖像處理的一個關(guān)鍵問題是將其量化。計算機不能直接理解圖像,只有將圖像處理為數(shù)值,計算機才能通過數(shù)值理解圖像。如果計算機想找出圖1-12(a)和圖1-12(b)的差別,必須使用某種方式將圖1-12(a)和圖1-12(b)處理為數(shù)值。將圖1-12(a)和圖1-12(b)處理為如圖1-12(c)和圖1-12(d)所示的數(shù)值形式,即可直觀地觀察到二者的不同:在圖1-12(c)和圖1-12(d)這兩幅圖中,第1行第3列上的數(shù)值不一樣。

圖1-12 找不同

最簡單的量化就是直接獲取圖像各像素點的像素值。但是,實踐中面對的往往是比較復(fù)雜的圖像,如果直接對圖像內(nèi)所有像素點進行運算,那么運算量是非常龐大的,有時難以實現(xiàn)實時效果。例如,在視頻監(jiān)控場景中,可以通過對比一個攝像頭先后拍攝的兩幅相片是否一致,來判斷是否有人闖入。此時,簡單地對每一個像素點的像素值進行對比,難以獲得很好的效果。這一方面是因為像素點過多,運算量過大;另一方面是因為樹葉晃動等微小的變化也會對運算結(jié)果造成影響。基于此,通常要把最能代表圖像的本質(zhì)特征提取出來(量化),以便進行后續(xù)操作。

1.3.2 特征

在一定程度上,特征是指圖像核心、本質(zhì)的特點。只有從圖像中提取出其特征,才能更高效地處理圖像。圖像的特征可能是非常直觀的、可視化的,也可能是不易觀察的、隱藏的。在提取圖像特征時,需要細(xì)心觀察,特征既要體現(xiàn)本圖像的特點,還要體現(xiàn)其與其他圖像的差別。

圖像特征示意圖如圖1-13所示。采用三種不同的特征描述圖1-13(a)與圖1-13(b)所示的圖像,具體如下。

● 特征A:將黑色方塊的數(shù)量作為圖像特征,則圖1-13(a)的特征值為11,圖1-13(b)的特征值為7。這個特征值能夠區(qū)分出圖1-13(a)與圖1-13(b),且實現(xiàn)起來比較容易。

● 特征B:將左側(cè)是白色方塊、右側(cè)是黑色方塊的數(shù)量作為圖像特征,則圖1-13(a)的特征值是5;圖1-13(b)的特征值為5。這個特征值不能區(qū)分圖1-13(a)與圖1-13(b),且實現(xiàn)起來比較復(fù)雜。

● 特征C:將上方是黑色方塊下方是白色方塊作為圖像特征,則圖1-13(a)的特征值是7;圖1-13(b)的特征值為3。這個特征值能夠區(qū)分出圖1-13(a)與圖1-13(b),但實現(xiàn)起來比較復(fù)雜。

圖1-13 圖像特征示意圖

通過以上比較可知,本例中使用特征A來刻畫圖1-13(a)與圖1-13(b)是比較合理的。該特征一方面計算簡單、方便;另一方面能夠有效地區(qū)分兩幅圖像。

1.3.3 距離

為了更好地對圖像進行區(qū)分、識別,通常使用距離來衡量圖像之間的差異。例如,在圖1-14中:

● 圖1-14(a)中的黑色方塊的數(shù)量為6。

● 圖1-14(b)中的黑色方塊的數(shù)量為11。

● 圖1-14(c)中的黑色方塊的數(shù)量為7。

圖1-14(a)與圖1-14(b)和圖1-14(c)間的距離可以使用彼此之間黑色塊的差值來表示:

● 圖1-14(a)與圖1-14(b)的距離為11-6=5。

● 圖1-14(a)與圖1-14(c)的距離為7-6=1。

從上述差值可以看出,圖1-14(a)與圖1-14(c)的距離更近,說明這兩幅圖像更相似。

圖1-14 圖像距離示意圖

有時直接使用減法計算距離會得到錯誤的結(jié)果。例如,在圖1-15中,取每幅圖中左右兩個黑色方塊數(shù)量作為特征值,則各個圖像的特征值如下:

● 圖1-15(a)的特征值為(6,12)。

● 圖1-15(b)的特征值為(7,11)。

● 圖1-15(c)的特征值為(11,7)。

若使用減法計算距離,則距離可以表示為

● 圖1-15(a)與圖1-15(b)的距離為(6-7)+(12-11)=-1+1=0。

● 圖1-15(a)與圖1-15(c)的距離為(6-11)+(12-7)=-5+5=0。

從上述差值可以看到,圖1-15(a)與圖1-15(b)的距離、圖1-15(a)與圖1-15(c)的距離都是0。距離0表明二者完全一致,但顯然圖1-15(a)與圖1-15(b)、圖1-15(a)與圖1-15(c)并不完全一致。發(fā)生誤判是因為上述計算過程中存在“負(fù)負(fù)得正”現(xiàn)象。

圖1-15 距離計算示例

為了更好地表示距離,避免“負(fù)負(fù)得正”導(dǎo)致的錯誤,通常將對應(yīng)特征的差值求平方后再開根號得到的結(jié)果作為兩個對象間的距離,具體為

● 圖1-15(a)與圖1-15(b)的距離為

● 圖1-15(a)與圖1-15(c)的距離為

上述距離計算方式,就是實踐中最常用的歐氏距離(Euclidean Distance),對應(yīng)的公式為

當(dāng)然,也可以直接計算對應(yīng)特征差值的絕對值,具體為

● 圖1-15(a)與圖1-15(b)的距離為|6-7|+|12-11|=2。

● 圖1-15(a)與圖1-15(c)的距離為|6-11|+|12-7|=10。

上述距離計算方式稱為城區(qū)(City-Block)距離,又稱曼哈頓距離,對應(yīng)的公式為

歐氏距離是應(yīng)用比較廣泛的一種距離計算方式。不同的距離計算方式從不同的維度描述了距離,代表的含義不同。例如,在圖1-16中,點A和點B之間的距離可以有兩種計算方式:

● 曼哈頓距離:|x2-x1|+|y2-y1|=線X+線Y

● 歐氏距離:

圖1-16 不同距離計算方式的意義

也有學(xué)者認(rèn)為,因為前計算機時代算力不足,計算絕對值不如計算平方根方便,所以歐氏距離比曼哈頓距離有更普遍的應(yīng)用。在實踐中,有非常多的距離計算方式,可以根據(jù)實際需要選用合適的距離算法。

1.3.4 圖像識別

先看一個人臉識別的例子。要進行人臉識別,首先需找到一個可以用簡潔且具有差異性的方式準(zhǔn)確反映人臉特征的模型;然后采用該模型提取已知人臉特征,得到特征集合T;再采用該模型提取待識別人臉的特征,得到特征值X;將待識別人臉的特征值X與特征集合T中的人臉特征一一對比,計算距離,并將其識別為距離最近的人臉。

人臉識別過程示意圖如圖1-17所示,其中:

● 圖1-17(a)是待識別人臉。

● 圖1-17(b)是已知人臉集合。

● 圖1-17(c)是圖1-17(a)的特征值X

● 圖1-17(d)是圖1-17(b)中各個人臉對應(yīng)的特征值(特征集T)。經(jīng)過對比可知,圖1-17(a)中待識別人臉的特征值88與圖1-17(d)中的特征值90最為接近。據(jù)此,可以將待識別人臉圖1-17(a)識別為特征值90對應(yīng)的人臉“己”。

● 圖1-17(e)是返回值,即圖1-17(a)識別的結(jié)果是人臉“己”。

為了方便理解,可以想象在對比時有一個反向映射過程。例如:

● 圖1-17(f)是待識別人臉,由數(shù)值88反向映射得到。

● 圖1-17(g)是人臉集合,由圖1-17(d)中的特征值反向映射得到。

通過觀察圖1-17(f)和圖1-17(g),可以更直觀地得出,圖1-17(g)中第2行第2列是識別的對應(yīng)結(jié)果。該識別結(jié)果是根據(jù)圖1-17(c)和圖1-17(d)之間的值的對應(yīng)關(guān)系確立的。

圖1-17 人臉識別示意圖

為了方便說明和理解,上述案例假設(shè)人臉的特征值只有一個值。在實踐中,會根據(jù)實際情況,選取更具代表性的、更復(fù)雜的、更多的特征值作為比較判斷的依據(jù)。人臉識別原理示意圖如圖1-18所示,其選用四個值作為人臉特征值進行比較,進而獲取識別結(jié)果。圖1-18(e)表示將圖像A對應(yīng)的人臉識別為圖1-18(b)中甲對應(yīng)的人。

圖1-18 人臉識別原理示意圖

很多搜索引擎提供以圖搜圖功能,利用該功能能夠找到與當(dāng)前圖片相似的圖片。很多購物網(wǎng)站也提供這樣的功能,當(dāng)看到某個物品也想買一個時,可以直接給這個物品拍一張照片,購物網(wǎng)站會通過該照片找到相應(yīng)物品的銷售鏈接。以圖搜圖功能原理示意圖如圖1-19所示。由圖1-19可知,以圖搜圖功能的原理與人臉識別的原理是一致的。

圖1-19 以圖搜圖功能原理示意圖

數(shù)字識別有著非常廣泛的現(xiàn)實意義,也是圖像識別教學(xué)中使用的非常經(jīng)典的案例,其原理示意圖如圖1-20所示。由圖1-20可以看出,數(shù)字識別原理與人臉識別和以圖搜圖的原理是一致的。

圖1-20 數(shù)字識別原理示意圖

由圖1-18~圖1-20可知圖像識別的原理是基本一致的。將圖像識別流程一般化,其示意圖如圖1-21所示,具體表述如下。

● 通過特征提取模塊分別完成待識別圖像和已知圖像的特征提取。

● 分別計算待識別圖像與各個已知圖像之間的距離值。

● 將最小距離值對應(yīng)的已知圖像作為識別的結(jié)果。

圖1-21 圖像識別的一般流程

通過以上分析可知,在圖像處理過程中特征提取是非常關(guān)鍵的步驟。如果能提取合適的特征,就能有效地理解圖像并對圖像進行處理。

1.3.5 信息隱藏

由1.3.4節(jié)可知,圖像特征是圖像處理非常關(guān)鍵的步驟,通常會根據(jù)圖像特征來完成圖像處理。本節(jié)將通過圖像像素值的奇偶性來實現(xiàn)圖像信息隱藏。

信息隱藏示例如圖1-22所示。該示例是將數(shù)字1圖像隱藏到如圖1-22(a)所示的圖像中。

● 圖1-22(a)是載體圖像。

● 圖1-22(b)是從圖1-22(a)中選取的一小塊區(qū)域,希望在該區(qū)域內(nèi)嵌入數(shù)字1圖像。

● 圖1-22(c)是在圖1-22(b)中嵌入了數(shù)字1圖像的結(jié)果。

● 圖1-22(d)是嵌入了數(shù)字1圖像后的載體圖像。

● 圖1-22(e)從圖1-22(d)中提取的一小塊區(qū)域,該區(qū)域嵌入了數(shù)字1圖像。

● 圖1-22(f)是從圖1-22(e)中提取的數(shù)字1圖像。

嵌入信息過程的具體步驟如下。

第一步:從圖1-22(a)中選擇一塊區(qū)域如圖1-22(b)所示。

第二步:在圖1-22(b)中選取一塊區(qū)域作為數(shù)字1圖像的前景,如圖1-22(b)中白色區(qū)域所示。

第三步:將圖1-22(b)中的數(shù)字1圖像前景中的所有的像素值調(diào)整為等于自身值或比自身值大1的奇數(shù);將數(shù)字1圖像的背景[圖1-22(b)中的陰影部分]的所有像素值調(diào)整為等于自身或比自身值小1的偶數(shù),得到如圖1-22(c)所示結(jié)果。

第四步:用處理后的圖1-22(c)替換圖1-22(a)內(nèi)該部分原有像素值,完成數(shù)字1圖像的嵌入,得到圖1-22(d)。

提取嵌入信息的具體步驟如下。

第一步:從圖1-22(d)中選擇包含數(shù)字1圖像的區(qū)域,得到該區(qū)域的像素值,如圖1-22(e)所示。

第二步:從圖1-22(e)中提取信息,如果圖1-22(e)中的像素值是偶數(shù),則提取為“0”;如果圖1-22(e)中的像素值是奇數(shù),則提取為“1”;提取結(jié)果如圖1-22(f)所示,從圖中可以看出,數(shù)字1圖像被準(zhǔn)確地提取出來了。

圖1-22 信息隱藏示例

上述信息隱藏示例還涉及一個原理:灰度圖像具有256個灰度級,其像素值的范圍是[0,255]。當(dāng)像素值發(fā)生一個單位的變化時(變?yōu)樽钹徑钠鏀?shù)或偶數(shù)),相當(dāng)于變化了1/256,人眼觀察不到這個范圍的變化,因此嵌入的信息具有較好的隱蔽性。例如,圖1-22(b)中右上角的像素值13變成圖1-22(c)中的像素值12,人眼觀察到的像素值12和像素值13在外觀上是一致的,沒有區(qū)別。

主站蜘蛛池模板: 金阳县| 东宁县| 桂林市| 江源县| 五指山市| 景谷| 双鸭山市| 台山市| 泸定县| 咸宁市| 永善县| 敦煌市| 潞西市| 平舆县| 大足县| 虹口区| 韶关市| 海丰县| 罗甸县| 濮阳县| 古田县| 获嘉县| 保亭| 奉新县| 磐安县| 泗水县| 肇州县| 五常市| 临武县| 高密市| 关岭| 当阳市| 泽库县| 分宜县| 易门县| 安国市| 东乡县| 佛山市| 英山县| 盐津县| 乐东|