- 智能信息融合與目標識別方法
- 胡玉蘭
- 2707字
- 2020-11-28 22:24:01
5.3 改進的FCM聚類分割算法
依據圖像數據集中的簇的重疊程度可以將聚類分割算法分為硬性聚類算法和模糊聚類算法。硬性聚類算法體現了對象與簇之間的非此即彼的關系,即嚴格地把每個待聚類的對象分類到某個簇中,設圖像的數據集為X={x1,x2,…,xn},其分類的數目為c,且滿足條件(2≤c≤n);假設將數據集X劃分為互不重疊的c個簇,使得任何一個X中的樣本點均屬于某一個簇,并且每一個簇中最少有一個樣本點,那么這個硬性聚類算法的聚類結果就可以表示為一個c×n階的矩陣U,則數據集中的第j類可以表示為ujk,其表達式見式(5-7)。通常在實踐中事物間的邊界限并不是很分明,就會出現模糊劃分的聚類算法,而模糊集合理論又為模糊聚類算法提供了優良的數學工具。模糊聚類算法矩陣U中元素的取值并不只局限于0與1這兩個值,而是在0與1之間的區間上取值,因而此時的硬性聚類算法就轉變為模糊聚類算法。
硬性聚類算法一般采用最小平方誤差和作為其聚類準則,設vj(j=1,2,…,c)是該聚類的聚類中心,djk代表圖像數據集中的第j類樣本xk到聚類中心vj的距離,各簇中樣本到聚類中心的距離平方和用J(U,V)表示,則此硬性聚類算法的目標函數表示為式(5-8)或式(5-9),并且當用迭代算法來求取最小的J(U,V)時,就可以找到最佳的圖像矩陣與聚類中心的配對,即(U,V);模糊聚類算法一般采用拉格朗日乘數法求目標函數,設xk、vj都是q維向量,?xk,vj∈Rq,A是q×q的矩陣,A∈Mqq,數據集中的樣本xk與聚類中心vj之間距離的平方表示為(djk)2,其表達式見式(5-10),其中T表示矩陣的轉置,且A為對稱矩陣,當A=I時,式(5-10)轉化為歐式距離,該模糊聚類算法的目標函數的表達式見式(5-11),利用約束條件,?k可求得J(U,V)的最小值,從而找到最佳的ujk與vj。
HCM聚類算法是典型的硬性聚類算法,該算法收斂速度較快,但由于此算法只能將圖像中的樣本點以概率0和1劃分到各個簇中,因此該方法不能夠充分表現出客觀事物的模糊特性,因而在實際的圖像分割中往往會產生錯誤分割。相反,模糊聚類算法中的一種典型算法FCM算法就可以解決HCM算法中不能充分表達事物模糊性的這一缺陷,該算法在圖像分割中利用隸屬度函數解決了像素同時屬于多個不同類別的可能性問題;該算法能夠避免閾值的設定問題,并能解決閾值分割中多個分支的分割問題;該算法可以形成較細致的特征空間,其分割結果不會像硬聚類分割那樣產生某種偏差;該算法的聚類過程是自動進行的,是無監督的聚類方法,因而該算法在圖像分割領域被廣泛應用。
FCM算法的圖像分割的步驟如下:設待分割的圖像為M,其分割門限為?,然后對該圖像采用迭代優化方案求其FCM算法中目標函數J(U,V)的最小值。首先,確定圖像的聚類數目c(2≤c≤n)以及加權指數m(m∈[2,∞]);接著,初始化模糊聚類矩陣U,其初始值U(l)=[μi(x,y)l],且l=0;然后,依據式(5-12)計算各個簇的聚類中心vi并且計算新的模糊聚類矩陣Ul+1,再依據式(5-13)和式(5-14)分別計算M(x,y)、;若M(x,y)=?,則滿足式(5-15),反之,若M(x,y)≠?,則滿足式(5-16);最后,檢查U(l-1)-U(l)的值是否小于FCM算法預先設的閾值,若該值小于此閾值則標志著FCM算法結束,圖像分割已完成,反之,若該值大于或等于FCM算法預先設的閾值,則算法就會繼續計算新的聚類中心,當達到停止條件時停止,此時算法收斂后,其分割圖像可表示為式(5-17)。
影響FCM聚類算法分割質量的因素如下:
1)FCM聚類算法的初始隸屬度矩陣,該矩陣直接影響FCM聚類算法是否能找到最佳的聚類中心以及影響FCM聚類算法的運算時間和迭代次數。
2)FCM聚類算法的對稱矩陣,該矩陣的矩陣形式直接影響FCM聚類算法的聚類分布,是球狀分布、條狀分布、帶形分布、矩形分布還是菱形分布等。
3)FCM聚類算法的聚類數目,這個參數直接影響FCM聚類算法的運算時間,假如此數目很大,其運算時間就會成倍增加,因而此時該算法在一般的實驗設備就難以完成。
4)FCM聚類算法的加權指數,該參數控制著模糊聚類的類間模糊程度,若該加權指數變大,則分類矩陣模糊程度就會變大;當該加權指數趨于無窮的時候,隸屬度矩陣中的元素均接近1/c(c為聚類的總數),此時隸屬度矩陣就失去了意義。
5)FCM聚類算法的閾值設定,如果閾值設置得太大,則每次運算的聚類結果就會有較大的差異,且聚類結果也不穩定;反之,如果閾值設置得太小,則該算法的運算量就會增加,從而導致運算時間變長以及產生該算法不能收斂的結果。
因此,改進FCM聚類算法的分割效果實質就是對以上幾個因素的改進,本章對傳統的FCM聚類算法進行了如下改進:
1)隸屬度矩陣的改進:利用圖像中像素的空間特征加強原有的隸屬度函數,使同類區域的鄰域像素攜帶少量的噪聲點的權重,最終獲得較準確的聚類中心;改進的隸屬度迭代公式見式(5-18),其中p、q分別為控制原有隸屬度和控制空間函數間關系的參數;改進隸屬度后得到的聚類中心的迭代函數的公式見式(5-19)。
2)對稱矩陣的選擇:根據圖像的聚類分布對應地選擇出對稱矩陣的形式。
3)聚類數目的確定:本章采用結合閾值分割的分水嶺算法中的分水嶺盆地的個數作為初始的聚類數目,從而解決了傳統的FCM聚類算法不能自動確定總的聚類數目的問題。
4)加權指數的確定:對于不同的圖像,加權指數也具有不同的取值范圍,但加權指數有一個經驗范圍是[1,1.5],之后又從物理上求出,當加權指數取2的時候,其表示的模糊聚類的類間模糊程度最有意義。
5)閾值設定:本章采用結合梯度特征的最大類間方差法無監督、自適應地確定了多源圖像的分割閾值,從而為FCM聚類算法收斂到較好的聚類結果奠定了一定的基礎。
因此,通過上述改進的FCM聚類分割算法可以求出新的目標函數的表達式為式(5-20),并且用迭代算法可求出目標函數J(U,V)最小值,從而得到最佳的圖像矩陣與聚類中心的配對,即(U,V),最終完成聚類分割的目的。
因此,本章采用結合空間特征的FCM聚類算法對分水嶺算法進行改進操作,從而形成了結合改進的FCM聚類分割的分水嶺算法,該算法減弱了分水嶺算法易受圖像中的量化誤差的影響;與此同時該算法也歸并了圖像中那些細微的無語義學意義的過分割的小區域,使得被分割的目標輪廓更為清晰;并且該算法進一步改善了傳統分水嶺算法中易產生過分割的缺陷,最終得到具有較高分割質量的圖像。本章采用VC++6.0開發環境編程調試完成的結合空間特征的FCM聚類分割算法對結合閾值算法的分水嶺分割圖像進行圖像分割,其分割結果分別如圖5-2和圖5-3所示,其中圖5-2為可見光圖像的結合聚類算法的分水嶺分割圖像,圖5-3為紅外圖像的結合聚類算法的分水嶺分割圖像。
圖5-2 可見光圖像的結合聚類算法的分水嶺分割圖像
圖5-3 紅外圖像的結合聚類算法的分水嶺分割圖像