官术网_书友最值得收藏!

5.1 圖像聚類分割概述

聚類是指依照某一個準(zhǔn)則將數(shù)據(jù)集劃分為某幾個類或簇,使得屬于同一類內(nèi)的數(shù)據(jù)集合具有較高的相似度,而屬于不同類的數(shù)據(jù)集合具有較低的相似度,因而聚類過程的關(guān)鍵就是盡可能地將同類事物聚集在一起,將不同類別的數(shù)據(jù)集合盡可能地分離。聚類分析屬于多元統(tǒng)計方法中的一種,在樣本進行聚類分析的時候,在樣本所屬的類別和類別數(shù)目未知的情況下,該方法依據(jù)樣本數(shù)據(jù),采用數(shù)學(xué)方法來處理數(shù)據(jù)集的分類問題。聚類分析在圖像處理領(lǐng)域,尤其在圖像分割方面發(fā)揮著相當(dāng)重要的作用,因而產(chǎn)生了許多基于聚類算法的圖像分割方法。

聚類的定義:由許多數(shù)據(jù)點組成的數(shù)據(jù)集X,此數(shù)據(jù)集是一個N×d的矩陣,且X中包含的數(shù)據(jù)點xj在數(shù)據(jù)空間B中,并且表示為xj=(xj1xj2,…,xjd)∈Bxj的屬性定義為數(shù)值型或枚舉型的xji;若數(shù)據(jù)集X包括Nxjj=1,2,…,N)數(shù)據(jù)點作為其對象,然后把數(shù)據(jù)集X分裂為k個分割Dmm=1,2,…,k)和噪聲Dn,并且當(dāng)數(shù)據(jù)集X是噪聲Dn與沒有交集的多個分割Dmm=1,2,…,k)并集的時候,完成聚類算法,其表達式如下:

978-7-111-59317-1-Chapter05-1.jpg

數(shù)據(jù)類型包括:數(shù)據(jù)聚類矩陣和相異矩陣。數(shù)據(jù)矩陣是目標(biāo)與變量組織的數(shù)據(jù)表達方式,若聚類中有N個對象xjj=1,2,…,N),且每個對象選擇P個變量,則第j個對象的第i個變量的觀測值表示為xji,因此,聚類中有N個對象的所有觀測值組成的N×P的矩陣,即為此聚類過程的數(shù)據(jù)矩陣,其表達式見式(5-2),且第j個對象的P個變量的觀測值表示為向量xJ,其表達式見式(5-3);相異度矩陣是目標(biāo)與其結(jié)構(gòu)的數(shù)據(jù)表達方式,若聚類數(shù)據(jù)集中的對象ij之間的相異性用一個非負數(shù)值eij)量化表示,則聚類數(shù)據(jù)集存儲的N個對象的相異度矩陣,表示為一個N×N的矩陣,見式(5-4)。從式(5-4)可以看出,eij)=eji)且eii)=0;當(dāng)對象ij之間越相近或相似時,eij)就趨近于零,反之當(dāng)對象ij之間相距越遠或不相同時,eij)的取值就越大,因此相異度矩陣可以表示出聚類數(shù)據(jù)集存儲的N個對象間的相似或相異程度。

978-7-111-59317-1-Chapter05-2.jpg

完整的圖像聚類過程不僅包含聚類算法本身,還包括圖像的特征選擇與提取以及數(shù)據(jù)集的相似度度量的計算,其圖像聚類過程可用圖5-1表示,從圖5-1中可以反映出圖像聚類過程的前兩步:圖像特征的選擇與提取以及數(shù)據(jù)集相似度的計算會受到聚類輸出反饋的影響。

978-7-111-59317-1-Chapter05-3.jpg

5-1 圖像聚類過程

到目前為止,評價聚類方法的優(yōu)劣還沒有量化的客觀標(biāo)準(zhǔn),因而聚類方法效果的好與差主要采用以下幾個標(biāo)準(zhǔn)來衡量:是否具有處理大量數(shù)據(jù)集合的能力;是否具有處理數(shù)據(jù)抗噪聲的能力;是否具有處理攜帶間隔或嵌套的任意類型數(shù)據(jù)的能力;是否具有處理后的輸出結(jié)果與數(shù)據(jù)輸入的順序無關(guān)的能力;是否具有處理多維數(shù)據(jù)的能力;在聚類過程中是否需要先驗知識。

主站蜘蛛池模板: 兴化市| 杭锦后旗| 大厂| 康保县| 台南市| 九龙坡区| 平昌县| 六盘水市| 贺州市| 河北区| 清丰县| 泸西县| 克山县| 肇州县| 平江县| 张掖市| 乌拉特中旗| 卓尼县| 双辽市| 望城县| 宝鸡市| 五家渠市| 河津市| 丰县| 安阳县| 同江市| 永和县| 瑞安市| 黔江区| 广宁县| 当阳市| 云和县| 抚顺县| 新竹市| 盐亭县| 宜州市| 洮南市| 江华| 曲麻莱县| 许昌市| 太保市|