官术网_书友最值得收藏!

2.1 模式識別的基本概念

2.1.1 模式與模式識別

當人們看到某事物或現象時,首先會收集該事物或現象的所有信息,然后將其行為特征與頭腦中已有的相關信息相比較;若找到一個相同或相似的匹配,就可以將該事物或現象識別出來。因此,某事物或現象的相關信息,如空間信息、時間信息等,就構成了它的模式。廣義地說,存在于時間和空間中可觀察的事物,若可以區別它們是否相同或相似,都可以稱之為模式。S。Watanable定義模式為“與混沌相對立,是一個可以命名的模糊定義的實體”。比如,一個模式可以是指紋圖像、手寫草字、人臉或語言符號等,而將觀察目標與已有模式相比較、配準、判斷其類屬的過程就是模式識別。

模式以及模式識別是和類別(集合)的概念分不開的,只要認識某類事物或現象中的幾個,人們就可以識別該類中的許多事物或現象。英文“pattern”來源于法文“patron”,中文翻譯為“榜樣、模式、樣品”,原意是指可作為大家學習的理想人物,或用來模仿復制的完美的樣品。在模式識別中,模式是事物的特征,是對事物定量的或結構的描述,例如人的高矮、胖瘦、性別、膚色、年齡、臉型等。模式類是具有某些共同特性的模式的集合。模式識別就是識別出特定事物所模仿的標本,例如人們常常根據高矮、胖瘦、性別、膚色、年齡、臉型等把不同的人區分開來。從不同的角度出發,模式有不同的分類方法,如按事物的性質劃分,可分為具體模式和抽象模式。思想、觀念、觀點、信仰等是抽象的事物,它們屬于抽象模式,但這是哲學和心理學研究的范疇。因此,為了強調能從具體的事物或現象中推斷出總體,把通過觀測具體的個別事物所得到的具有時間和空間分布的信息稱為模式,而把模式所屬的類別或同一類模式的總體稱為模式類。也有人習慣上把模式類稱為模式,把個別具體的模式稱為樣本。在此意義上,人們可以認為把具體樣本歸類到某一個模式就叫作模式識別或模式分類。人類具有很強的模式識別能力,這是一種基本認知能力或智能,是人類智能的重要組成部分,在各種活動中都有著重要作用,例如通過視覺信息識別文字、圖片和周圍的環境,通過聽覺信息識別與理解語言等。在現實生活中,幾乎每個人都會在不經意間輕而易舉地完成模式識別的過程。

模式識別研究具體模式的識別,如字符、圖畫、音樂等,它們通過對感官的刺激而被識別。具體模式主要是視覺模式、聽覺模式、觸覺模式,另外還有味覺模式、嗅覺模式等。模式識別研究主要集中在兩方面,即研究生物體(包括人)如何感知對象,以及研究在給定的任務下,如何用計算機實現模式識別的理論和方法。前者屬于認知科學的范疇,是生理學家、心理學家、生物學家的研究內容;后者屬于信息科學的范疇,是數學、信息學和計算機科學工作者的研究內容。識別行為可以分為識別具體事物和識別抽象事物兩大類。具體事物的識別涉及時空信息的識別:時間信息,例如波形、信號等,空間信息,例如指紋、氣象圖和照片等。抽象事物的識別涉及某一問題解決辦法的識別、一個古老的話題或論點等。換言之,是識別那些不以物質形式存在的現象,屬于概念識別研究的范疇。因此,模式識別就是通過計算機用數學方法來研究模式的自動處理和判讀。通常要識別的數據有:一維數據,如語音、心電圖、地震數據等;二維數據,如文字圖片、醫學圖像、衛星圖像等;三維數據,如圖像序列、結晶學或X圖像斷層攝影等。

如前所述,視覺信息和聽覺信息是人類賴以實現模式識別的基礎,也是模式識別的兩個重要方面,代表性產品有光學字符識別、語音識別系統。模式識別的全過程如圖2.1所示。模式信息采集是獲取被識別對象的特征,如電壓、電流等電量,或灰度、色彩、聲音、壓力、溫度等非電量。對于非電量還必須先轉化為電量,然后再經模擬-數據(A/D)轉換為計算機可以接受的信息。對信息進行預處理是指濾掉樣品采集過程中可能引入的干擾信號,人為地突出有用信號,以便獲得良好的識別效果。對經過改善的有用信號進行特征或基元抽取,才能正確地分類。抽取準則和方法是模式識別研究的一個重點。特征抽取或基元抽取不是一次就可以完成的,需要不斷地修改和完善,圖2.1中虛線即表達此意。模式分類是模式識別的關鍵,它是在前幾步準備工作的基礎上,將被識別對象進行分類。

圖2.1 模式識別的全過程

隨著20世紀40年代計算機的出現以及50年代AI的興起,人們開始用計算機來代替或擴展人類的部分腦力勞動。模式識別在60年代初迅速發展并成為一門新學科。

2.1.2 模式識別方法

隨著計算機的飛速發展,模式識別已經成為AI的分支學科。模式識別不僅指感官對事物的感覺,也是人們的一種基本思維活動。根據被識別模式的性質,可以把識別行為分為抽象的和具體的兩種形式,具體事物的識別,如對文字、照片、音樂、語言等周圍事物的識別;抽象事物的識別,如對已知的一個論點或一個問題的理解,如意識、思想、議論等,屬于概念識別研究的范疇。

模式識別又常被稱作模式分類,從處理問題的性質和解決問題的方法等角度來看,模式識別分為有監督的分類(supervised classification)和無監督的分類(unsupervised classification)兩種。兩者的主要差別在于,各實驗樣本所屬的類別是否預先已知。通常說來,有監督的分類往往需要提供大量已知類別的樣本,但在實際問題中,這是存在一定困難的,因此研究無監督的分類就變得十分有必要了。根據模式識別的發展和AI的應用,模式識別又可分為統計模式識別、結構模式識別、模糊模式識別和神經網絡模式識別四大類。

1.統計模式識別

統計模式識別是發展較早、較成熟的模式統計分類方法,是結合統計概率論的貝葉斯決策系統進行模式識別的技術,又稱為決策理論識別;其特點是提取待識別模式的一組統計特征,按某種決策函數進行分類判決。在統計模式識別中,被識別對象首先進行數字化處理,變換為適于計算機處理的數字信息。一個模式常常要用很大的信息量來表示;許多模式識別系統在數字化環節之后還進行預處理,用于除去混入的干擾信息并減少某些變形和失真;隨后進行特征抽取,即從數字化或預處理后的輸入模式中抽取一組特征。所謂特征是選定的一種度量,它對于一般的變形和失真保持不變或幾乎不變,且只含有盡可能少的冗余信息。特征抽取過程將輸入模式從對象空間映射到特征空間,這時模式可用特征空間中的一個點或一個特征矢量表示。這種映射不僅壓縮了信息量,而且易于分類。在決策理論方法中,特征抽取占有重要的地位,但尚無通用的理論指導,只能通過分析具體識別對象來決定選取何種特征。特征抽取后可進行分類,即從特征空間再映射到決策空間;為此引入鑒別函數,即由特征矢量計算出相應于各類別的鑒別函數值,通過對鑒別函數值進行比較實行分類。統計模式識別是比較經典的分類識別方法,在遙感圖像模式識別中有著非常廣泛的應用。

2.結構模式識別

結構模式識別又稱結構方法或語言學方法,其特點是把待識別模式看成由若干個較簡單子模式構成的集合。每一個子模式再分為若干個基元,基元按某種組合關系構成模式,就好像文章由字、詞、短語和句子按語法規則構成一樣,因此又稱為句法模式識別。

在結構模式識別中選取基元相當于在統計模式識別中選取特征。通常要求所選的基元既能對模式提供一個緊湊的反映其結構關系的描述,又要易于用非句法模式識別加以抽取。顯然,基元本身不應該含有重要的結構信息。模式以一組基元和它們的組合關系來描述,稱為模式描述語句,這相當于在語言中,句子和短語用詞組合、詞用字符組合一樣。基元組合成模式的規則,由所謂語法來指定。一旦基元被鑒別,識別過程可通過句法分析進行,即分析給定的模式語句是否符合指定的語法,滿足某類語法的即被分入該類。通常,模式識別方法的選擇取決于問題的性質。若被識別的對象極為復雜,且包含豐富的結構信息,通常采用結構模式識別方法;若被識別對象不很復雜或不含明顯的結構信息,就采用統計模式識別。這兩種方法不能截然分開,在結構模式識別中,基元本身就是用統計模式識別抽取的。在應用中,將這兩種方法結合起來分別施加于不同的層次,常常能收到較好的效果。

統計模式識別用數值來描述圖像的特征;結構模式識別則是用符號來描述圖像特征的,是對統計模式識別的補充。它模仿了語言學中句法的層次結構,采用分層描述的方法,把復雜圖像分解為單層或多層的簡單子圖像,主要突出了識別對象的結構信息。圖像識別是從統計方法發展起來的,而結構模式識別方法擴大了識別的能力,使其不僅限于對象物的分類,而且還用于景物的分析與物體結構的識別。結構模式識別主要用于文字識別、遙感圖形的識別與分析、紋理圖像的分析中。該方法的特點是識別方便,能夠反映模式的結構特征,描述模式的性質,對圖像畸變的抗干擾能力較強。

3.模糊模式識別

模糊模式識別是模糊集理論(FST)研究中的重要方向。模糊識別的模糊集方法(模糊模式識別)是對傳統模式識別方法的統計方法和結構模式識別的有用補充,就是能對模糊事物進行識別和判斷,其理論基礎是模糊數學。它根據人辨識事物的思維邏輯,吸取人腦的識別特點,將計算機中常用的二值邏輯轉向連續邏輯。一般常規識別方法則要求一個對象只能屬于某一類別,而模糊模式識別的結果是用被識別對象隸屬于某一類別的程度(隸屬度)來表示的;一個對象可以在某種程度上屬于某一類別,而在另一種程度上屬于另一類別。

模糊模式識別就是在模式識別中引入模糊數學方法,用模糊技術來設計機器識別系統,可簡化識別系統的結構,更廣泛、更深入地模擬人腦的思維過程,從而對客觀事物進行更為有效的分類與識別。基于FST的識別方法有最大隸屬原則識別法、擇近原則識別法和模糊聚類法。伴隨著各門學科,尤其是人文、社會學科及其他“軟科學”的不斷發展,數學化、定量化的趨勢也開始在這些領域中顯現。模糊模式識別不再簡單局限于自然科學的應用,同時也被應用到社會科學,特別是經濟管理學方面。

4.神經網絡模式識別

人工神經網絡(ANN)的研究起源于對生物神經系統的研究。它將若干處理單元(神經元)通過一定的互聯模型結成一個網絡,這個網絡通過一定的機制可以模仿人的神經系統的動作過程,以達到識別分類的目的。ANN是數據挖掘中的一種常用方法,其區別于其他識別方法的最大特點是它不要求對待識別的對象有太多的分析與了解,具有一定的智能化處理的特點。神經網絡側重于模擬和實現人認知過程中的感知過程、形象思維過程、分布式記憶過程、自學習和自組織過程,與符號處理是一種互補的關系。但是,神經網絡具有大規模并行、分布式存儲和處理能力,以及自組織、自適應和自學習的能力,特別適用于處理需要同時考慮許多因素和條件的不精確或模糊的信息處理問題。

用ANN進行模式識別時,利用神經網絡中神經元的記憶能力進行特征信息的存儲,通過外接激勵修改神經元之間的權值進行特定模式學習,就會形成一個功能強大的神經網絡。一般來說,首先用一定量的訓練樣本對分類器進行訓練,然后再利用該分類器對新的識別對象進行識別分類。

模式識別的任務是把模式正確地從特征空間映射到類空間,或者說是在特征空間中實現類的劃分。模式識別的難度和模式與特征空間中的分布密切相關,若特征空間中的任意兩個類可以用一個超平面去區分,那么模式是線性可分的,這時的識別較為容易。

神經網絡對所要處理的對象在樣本空間的分布狀態無須任何假設,而是直接從數據中學習樣本之間的關系,因而可以解決那些因樣本分布未知而無法解決的識別問題,并可根據樣本間的相似性,對那些與原始訓練樣本相似的數據進行正確處理。神經網絡分類器還兼有模式變換和模式特征提取的作用。神經網絡分類器一般對輸入模式信息的不完備或特征的缺損不太敏感,它在背景噪聲統計特性未知的情況下,性能更好且網絡具有更好的推廣能力。基于以上種種優點,神經網絡模式識別已發展成為模式識別領域的一個重要方法,起到了傳統模式識別方法不可替代的作用。

主站蜘蛛池模板: 吴旗县| 湄潭县| 绥棱县| 蓬安县| 根河市| 信丰县| 北碚区| 崇礼县| 木兰县| 东平县| 和田市| 扎兰屯市| 开封市| 长岛县| 赤壁市| 平武县| 苍溪县| 柳林县| 克什克腾旗| 万载县| 中方县| 清丰县| 封丘县| 盱眙县| 青州市| 昌平区| 纳雍县| 铜鼓县| 永宁县| 浦北县| 张家界市| 咸宁市| 临高县| 来安县| 巴林右旗| 民丰县| 平舆县| 嫩江县| 金昌市| 翁源县| 清苑县|