- 高維聚類知識發(fā)現關鍵技術研究及應用
- 陳建斌著
- 1201字
- 2018-12-27 17:34:47
前言
計算機技術的發(fā)展總是伴隨著企業(yè)計算技術的應用,企業(yè)需求又進一步刺激了計算機等信息科學技術的高速發(fā)展,數據庫技術在企業(yè)業(yè)務中發(fā)揮了重要作用。信息系統(tǒng)產生的數據量日益增多,企業(yè)應用中的業(yè)務數據在發(fā)揮了當期效用后,作為歷史資料大量積存起來。這些歷史數據中是否蘊藏著豐富的知識呢?這些知識能否被利用來為企業(yè)決策服務呢?這個問題在企業(yè)界和學術界受到越來越多的關注。
隨著知識經濟的發(fā)展,社會經濟生活發(fā)生了翻天覆地的變化,企業(yè)在日常決策中感受到的壓力越來越大。這種壓力來自于:(1)決策速度的壓力。面對競爭激烈的市場,企業(yè)需要快速決策,需要對市場快速作出反應;(2)決策成本的壓力。快速發(fā)展中的企業(yè),決策不容失誤,否則后果嚴重;(3)決策難度的壓力。面對紛繁復雜的市場信息,需要處理的信息繁多,需要考慮的因素眾多,決策難度顯著增加。企業(yè)決策者面臨前所未有的壓力。
自從信息技術在企業(yè)實踐中得到廣泛應用以來,人們一直在尋找決策支持系統(tǒng)的良好解決方案,希望信息技術的優(yōu)勢能在決策領域發(fā)揮重要作用。這種決策輔助在今天顯得尤為迫切。在決策支持領域,傳統(tǒng)的方法是由專家或信息技術人員總結并描述知識或規(guī)則,從外部輸入系統(tǒng),形成知識庫、模型庫和方法庫,結合數據庫進行決策輔助的活動。然而,由于知識太多而且具有復雜性和模糊性,難以準確描述和有效利用,模型又難以精確地表述具體的應用,導致許多決策支持系統(tǒng)失敗。數據庫知識發(fā)現技術(Knowledge Discovery in Database, KDD)的出現扭轉了這種局面。KDD 是從一個系統(tǒng)內部自動獲取知識,從大量數據中尋找蘊涵其中但尚未被發(fā)現的知識,這種數據應用技術的出現,必然會更有力地支持企業(yè)的戰(zhàn)略決策。
數據庫知識發(fā)現是一個很新的研究領域,由于其具有為企業(yè)創(chuàng)造巨大經濟效益的潛力,因而備受國內外研究人員關注。聚類分析是數據知識發(fā)現的關鍵技術之一,高維數據又是當前的重要應用領域之一,研究高維數據的聚類知識發(fā)現,具有重要的理論意義和現實意義。本書正是基于這種考慮,緊緊圍繞高維聚類的關鍵技術進行研究,提出了一整套高維聚類方法,其中包括高維數據相似性的定義、高維聚類算法(包括硬聚類和軟聚類)、離群點檢測和高維聚類結果表示方法等,為聚類知識發(fā)現提供了一種新的思路。全書共分為 9 章,內容包括:知識發(fā)現與 KDD、聚類知識發(fā)現及其關鍵技術、高維數據相似性的定義、基于粗圖模型的聚類算法研究、高維二元數據的映射聚類算法、基于螞蟻行為的聚類算法、高維數據空間的離群點檢測方法、高維數據聚類結果的表示和聚類知識發(fā)現數據建模及應用等。
本書適用于數據庫知識發(fā)現領域的研究和應用人員,也可作為相關領域博士生、碩士生和高年級本科生的參考書。
在本書寫作過程中,獲得了北京聯合大學商務學院“供應鏈知識管理與創(chuàng)新”科研基地建設項目資助,在此表示感謝。陳云飛對本書第 6 章有重要貢獻,在此表示感謝。本書在寫作中參閱了大量文獻,在此向這些文獻的作者們表示感謝!
作者
2008年9月于北京