- 數(shù)據(jù)挖掘方法及天體光譜挖掘技術
- 趙旭俊著
- 969字
- 2018-12-27 18:58:37
前言
隨著LAMOST望遠鏡的正式投入使用,獲取的光譜急劇增多。據(jù)統(tǒng)計,每晚將有2 萬~4 萬條光譜需要進行自動分類識別及參數(shù)測量,如何快速、準確地處理海量天體光譜成為瓶頸。數(shù)據(jù)挖掘是一門面向應用的新興學科分支,涉及人工智能、機器學習、模式識別、統(tǒng)計學、數(shù)據(jù)庫、可視化等多個學科領域,其主要目的是從大量原始數(shù)據(jù)中提取人們感興趣的、隱含的、尚未被發(fā)現(xiàn)的信息和知識,目前已廣泛應用于科學、工程、商業(yè)、醫(yī)學等領域。因此,采用數(shù)據(jù)挖掘作為天體光譜數(shù)據(jù)的分析方法是可行的、有價值的。
本書是作者近年來科研成果的總結。全書共5章,在緒論之后,全書可以分為以下3部分。
(1)關聯(lián)規(guī)則挖掘方法及應用,包括第2章。這一部分提出了基于準頻繁項目集的關聯(lián)規(guī)則挖掘、基于背景知識的關聯(lián)規(guī)則挖掘、約束FP-tree及其構造方法、基于信息熵的加權頻繁模式樹構造共4個算法,用來解決關聯(lián)規(guī)則挖掘中效率較低、掃描數(shù)據(jù)庫次數(shù)較多、背景知識無法直接給出等問題。同時,將這幾個算法用在天體光譜的數(shù)據(jù)處理中,實現(xiàn)了天體光譜屬性之間的相關性分析,為探索新的天體規(guī)律提供了技術支持。
(2)離群數(shù)據(jù)挖掘方法及應用,包括第3章。這一部分提出了基于距離支持度的離群數(shù)據(jù)挖掘、基于分階段模糊聚類的離群數(shù)據(jù)挖掘、基于信息熵的離群數(shù)據(jù)挖掘、基于特征屬性子空間的離群數(shù)據(jù)挖掘共4種算法,從而提高了離群挖掘的效率及準確率,同時實現(xiàn)了天體光譜數(shù)據(jù)的離群挖掘,為發(fā)現(xiàn)未知天體提供了一種新的方法。
(3)天體光譜數(shù)據(jù)的其他挖掘方法及天體光譜數(shù)據(jù)挖掘原型系統(tǒng),包括第4章和第5章。這一部分介紹了天體光譜數(shù)據(jù)的正、負項目集挖掘、基于約束概念格的恒星光譜分類規(guī)則提取、恒星光譜的分類規(guī)則后處理等方法,之后給出了幾個天體光譜數(shù)據(jù)挖掘原型系統(tǒng),介紹了系統(tǒng)的功能模塊、體系結構,以及系統(tǒng)運行的相關界面。
本書的完成得到了太原科技大學人工智能實驗室、計算機科學與技術學院各位同人的大力支持,尤其是張繼福教授、蔡江輝博士為本書提出了很多很好的建議,在此一并致以誠摯的謝意。
本書所涉及的部分研究工作得到了山西省青年科學基金項目(項目編號:2012021015-4)和山西省高校高新技術產(chǎn)業(yè)化項目(項目編號:20121011)的資助,在此謹向山西省自然科學基金委員會和山西省教育廳表示深深的感謝并致以敬意。
由于作者的水平有限,書中難免有不妥之處,懇請各位專家和廣大讀者給予批評指正。
編 者
2013年5月
- LabVIEW虛擬儀器從入門到測控應用130例
- Introduction to DevOps with Kubernetes
- Implementing Splunk 7(Third Edition)
- 深度學習與目標檢測
- 零起點學西門子S7-200 PLC
- 精通LabVIEW程序設計
- Excel 2007終極技巧金典
- SQL Server數(shù)據(jù)庫應用基礎(第2版)
- 寒江獨釣:Windows內(nèi)核安全編程
- Hands-On Deep Learning with Go
- ARM嵌入式系統(tǒng)開發(fā)完全入門與主流實踐
- Mastercam X5應用技能基本功特訓
- 巧學活用Photoshop
- 服務器配置與應用(Windows Server 2008 R2)
- Adobe Edge Quickstart Guide