- 數據挖掘方法及天體光譜挖掘技術
- 趙旭俊著
- 500字
- 2018-12-27 18:58:37
第1章 緒論
隨著數據庫和計算機網絡的廣泛應用,數據處理領域面臨兩方面的難題。一方面是數據雪崩:現實世界中產生的數據量呈指數級增長,人們所擁有的信息量急劇增大,超大規模的數據集與日俱增,待處理的海量數據層出不窮,信息量遠遠超過了人腦掌握、消化的能力,這就是數據雪崩。另一方面,先進的觀測技術和現代監測儀器的推廣和應用使我們的監測范圍更加廣泛,隨著數據維度的增加,許多數據分析變得非常困難,特別是隨著維度的增加,數據在它所占據的空間中越來越稀疏。對于分類,這可能意味著沒有足夠的數據對象來創建模型,將所有可能的對象可靠地指派到一個類;對于聚類,點之間的密度和距離的定義(對聚類而言是至關重要的)失去了意義,這就是“維災難”。
如此龐大的信息量已經遠遠超過了人腦可以駕馭的范圍,傳統的人工處理方法已經無法處理和利用如此大規模的海量、高維數據,更無法快速、準確地從中獲取有用知識,傳統的數據庫技術和數據處理手段也已經不能滿足要求。由于人們迫切需要將這些數據轉換成有用的信息和知識,所以如何從海量、高維數據中快速提取有用信息已成為亟待解決的問題之一。正是基于這樣的需求,數據挖掘技術受到了廣泛關注,并得以快速發展。
推薦閱讀
- Big Data Analytics with Hadoop 3
- Hands-On Intelligent Agents with OpenAI Gym
- 腦動力:Linux指令速查效率手冊
- Getting Started with Clickteam Fusion
- 大數據專業英語
- Getting Started with Oracle SOA B2B Integration:A Hands-On Tutorial
- 計算機應用基礎·基礎模塊
- 來吧!帶你玩轉Excel VBA
- CSS全程指南
- ServiceNow Cookbook
- Maya 2012從入門到精通
- 基于ARM 32位高速嵌入式微控制器
- 統計學習理論與方法:R語言版
- 項目管理成功利器Project 2007全程解析
- OpenStack Cloud Computing Cookbook