官术网_书友最值得收藏!

1.1 數據挖掘簡介

數據挖掘始于20世紀80年代末,早期主要是指從數據庫中發現知識(Knowledge Discovery in Database, KDD)。數據挖掘的概念源于1995年在加拿大召開的第一屆國際知識發現與數據挖掘大會,隨后數據挖掘迅速在世界范圍內成為研究的熱點,大量的學者和企業紛紛投入到數據挖掘理論研究和工具研發的行列中來。1997年,第三屆KDD國際學術大會上舉行了數據挖掘工具的實測活動。從此,數據挖掘技術進入了快速發展時期。

數據挖掘(Data Mining)是KDD的核心部分,它是指從數據集合中自動抽取隱藏在數據中的那些有用信息的非平凡過程,這些信息的表現形式有規則、概念、規律和模式等。進入21世紀后,數據挖掘成為一門比較成熟的交叉學科,數據挖掘技術也伴隨著信息技術的發展日益成熟起來。

隨著數據挖掘技術的發展,其應用領域也在不斷地擴展和深化。常見的數據挖掘的行業應用如表1-1所示。

表1-1 常見的數據挖掘的行業應用

數據挖掘常常要利用機器學習提供的算法來分析海量數據,而深度學習作為一種機器學習算法,在很多領域的表現都優于傳統機器學習算法,如在圖像分類與識別、語音識別與合成、人臉識別、視頻分類與行為識別等領域都有著不俗的表現。深度學習能夠讓機器模仿視聽和思考等人類行為活動,解決很多復雜的模式識別難題,其最終目標是讓機器能夠像人一樣具有分析學習能力,能夠識別文字、圖像和聲音等數據。

2006年,杰弗里·辛頓首次提出深度學習的概念。后來,2015年第9期的《自然》雜志提到了與深度學習定義相關的內容:深度學習方法是具有多層次特征描述的特征學習,通過一些簡單但非線性的模塊將每一層特征描述(從未加工的數據開始)轉化為更高一層的、更為抽象的特征描述。

深度學習特指基于深層神經網絡實現的模型或算法,其關鍵在于這些層次的特征不是由人工設計的,而是使用一種通用的學習步驟從數據中學習并獲取的。深度學習能夠自動地將簡單的特征組合成更加復雜的特征,并使用這些組合特征解決問題。

雖然深度學習在研發初期受到了很多大腦工作原理的啟發,但現代深度學習技術的發展并不拘泥于模擬人腦神經元和人腦的工作機制,而是已經超越了神經科學的觀點,可以更廣泛地適用于各種并不是受神經網絡啟發而產生的機器學習框架。

主站蜘蛛池模板: 阜宁县| 临高县| 通道| 大姚县| 石泉县| 镇原县| 左贡县| 广平县| 嘉义市| 黄平县| 福鼎市| 杭锦后旗| 读书| 翁牛特旗| 玉门市| 岐山县| 商河县| 忻城县| 通化市| 隆化县| 黄大仙区| 鹤峰县| 运城市| 福贡县| 阿城市| 水城县| 涟水县| 白水县| 拜泉县| 龙岩市| 阿坝县| 长岭县| 贺兰县| 饶河县| 芜湖县| 政和县| 贵港市| 历史| 沧源| 尚义县| 通河县|