1.2.3 機器學習、人工智能和數據挖掘的關系
機器學習是人工智能的一個分支,作為人工智能的核心技術和實現手段,通過機器學習的方法解決人工智能面對的問題。機器學習是通過一些讓計算機可以自動“學習”的算法,對數據進行分析獲得規律,然后利用規律對新樣本進行預測。
機器學習是人工智能的核心技術,其中深度學習是機器學習的子集。深度學習的典型應用是選擇圖像、視頻、聲音或文本等多態數據訓練模型,然后用模型做出預測。例如,博弈游戲系統(如深藍)探索和優化未來的解空間(Solution Space),而深度學習則是在博弈游戲算法(如AlphaGo)的開發上付諸努力,取得了世人矚目的成就。
下面以自動駕駛汽車研發為例,說明機器學習和人工智能的關系。要實現自動駕駛,就需要對交通標志進行識別。首先,應用機器學習算法對交通標志進行學習,數據集中包括大量的交通標志圖片,使用卷積神經網絡進行訓練并生成模型。然后,自動駕駛系統使用攝像頭,讓模型實時識別交通標志,并不斷進行驗證、測試和調優,最終達到較高的識別精度。
當汽車識別出交通標志時,會針對不同的標志進行不同的操作。例如,遇到停車標志時,自動駕駛系統需要綜合車速和車距來決定何時剎車,過早或過晚剎車都會危及行車安全。除此之外,人工智能技術還需要應用控制理論處理不同道路狀況下的剎車策略,應用路徑尋優算法導航,通過綜合這些機器學習模型來產生自動化的行為。
數據挖掘和機器學習的關系越來越密切。數據挖掘是從大量的業務數據中挖掘隱藏的、有用的、正確的知識,促進決策的執行。數據挖掘的很多算法都來自機器學習和統計學,其中統計學關注理論研究并用于數據分析實踐形成獨立的學科,機器學習中有些算法借鑒了統計學理論,并在實際應用中進行優化,實現數據分析的目標。盡管演化計算、AlphaZero等少數機器學習算法使用的數據來自機器仿真,不是數據挖掘處理的真實業務數據,但大多數的機器學習和深度學習算法近年來逐漸跳出實驗室,從實際的業務數據中學習模式,解決實際問題,從而推動了人工智能新的發展。數據挖掘和機器學習的交集越來越大,機器學習成為數據挖掘的重要支撐技術。