第3章 監督學習
機器學習的核心思想是使用從訓練樣本中獲取的特征信息來構造和優化模型。為實現機器學習的算法效果,有時需要對訓練樣本賦予一定的先驗信息,即給訓練樣本標注特定的標簽或標注信息,為機器學習的模型構造提供參照。這種以帶標簽樣本為訓練對象的機器學習方式通常稱為監督學習。可以將監督學習形象地理解為考生復習備考的過程:考前演算一定數量的練習題,通過將習題演算結果與習題答案進行對照分析,歸納總結出具有一定泛化能力的解題方法。監督學習是一種非常重要的機器學習方式,可有效解決分類、回歸等學習任務,在圖像處理與模式識別、自然語言理解與機器翻譯、數據挖掘與信息推薦、經濟預測與投資分析等眾多領域都有著非常成功的應用。本章比較系統地介紹線性模型、決策樹模型、貝葉斯模型和支持向量機等面向監督學習的模型結構及相關學習算法。