官术网_书友最值得收藏!

1.1.1 機器學習問題的基本框架

機器學習(Machine Learning)是現代智能技術中重要的一個方面,是一個系統自我改進的過程,可以從觀測樣本去研究、分析對象,去預測輸出。機器學習問題的基本模型框架如圖1.1.1所示。輸入信號x經過系統得到輸出信號y,學習機根據訓練樣本對系統的輸入/輸出做出估計,得到最準確的預測輸出。其數學表述為:輸入變量x與輸出變量y之間存在一定的未知依賴關系,即服從某一未知的聯合概率密度pXYxy)。機器學習的目的就是根據N個獨立同分布的觀測樣本(x(1),y(1)),(x(2),y(2)),…,(xN),yN)),在一組函數{fxw)}中求出最優的函數fxw0)對依賴關系進行估計,使期望風險Rw)最小。

圖1.1.1 機器學習問題的基本模型框架

式中,{fx,w)}為預測函數集,w為函數的廣義參數,所以{fx,w)}可表示為任何函數集。Ly,fx,w))為損失函數,表示由于對y進行預測而造成的損失。

機器學習問題根據不同的學習目的可分為三類基本的學習問題,即模式識別、函數擬合及概率密度估計。

在模式識別問題中,輸出變量y即為類別,可用二值函數{0,1}或{-1,1}來表示。此時,預測函數fx,w)稱為指示函數,損失函數定義為

在函數擬合問題中,變量yx的函數,y是連續變量,所以損失函數可以用平方誤差表示,即

在概率密度估計問題中,學習的目的就是根據訓練樣本確定輸入變量x的概率密度,所以設估計的概率密度函數為px,w),則損失函數可定義為

主站蜘蛛池模板: 五常市| 双流县| 海丰县| 泰和县| 双柏县| 屯门区| 宜春市| 聊城市| 唐河县| 清新县| 谷城县| 黄平县| 新宁县| 惠安县| 东兴市| 通城县| 新安县| 阿拉善右旗| 永和县| 高碑店市| 饶平县| 奉节县| 灵石县| 福清市| 托克逊县| 措勤县| 新和县| 宜都市| 陵川县| 邵武市| 阳谷县| 丰城市| 蒙城县| 常州市| 专栏| 壤塘县| 桐柏县| 石河子市| 潍坊市| 库车县| 麦盖提县|