官术网_书友最值得收藏!

1.2 最小二乘法

線性回歸模型通常使用均方誤差(MSE)作為損失函數,假設訓練集m個樣本,均方誤差損失函數定義為:

均方誤差的含義很容易理解,即所有實例預測值與實際值誤差平方的均值,模型的訓練目標是找到使得損失函數最小化的。式中的常數并沒有什么特殊的數學含義,僅是為了優化時求導方便。

損失函數最小值點是其極值點,可先求的梯度并令其為0,再通過解方程求得。

計算的梯度:

以上公式使用矩陣運算描述形式更為簡潔,設:

那么,梯度計算公式可寫為:

令梯度為0,解得:

式中,即為使得損失函數(均方誤差)最小的。需要注意的是,式中對求了逆矩陣,這要求是滿秩的。然而實際應用中,不總是滿秩的(例如特征數大于樣本數),此時可解出多個,選擇哪一個由學習算法的歸納偏好決定,常見做法是引入正則化項。

以上求解最優的方法被稱為普通最小二乘法(Ordinary Least Squares,OLS)。

主站蜘蛛池模板: 蕲春县| 新干县| 岳池县| 枣阳市| 波密县| 德惠市| 道真| 太和县| 宜阳县| 鹤山市| 濉溪县| 蚌埠市| 沙河市| 融水| 伊川县| 临武县| 新宁县| 五指山市| 治多县| 运城市| 西丰县| 浮山县| 博客| 马龙县| 大埔县| 鄂伦春自治旗| 太保市| 诸城市| 手机| 信宜市| 承德县| 潼南县| 娄烦县| 咸宁市| 阳城县| 平度市| 武威市| 东兴市| 综艺| 东台市| 天柱县|