官术网_书友最值得收藏!

4.4.2 套索回歸的參數(shù)調(diào)節(jié)

在上面的例子里,我們用了alpha的默認值1.0。為了降低欠擬合的程度,我們可以試著降低alpha的值。與此同時,我們還需要增加最大迭代次數(shù)(max_iter)的默認設置。讓我們來看下面的代碼:

運行代碼,得到結果如圖4-17所示。

圖4-17 alpha等于0.1時的套索回歸得分

【結果分析】從結果來看,降低alpha值可以擬合出更復雜的模型,從而在訓練數(shù)據(jù)集和測試數(shù)據(jù)集都能獲得良好的表現(xiàn)。相對嶺回歸,套索回歸的表現(xiàn)還要稍好一點,而且它只用了10個特征中的7個,這一點也會使模型更容易被人理解。

但是,如果我們把alpha值設置得太低,就等于把正則化的效果去除了,那么模型就可能會像線性回歸一樣,出現(xiàn)過擬合的問題。比如我們把alpha值設為0.0001,試著運行下面的代碼:

代碼運行的結果如圖4-18所示。

圖4-18 alpha等于0.0001時套索回歸的模型評分

【結果分析】從結果中我們看到,套索回歸使用了全部的特征,而且在測試數(shù)據(jù)集中的得分稍微低于在alpha等于0.1時的得分,這說明降低alpha的數(shù)值會讓模型傾向于出現(xiàn)過擬合的現(xiàn)象。

主站蜘蛛池模板: 昌平区| 手游| 新干县| 富裕县| 平谷区| 新化县| 民丰县| 海晏县| 陇西县| 汕尾市| 龙游县| 大关县| 察雅县| 商洛市| 濮阳市| 晋宁县| 威海市| 新绛县| 湘乡市| 万载县| 潜江市| 双鸭山市| 惠水县| 大名县| 十堰市| 靖宇县| 滕州市| 宝坻区| 黑水县| 洪湖市| 布尔津县| 东安县| 洱源县| 昭觉县| 石首市| 阳春市| 余江县| 永善县| 辽阳县| 奉节县| 上林县|