官术网_书友最值得收藏!

1.6 模型的泛化、過擬合與欠擬合

在有監督學習中,我們會在訓練數據集上建立一個模型,之后會把這個模型用于新的,之前從未見過的數據中,這個過程稱為模型的泛化(generalization)。當然我們希望模型對于新數據的預測能夠盡可能準確,這樣才能說模型泛化的準確度比較高。

那么我們用什么樣的標準來判斷一個模型的泛化是比較好的,還是比較差的呢?

我們可以使用測試數據集對模型的表現進行評估。如果你在訓練數據集上使用了一個非常復雜的模型,以至于這個模型在擬合訓練數據集時表現非常好,但是在測試數據集的表現非常差,說明模型出現了過擬合(overfitting)的問題。

相反,如果模型過于簡單,連訓練數據集的特點都不能完全考慮到的話,那么這樣的模型在訓練數據集和測試數據集的得分都會非常差,這個時候我們說模型出現了欠擬合(underfitting)的問題。

而只有模型在訓練數據集和測試數據集得分都比較高的情況下,我們才會認為模型對數據擬合的程度剛剛好,同時泛化的表現也會更出色。

主站蜘蛛池模板: 南川市| 塔河县| 彩票| 秀山| 招远市| 清河县| 喀什市| 张家界市| 桦甸市| 利津县| 二手房| 额敏县| 梨树县| 安义县| 元江| 桐城市| 淮滨县| 张掖市| 泾川县| 昌乐县| 通河县| 康平县| 武清区| 乡宁县| 彭阳县| 台东市| 商都县| 沧州市| 全椒县| 康平县| 岳池县| 磐石市| 鄂托克前旗| 仙桃市| 集安市| 泸州市| 泽州县| 府谷县| 芦山县| 波密县| 华坪县|