- 深入淺出Python機器學習
- 段小手
- 396字
- 2022-07-29 15:23:12
1.6 模型的泛化、過擬合與欠擬合
在有監督學習中,我們會在訓練數據集上建立一個模型,之后會把這個模型用于新的,之前從未見過的數據中,這個過程稱為模型的泛化(generalization)。當然我們希望模型對于新數據的預測能夠盡可能準確,這樣才能說模型泛化的準確度比較高。
那么我們用什么樣的標準來判斷一個模型的泛化是比較好的,還是比較差的呢?
我們可以使用測試數據集對模型的表現進行評估。如果你在訓練數據集上使用了一個非常復雜的模型,以至于這個模型在擬合訓練數據集時表現非常好,但是在測試數據集的表現非常差,說明模型出現了過擬合(overfitting)的問題。
相反,如果模型過于簡單,連訓練數據集的特點都不能完全考慮到的話,那么這樣的模型在訓練數據集和測試數據集的得分都會非常差,這個時候我們說模型出現了欠擬合(underfitting)的問題。
而只有模型在訓練數據集和測試數據集得分都比較高的情況下,我們才會認為模型對數據擬合的程度剛剛好,同時泛化的表現也會更出色。
推薦閱讀
- Android項目開發入門教程
- Python進階編程:編寫更高效、優雅的Python代碼
- 深入理解Elasticsearch(原書第3版)
- HTML5秘籍(第2版)
- Learning Unreal Engine Android Game Development
- AutoCAD 2009實訓指導
- MySQL入門很輕松(微課超值版)
- 現代C++編程實戰:132個核心技巧示例(原書第2版)
- Python項目實戰從入門到精通
- App Inventor 2 Essentials
- Java EE Web應用開發基礎
- Photoshop智能手機APP界面設計
- Python Machine Learning Cookbook
- Spring Data JPA從入門到精通
- Python 3快速入門與實戰