官术网_书友最值得收藏!

2.4 本章小結

本章我們討論了處理機器學習問題的一個典型工作流程:我們如何從原始數據中提取信息特征;我們如何使用數據和標簽來訓練一個機器學習模型;以及我們如何使用最終確定的模型來預測新的數據標簽。我們得知把數據拆分成一個訓練集和一個測試集是非常重要的,因為這是了解一個模型對新數據點泛化性能的唯一方法。

在軟件方面,我們大幅提升了自身的Python技能。我們學習了如何使用NumPy數組存儲和操作數據,以及如何使用Matplotlib進行數據可視化。我們討論了scikit-learn及其很多有用的數據資源。最后,我們還討論了OpenCV自有的TrainData容器,該容器為OpenCV的C++ API用戶提供了一些幫助。

有了這些工具,我們現在就準備實現第一個真正的機器學習模型了!在第3章,我們將重點關注監督學習及其兩個主要問題類別:分類和回歸。

主站蜘蛛池模板: 阳春市| 云龙县| 衡阳县| 吕梁市| 华池县| 金阳县| 理塘县| 宁都县| 伊通| 贵州省| 鱼台县| 曲阳县| 积石山| 连城县| 新晃| 黎川县| 八宿县| 宁波市| 辉县市| 延吉市| 罗定市| 元谋县| 高碑店市| 罗甸县| 奎屯市| 三门县| 广安市| 丰都县| 增城市| 巴彦县| 象山县| 乐清市| 遵化市| 元朗区| 阿合奇县| 台东市| 清流县| 寻乌县| 盖州市| 垣曲县| 万山特区|