官术网_书友最值得收藏!

第 1 章 機器學習與sklearn

本章將通過介紹sklearn(scikit-learn)為讀者展現機器學習能解決的問題和解決這些問題的合理方案。sklearn是基于Python語言的機器學習工具,建立在NumPy、SciPy和Matplotlib三大工具包之上。在使用sklearn的過程中,建議閱讀一下它的源代碼,這樣能夠加深對算法的理解,提升編程水準。

sklearn提供了分類、回歸、聚類和降維4個類別的經典模型。對于如何根據數據和任務來選擇合適的方法,sklearn官網提供了一張經典的思維導圖,如圖1-1所示,其中的思路如下。

  • 如果數據量小于50,一般是無法使用sklearn的機器學習算法建模的,因為機器學習需要借助統計數據才能完成。
  • 如果數據有類別標簽,請使用分類模型。
  • 如果數據需要預測精確值,請使用回歸模型。
  • 如果想查看數據分布情況,可以考慮使用降維算法。
  • 如果數據沒有類別標簽,可以使用聚類算法。

圖 1-1 sklearn算法選擇指導圖

主站蜘蛛池模板: 遂川县| 宁城县| 夹江县| 桂东县| 塔城市| 太原市| 敖汉旗| 平罗县| 靖州| 中江县| 麻城市| 遂川县| 麻阳| 曲阳县| 左云县| 丹巴县| 林甸县| 垣曲县| 安顺市| 庆云县| 白沙| 虎林市| 泰和县| 建始县| 类乌齐县| 丹棱县| 南涧| 镇远县| 翁牛特旗| 绿春县| 丹东市| 华容县| 敦煌市| 扎赉特旗| 临沂市| 大邑县| 吉木乃县| 神农架林区| 凯里市| 慈利县| 邓州市|