官术网_书友最值得收藏!

3.1 機器學習中的判別分析示意圖

判別分析就是根據訓練樣本建立判別函數,借助判別函數對給定的新樣本數據做出類別歸屬的分類預測方法,是機器學習中的經典分類預測方法。同樣,我們會通過判別函數對給定的一組新樣本做出分類歸屬的決策。因此,將分類歸屬結果以可視化形式進行展示就顯得特別有意義和重要。下面,我們就通過具體代碼來講解判別分析的分類歸屬預測的可視化方法。

1.代碼實現

2.運行結果(見圖3-1)

圖3-1

3.代碼精講

(1)制造新樣本數據sample,樣本數據中含有兩個影響因素var1和var2。

(2)將判別函數“df=2*var1+var2”的取值與閾值“td=12”進行比較,從而判斷每個樣本點的分類歸屬。

注意:

要想將判別結果有效地展示出來,需要使用函數masked_where()進行數據掩飾,進而利用可視化手段將判別后的數據歸屬有效地展示出來。

函數masked_where()是NumPy包中的ma包的函數,調用方法是numpy.ma.masked_where()。函數masked_where()的調用簽名是masked_where(condition,a),其中各參數的含義如下。

● condition:對數組中的數據進行掩飾需要滿足的條件。

● a:進行數據掩飾的數組。

因此,當參數condition的條件被滿足后,就會將數組中相應元素位置的判斷結果是“True”的數據進行掩飾。數組中被掩飾的數據依然保留在數組中,只是以“--”形式展示數組中被掩飾的元素,其他不滿足條件的元素還以原始數據形式存儲在數組中。

(3)通過調用“ax.scatter(var1,var2,s=cates11*50,marker="s",c=cates11)”和“ax.scatter(var1,var2,s=cates21*50,marker="o",c=cates21)”語句,將進行數據掩飾后的數組分別作為參數s和c的參數值,從而實現新樣本sample的判別結果的有效展示。

(4)通過調用實例方法plot()繪制判別函數曲線,同時,調整曲線的透明度。

主站蜘蛛池模板: 商河县| 虞城县| 遂昌县| 安图县| 成都市| 迁安市| 霍林郭勒市| 林芝县| 平陆县| 丹东市| 龙岩市| 长泰县| 胶南市| 南靖县| 老河口市| 雷波县| 贺兰县| 盐山县| 视频| 陕西省| 长顺县| 拉萨市| 当阳市| 临安市| 东宁县| 屏东县| 凤山县| 托克托县| 特克斯县| 西畴县| 方山县| 尼勒克县| 大冶市| 巴里| 托克逊县| 郯城县| 米泉市| 漠河县| 剑河县| 调兵山市| 包头市|