捕鱼游戏无限金币无限钻石

書名： Python數據可視化之matplotlib精進
作者名：劉大成
本章字數： 638字
更新時間： 2019-06-19 15:45:04

3.1 機器學習中的判別分析示意圖

判別分析就是根據訓練樣本建立判別函數，借助判別函數對給定的新樣本數據做出類別歸屬的分類預測方法，是機器學習中的經典分類預測方法。同樣，我們會通過判別函數對給定的一組新樣本做出分類歸屬的決策。因此，將分類歸屬結果以可視化形式進行展示就顯得特別有意義和重要。下面，我們就通過具體代碼來講解判別分析的分類歸屬預測的可視化方法。

1.代碼實現

2.運行結果（見圖3-1）

圖3-1

3.代碼精講

（1）制造新樣本數據sample，樣本數據中含有兩個影響因素var1和var2。

（2）將判別函數“df=2*var1+var2”的取值與閾值“td=12”進行比較，從而判斷每個樣本點的分類歸屬。

注意：

要想將判別結果有效地展示出來，需要使用函數masked_where（）進行數據掩飾，進而利用可視化手段將判別后的數據歸屬有效地展示出來。

函數masked_where（）是NumPy包中的ma包的函數，調用方法是numpy.ma.masked_where（）。函數masked_where（）的調用簽名是masked_where（condition，a），其中各參數的含義如下。

● condition：對數組中的數據進行掩飾需要滿足的條件。

● a：進行數據掩飾的數組。

因此，當參數condition的條件被滿足后，就會將數組中相應元素位置的判斷結果是“True”的數據進行掩飾。數組中被掩飾的數據依然保留在數組中，只是以“--”形式展示數組中被掩飾的元素，其他不滿足條件的元素還以原始數據形式存儲在數組中。

（3）通過調用“ax.scatter（var1，var2，s=cates11*50，marker="s"，c=cates11）”和“ax.scatter（var1，var2，s=cates21*50，marker="o"，c=cates21）”語句，將進行數據掩飾后的數組分別作為參數s和c的參數值，從而實現新樣本sample的判別結果的有效展示。

（4）通過調用實例方法plot（）繪制判別函數曲線，同時，調整曲線的透明度。

官术网_书友最值得收藏!

Python數據可視化之matplotlib精進

3.1 機器學習中的判別分析示意圖