- Python數據可視化之matplotlib精進
- 劉大成
- 638字
- 2019-06-19 15:45:04
3.1 機器學習中的判別分析示意圖
判別分析就是根據訓練樣本建立判別函數,借助判別函數對給定的新樣本數據做出類別歸屬的分類預測方法,是機器學習中的經典分類預測方法。同樣,我們會通過判別函數對給定的一組新樣本做出分類歸屬的決策。因此,將分類歸屬結果以可視化形式進行展示就顯得特別有意義和重要。下面,我們就通過具體代碼來講解判別分析的分類歸屬預測的可視化方法。
1.代碼實現


2.運行結果(見圖3-1)

圖3-1
3.代碼精講
(1)制造新樣本數據sample,樣本數據中含有兩個影響因素var1和var2。
(2)將判別函數“df=2*var1+var2”的取值與閾值“td=12”進行比較,從而判斷每個樣本點的分類歸屬。
注意:
要想將判別結果有效地展示出來,需要使用函數masked_where()進行數據掩飾,進而利用可視化手段將判別后的數據歸屬有效地展示出來。
函數masked_where()是NumPy包中的ma包的函數,調用方法是numpy.ma.masked_where()。函數masked_where()的調用簽名是masked_where(condition,a),其中各參數的含義如下。
● condition:對數組中的數據進行掩飾需要滿足的條件。
● a:進行數據掩飾的數組。
因此,當參數condition的條件被滿足后,就會將數組中相應元素位置的判斷結果是“True”的數據進行掩飾。數組中被掩飾的數據依然保留在數組中,只是以“--”形式展示數組中被掩飾的元素,其他不滿足條件的元素還以原始數據形式存儲在數組中。
(3)通過調用“ax.scatter(var1,var2,s=cates11*50,marker="s",c=cates11)”和“ax.scatter(var1,var2,s=cates21*50,marker="o",c=cates21)”語句,將進行數據掩飾后的數組分別作為參數s和c的參數值,從而實現新樣本sample的判別結果的有效展示。
(4)通過調用實例方法plot()繪制判別函數曲線,同時,調整曲線的透明度。
- 數據分析實戰:基于EXCEL和SPSS系列工具的實踐
- Python絕技:運用Python成為頂級數據工程師
- Hands-On Machine Learning with Microsoft Excel 2019
- Mastering Ninject for Dependency Injection
- 工業大數據分析算法實戰
- 數據庫原理與應用(Oracle版)
- 數據庫技術及應用教程
- Hadoop集群與安全
- Expert Python Programming(Third Edition)
- 數據庫查詢優化器的藝術:原理解析與SQL性能優化
- SQL Server 2008寶典(第2版)
- 數據分析思維:產品經理的成長筆記
- Arquillian Testing Guide
- 社交網站的數據挖掘與分析(原書第2版)
- 數據分析方法及應用:基于SPSS和EXCEL環境