以撒神秘糖果

書名：大數據可視分析方法與應用
作者名：陳為巫英才鮑虎軍等
本章字數： 1012字
更新時間： 2020-05-07 14:46:12

1.5　實例3——EasySVM：基于可視分析方法的支持向量機的白盒分析方法

1.5.1　簡介

支持向量機（SVM）是一種常用的監督學習方法，在文本分析、計算機視覺、生物信息等領域有著廣泛的應用。然而不同于決策樹等基于規則的分類方法，支持向量機的“黑盒”特性使得其模型訓練過程和預測過程較難理解。雖然這種隱藏細節過程的特性使用戶不必陷于煩瑣的細節參數調整過程之中，但對于非機器學習專家的決策者來說，這種黑盒特性帶來了較低的可解釋性和可信度。同時，支持向量機中非線性核函數的應用使得模型能夠處理復雜的非線性分類問題，但進一步增加了普通用戶的理解成本，降低了可解釋性，并同時增加了計算開銷。

基于上述兩個問題，本案例提出了一種基于“白盒”策略的支持向量機可視分析方法。該方法的目標在于：

①使用交互式可視化方法，使用戶盡可能清楚地理解訓練數據的分布以及模型的核心結構；

②提供一套使用多個線性支持向量機模型逼近非線性分類邊界的方法；

③能夠提取出模型中主要的分類模式，并將其轉化為分類規則，以便于解釋和傳播分類結果。

1.5.2　方法概覽

傳統的支持向量機模型通常被當作黑盒模型，難以被理解和解釋，并且其核心結構也很難直觀呈現出來。圖1-37展示了迭代式的可視化模型構建過程，其中包含三個主要模塊。

圖1-37　交互式可視化模型構建過程

（1）支持向量機的可視化構建過程

為了讓用戶能夠快速直觀地理解訓練過程中所使用的訓練數據，理解并探索數據分布、尋找數據中的異常值，本案例設計了一種基于正交投影的可視化方案，并同時將基于這些訓練數據構建出的支持向量機模型核心結構展示在視圖中。本案例還設計了一種交互式投影控制方法，可支持用戶對投影角度的自由調整。

（2）局部支持向量機的可視化構建

支持向量機通常使用線性核函數來處理數據中的線性分類邊界。對于非線性分類問題來說，非線性核函數是支持向量機模型中常用的一種方法。然而使用非線性核函數的模型的分類可解釋性更加復雜，并且計算開銷較大。這里提出了一種交互式可視分析方法，如圖1-38中流程（b）所示，通過構建多個線性支持向量機，以達到逼近非線性分類邊界的目的。

圖1-38　流程（a）：全局模型構建過程；流程（b）：局部模型構建過程

（3）可視化分類規則抽取

為了解決支持向量機的分類判斷標準難以向非專家用戶進行解釋的問題，我們設計了專門的可視化規則抽取視圖（圖1-39）。該視圖主要使用散點圖和平行坐標結合的方法，使用戶能夠交互式地在坐標軸上選取分類所在的區間，以生成分類規則。

圖1-39　EasySVM系統界面

官术网_书友最值得收藏!

大數據可視分析方法與應用

1.5 實例3——EasySVM：基于可視分析方法的支持向量機的白盒分析方法

1.5.1 簡介

1.5.2 方法概覽

1.5　實例3——EasySVM：基于可視分析方法的支持向量機的白盒分析方法

1.5.1　簡介

1.5.2　方法概覽