官术网_书友最值得收藏!

1.5 實例3——EasySVM:基于可視分析方法的支持向量機的白盒分析方法

1.5.1 簡介

支持向量機(SVM)是一種常用的監督學習方法,在文本分析、計算機視覺、生物信息等領域有著廣泛的應用。然而不同于決策樹等基于規則的分類方法,支持向量機的“黑盒”特性使得其模型訓練過程和預測過程較難理解。雖然這種隱藏細節過程的特性使用戶不必陷于煩瑣的細節參數調整過程之中,但對于非機器學習專家的決策者來說,這種黑盒特性帶來了較低的可解釋性和可信度。同時,支持向量機中非線性核函數的應用使得模型能夠處理復雜的非線性分類問題,但進一步增加了普通用戶的理解成本,降低了可解釋性,并同時增加了計算開銷。

基于上述兩個問題,本案例提出了一種基于“白盒”策略的支持向量機可視分析方法。該方法的目標在于:

①使用交互式可視化方法,使用戶盡可能清楚地理解訓練數據的分布以及模型的核心結構;

②提供一套使用多個線性支持向量機模型逼近非線性分類邊界的方法;

③能夠提取出模型中主要的分類模式,并將其轉化為分類規則,以便于解釋和傳播分類結果。

1.5.2 方法概覽

傳統的支持向量機模型通常被當作黑盒模型,難以被理解和解釋,并且其核心結構也很難直觀呈現出來。圖1-37展示了迭代式的可視化模型構建過程,其中包含三個主要模塊。

圖1-37 交互式可視化模型構建過程

(1)支持向量機的可視化構建過程

為了讓用戶能夠快速直觀地理解訓練過程中所使用的訓練數據,理解并探索數據分布、尋找數據中的異常值,本案例設計了一種基于正交投影的可視化方案,并同時將基于這些訓練數據構建出的支持向量機模型核心結構展示在視圖中。本案例還設計了一種交互式投影控制方法,可支持用戶對投影角度的自由調整。

(2)局部支持向量機的可視化構建

支持向量機通常使用線性核函數來處理數據中的線性分類邊界。對于非線性分類問題來說,非線性核函數是支持向量機模型中常用的一種方法。然而使用非線性核函數的模型的分類可解釋性更加復雜,并且計算開銷較大。這里提出了一種交互式可視分析方法,如圖1-38中流程(b)所示,通過構建多個線性支持向量機,以達到逼近非線性分類邊界的目的。

圖1-38 流程(a):全局模型構建過程;流程(b):局部模型構建過程

(3)可視化分類規則抽取

為了解決支持向量機的分類判斷標準難以向非專家用戶進行解釋的問題,我們設計了專門的可視化規則抽取視圖(圖1-39)。該視圖主要使用散點圖和平行坐標結合的方法,使用戶能夠交互式地在坐標軸上選取分類所在的區間,以生成分類規則。

圖1-39 EasySVM系統界面

主站蜘蛛池模板: 嘉善县| 固始县| 张北县| 横山县| 元朗区| 元氏县| 丘北县| 大英县| 周至县| 洮南市| 余庆县| 克东县| 修文县| 开化县| 阳春市| 开鲁县| 内江市| 新龙县| 宁明县| 开远市| 汉沽区| 兴海县| 临高县| 深圳市| 孝感市| 湖北省| 文昌市| 房山区| 辽中县| 建德市| 波密县| 伊金霍洛旗| 左权县| 日喀则市| 乌拉特后旗| 电白县| 平山县| 望谟县| 巴里| 叶城县| 河北省|