- 機器學習:使用OpenCV、Python和scikit-learn進行智能圖像處理(原書第2版)
- (印)阿迪蒂亞·夏爾馬 維什韋什·拉維·什里馬利 (美)邁克爾·貝耶勒
- 521字
- 2020-11-24 18:13:03
4.2 理解特征工程
不管你是否相信,一個機器學習系統(tǒng)的學習效果都主要取決于訓練數(shù)據(jù)的質(zhì)量。盡管每種學習算法都有其優(yōu)點和缺點,但是性能的差異往往取決于數(shù)據(jù)準備或者數(shù)據(jù)表示的方式。因此,可以把特征工程理解為數(shù)據(jù)表示的一種工具。機器學習算法試圖從樣本數(shù)據(jù)中學習問題的解決方案,而特征工程會問:用于學習問題的解決方案的樣本數(shù)據(jù)的最佳表示是什么?
是否還記得,在前面我們討論過一個完整的機器學習管道。在那里我們提及過特征提取,但是還有沒有真正討論其究竟是什么。讓我們來看看特征提取是如何融入機器學習管道的,見圖4-1。

圖4-1 特征提取與機器學習過程
簡單提示一下,我們已經(jīng)討論過,特征工程可以分為兩個階段:
- 特征選擇(Feature selection):這是識別數(shù)據(jù)中重要屬性(或者特征)的過程。一張圖像的特征可能是邊緣、角點或脊的位置。在這一章,我們將研究OpenCV提供的一些更高級的特征描述符,例如二值魯棒獨立基本特征(Binary Robust Independent Elementary Feature,BRIEF)以及面向FAST和可旋轉(zhuǎn)的BRIEF(Oriented FAST and Rotated BRIEF,ORB)。
- 特征提取(Feature extraction):這實際上是將原始數(shù)據(jù)變換到期望特征空間以滿足機器學習算法的過程,如圖4-1所示。例如Harris操作符,它允許我們提取一張圖像中的角點(即一個選擇的特征)。
剩下要做的就是逐步介紹這些過程,并討論一些最常見的數(shù)據(jù)預處理技術(shù)。
推薦閱讀
- Photoshop CS6入門與提高(暢銷精華版)
- VR+:融合與創(chuàng)新
- Premiere Pro 2020實用教程
- 影視特效鏡頭跟蹤技術(shù)精粹(第2版)
- AutoCAD繪圖要義
- 新印象 Premiere 短視頻剪輯基礎(chǔ)與實戰(zhàn)(培訓教材版)
- 數(shù)碼攝影后期密碼 Photoshop CS6旅游風光
- 新媒體實用工具全攻略:圖文制作+視頻剪輯+音頻處理+輔助運營
- Lightroom 4高手之道數(shù)碼攝影后期處理全解析
- AutoCAD與工程繪圖
- Unity 3D 完全自學教程
- 數(shù)碼攝影后期密碼Photoshop CS6光影神話
- 抖音剪映:熱門短視頻創(chuàng)作就這么簡單
- 3ds Max 2012中文版完全自學一本通
- 3D科研繪圖與學術(shù)圖表繪制從入門到精通