- 機(jī)器學(xué)習(xí):使用OpenCV、Python和scikit-learn進(jìn)行智能圖像處理(原書第2版)
- (印)阿迪蒂亞·夏爾馬 維什韋什·拉維·什里馬利 (美)邁克爾·貝耶勒
- 420字
- 2020-11-24 18:13:03
第4章 數(shù)據(jù)表示和特征工程
在第3章中,我們建立了第一個監(jiān)督學(xué)習(xí)模型,并將其應(yīng)用于一些像Iris和Boston這樣的經(jīng)典數(shù)據(jù)集。但是,在現(xiàn)實(shí)世界中,作為預(yù)封裝數(shù)據(jù)庫一部分的數(shù)據(jù)很少以簡潔的<n_samples x n_features>特征矩陣的形式出現(xiàn)。我們的任務(wù)是找到一種有意義的方式表示數(shù)據(jù)。尋找表示數(shù)據(jù)最優(yōu)方法的過程稱為特征工程(feature engineering),這是數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)實(shí)踐者試圖解決實(shí)際問題的主要任務(wù)之一。
我知道你更愿意跳到最后去建立人們見過的最深神經(jīng)網(wǎng)絡(luò)。但是,請相信我,特征工程這個內(nèi)容很重要!用正確的方式表示我們的數(shù)據(jù)比我們選擇精確的參數(shù)對監(jiān)督模型性能的影響更大。我們也可以開始創(chuàng)造自己的特征了。因此,在這一章,我們將回顧一些常見的特征工程任務(wù)。我們將要介紹預(yù)處理、縮放技術(shù)以及降維。我們還將學(xué)習(xí)表示類別變量、文本特征以及圖像。
本章將介紹以下主題:
- 一學(xué)就會的常見預(yù)處理技術(shù)。
- 中心縮放及多維縮放。
- 類別變量的表示。
- 使用PCA之類的技術(shù)對數(shù)據(jù)降維。
- 文本特征的表示。
- 學(xué)習(xí)圖像編碼的最佳方法。
讓我們從頭開始介紹吧!
推薦閱讀
- 超好玩的電子制作:少兒電子制作啟蒙
- Photoshop CS6 完美創(chuàng)意設(shè)計(jì):不一樣的圖像藝術(shù)處理
- 視頻拍攝與剪映剪輯技巧大全
- Photoshop CS6中文版完全學(xué)習(xí)手冊
- 手把手教你學(xué)微課制作:前期規(guī)劃+腳本撰寫+拍攝與后期制作
- 中文版Photoshop CS6圖像處理培訓(xùn)教程
- 數(shù)碼攝影后期密碼 Photoshop CS6旅游風(fēng)光
- 3ds Max游戲美術(shù)制作火星課堂(第2版)
- Adobe Premiere Pro CS4經(jīng)典教程
- 夢工廠之三維雕像:Maya模型手冊
- Raw格式數(shù)碼照片處理實(shí)戰(zhàn)寶典
- Photoshop CS5從入門到精通
- Photoshop七大核心技術(shù)
- 編寫高質(zhì)量代碼:Web前端開發(fā)修煉之道
- Web容量規(guī)劃的藝術(shù)