- 基于機(jī)器學(xué)習(xí)的數(shù)據(jù)缺失值填補(bǔ):理論與方法
- 賴曉晨 張立勇 劉輝 吳霞
- 359字
- 2020-09-24 10:12:26
3.2 基于屬性間相關(guān)性的填補(bǔ)方法
基于屬性間相關(guān)性的填補(bǔ)方法通過回歸建模挖掘數(shù)據(jù)屬性間的關(guān)聯(lián)關(guān)系,以此進(jìn)行缺失值填補(bǔ)。此類方法主要包括基于線性回歸的填補(bǔ)方法,以及基于非線性回歸的填補(bǔ)方法。基于線性回歸的填補(bǔ)方法通過對(duì)不完整數(shù)據(jù)的線性建模進(jìn)行缺失值填補(bǔ),主要適用于數(shù)據(jù)屬性間存在線性關(guān)系的場(chǎng)景。相較而言,基于非線性回歸的填補(bǔ)方法利用非線性模型挖掘數(shù)據(jù)屬性間的關(guān)聯(lián),進(jìn)而借助所建模型填補(bǔ)缺失值。在非線性回歸建模期間,人為構(gòu)造擬合函數(shù)會(huì)存在一定主觀因素的干擾,并且未必能構(gòu)建出與真實(shí)數(shù)據(jù)集相匹配的函數(shù)結(jié)構(gòu)。鑒于神經(jīng)網(wǎng)絡(luò)具備強(qiáng)大的非線性映射能力,該模型能夠有效挖掘數(shù)據(jù)屬性間復(fù)雜的非線性關(guān)系,并以此為填補(bǔ)性能的改善帶來巨大潛力。因此,本節(jié)首先探討基于線性回歸、非線性回歸的填補(bǔ)方法,在此基礎(chǔ)上對(duì)基于神經(jīng)網(wǎng)絡(luò)的填補(bǔ)方法進(jìn)一步展開分析。
推薦閱讀
- 自然語(yǔ)言處理:基于預(yù)訓(xùn)練模型的方法
- 一本書讀懂ChatGPT、AIGC和元宇宙
- 統(tǒng)計(jì)學(xué)習(xí)必學(xué)的十個(gè)問題:理論與實(shí)踐
- 科學(xué)儀器設(shè)備配置學(xué):人工智能時(shí)代的界面管理
- 深度學(xué)習(xí)及加速技術(shù):入門與實(shí)踐
- PyTorch神經(jīng)網(wǎng)絡(luò)實(shí)戰(zhàn):移動(dòng)端圖像處理
- 智能機(jī)器人(第二版)
- 深度學(xué)習(xí)入門與實(shí)踐
- 深入淺出圖神經(jīng)網(wǎng)絡(luò):GNN原理解析
- 人工智能
- EV3機(jī)器人之快樂搭建
- RPA智能機(jī)器人:實(shí)施方法和行業(yè)解決方案
- 機(jī)器學(xué)習(xí)中的統(tǒng)計(jì)思維(Python實(shí)現(xiàn))
- ChatGPT手冊(cè):初學(xué)者指南與應(yīng)用實(shí)戰(zhàn)
- MXNet深度學(xué)習(xí)實(shí)戰(zhàn)