- 基于機器學習的數(shù)據(jù)缺失值填補:理論與方法
- 賴曉晨 張立勇 劉輝 吳霞
- 519字
- 2020-09-24 10:12:19
第1章 緒論
隨著信息時代的到來,各行業(yè)的數(shù)據(jù)規(guī)模呈爆炸式增長。由于數(shù)據(jù)質(zhì)量難以得到有效保障,數(shù)據(jù)缺失已經(jīng)成為實驗研究和實踐過程中面臨的重要問題。在面對缺失數(shù)據(jù)時,直接刪除往往會造成大量信息丟失,嚴重降低數(shù)據(jù)集的可靠性。缺失值填補方法利用現(xiàn)有數(shù)據(jù)為缺失值計算合理的填補值,從而構(gòu)造完整的數(shù)據(jù)集。該方式既可以保持原始數(shù)據(jù)集的規(guī)模,又能夠?qū)θ笔е底龀龊侠淼耐茢啵殉蔀槿笔?shù)據(jù)處理的研究熱點。
常用的缺失值填補方法主要包括基于統(tǒng)計學的缺失值填補方法和基于機器學習的缺失值填補方法。基于統(tǒng)計學的缺失值填補方法具備廣泛的研究基礎,且研究成果斐然。而鑒于機器學習算法在處理大規(guī)模數(shù)據(jù)時具有良好的表現(xiàn),將其應用于數(shù)據(jù)填補工作具有重要的現(xiàn)實意義。大多數(shù)基于機器學習的填補方法根據(jù)不完整數(shù)據(jù)集中的已知信息建立預測模型,并通過訓練出的預測模型估計缺失值,其優(yōu)越性已經(jīng)在實驗研究和實踐過程中得到了充分驗證。目前,缺失值填補方法已經(jīng)為基于數(shù)據(jù)的科學研究提供了可靠的基礎,并且在多個實踐領(lǐng)域獲得了廣泛的應用。隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算產(chǎn)業(yè)的深入發(fā)展,高質(zhì)量的數(shù)據(jù)已經(jīng)成為推動各行業(yè)發(fā)展的重要因素,缺失值填補方法必將因其重要的現(xiàn)實意義與實用價值而受到越來越多的關(guān)注。
- 人工智能改變世界:走向社會的機器人
- Arduino開發(fā)實戰(zhàn)指南:機器人卷
- 為機器立心(通用人工智能的中國藍圖系列)
- 基于機器學習的行為識別技術(shù)研究
- 大模型浪潮:商業(yè)機遇、產(chǎn)業(yè)變革與未來趨勢
- 模式識別與智能計算:Matlab技術(shù)實現(xiàn)(第2版)
- 人工智能簡史
- 神經(jīng)網(wǎng)絡與深度學習
- 機器學習與數(shù)據(jù)科學(基于R的統(tǒng)計學習方法)
- 人工智能視域下機器學習在教育研究中的應用
- 妙用DeepSeek:創(chuàng)意落地速通指南
- 虛擬現(xiàn)實:另一個宜居的未來
- 無人機:知道這些就夠了
- 智能控制
- FANUC工業(yè)機器人實操與應用技巧