官术网_书友最值得收藏!

1.3.1 復(fù)雜制造數(shù)據(jù)預(yù)處理

制造系統(tǒng)達到一定規(guī)模并且工藝流程較為復(fù)雜時,其自動化系統(tǒng)會出現(xiàn)數(shù)據(jù)量大、生產(chǎn)屬性多、數(shù)據(jù)源中包含一定噪聲數(shù)據(jù)等問題。這些問題對基于數(shù)據(jù)的調(diào)度結(jié)果有重要影響。因此,對數(shù)據(jù)源中的相關(guān)數(shù)據(jù)進行預(yù)處理是基于數(shù)據(jù)的調(diào)度的重要組成部分。復(fù)雜制造數(shù)據(jù)預(yù)處理主要集中于以下三方面:復(fù)雜制造數(shù)據(jù)屬性選擇、復(fù)雜制造數(shù)據(jù)聚類與復(fù)雜制造數(shù)據(jù)屬性離散化。

(1)復(fù)雜制造數(shù)據(jù)屬性選擇

屬性選擇是從條件屬性中選取較為重要的屬性。條件屬性冗余過多會導(dǎo)致分類或回歸的精度下降、生成的規(guī)則無法使用以及規(guī)則之間的沖突較多。屬性選擇常用的方法包括粗糙集和計算智能。例如,Kusiak針對半導(dǎo)體制造的質(zhì)量問題,提出了使用粗糙集從樣本數(shù)據(jù)中獲取規(guī)則的方法,并使用特征轉(zhuǎn)換和數(shù)據(jù)集分解技術(shù),來提高缺陷預(yù)測的精度和效率;粗糙集的屬性約簡是一個NP難問題,Chen等通過特征核的概念縮減了搜索空間,然后使用蟻群算法求得了屬性集的約簡,提高了知識約簡的效率;Shiue等建立了兩階段決策樹自適應(yīng)調(diào)度系統(tǒng),將基于神經(jīng)網(wǎng)絡(luò)的權(quán)重特征選擇算法和遺傳算法用于調(diào)度屬性選擇,使用自組織映射(Self?Organizing Maps,SOM)進行數(shù)據(jù)聚類,應(yīng)用決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機這三種學(xué)習(xí)算法對每個簇進行學(xué)習(xí)實現(xiàn)參數(shù)優(yōu)化,提高了自適應(yīng)調(diào)度知識庫的泛化能力,并通過仿真驗證了成果的有效性。

(2)復(fù)雜制造數(shù)據(jù)聚類

聚類是對樣本數(shù)據(jù)按相似度進行分類的技術(shù),將相似的樣本歸屬于同一類,而相似度低的樣本歸屬于不同類。對于大規(guī)模訓(xùn)練樣本,可以使用聚類平滑噪聲數(shù)據(jù)。噪聲數(shù)據(jù)會影響學(xué)習(xí)的精度,如C4.5在處理含有噪聲的樣本時會導(dǎo)致生成樹的規(guī)模龐大,降低預(yù)測精度,需要做剪枝處理。聚類中常用的方法包括SOM、Fuzzy?C均值、K均值、神經(jīng)網(wǎng)絡(luò)等。

(3)復(fù)雜制造數(shù)據(jù)屬性離散化

部分算法和模型只能處理離散數(shù)據(jù),如決策樹、粗糙集等,因此有必要采用屬性離散化技術(shù)將連續(xù)屬性值轉(zhuǎn)化為離散屬性值。例如:Knooce和Li在挖掘優(yōu)化調(diào)度方案時,根據(jù)面向?qū)傩砸?guī)約算法和決策樹的特點,對屬性值進行了等距離散劃分;Rafinejad提出了基于模糊K均值算法的屬性離散化方法,使得從優(yōu)化調(diào)度方案中所提取的規(guī)則能夠更好地逼近優(yōu)化調(diào)度方案。

現(xiàn)有的復(fù)雜制造預(yù)處理技術(shù)主要集中于屬性選擇和數(shù)據(jù)聚類,而針對制造系統(tǒng)的數(shù)據(jù)預(yù)處理技術(shù)還有待進一步深入研究。因為制造系統(tǒng)數(shù)據(jù)具有規(guī)模大、含噪聲、樣本分布復(fù)雜且存在缺失現(xiàn)象;輸入變量數(shù)目多、類型多樣;輸入/輸出變量間關(guān)系呈非線性、強耦合等特點。

主站蜘蛛池模板: 阳原县| 龙里县| 博罗县| 安福县| 岱山县| 永吉县| 阿瓦提县| 化隆| 江安县| 图木舒克市| 简阳市| 武夷山市| 玉龙| 馆陶县| 濮阳市| 射洪县| 抚顺县| 佛冈县| 昭通市| 陵川县| 建始县| 唐河县| 衡南县| 合山市| 娄烦县| 巫山县| 蚌埠市| 晋城| 铁岭县| 临汾市| 聂拉木县| 奇台县| 长阳| 格尔木市| 綦江县| 中西区| 陆川县| 方正县| 绥德县| 青阳县| 彝良县|