官术网_书友最值得收藏!

1.2.4 模型形式與應用范式

工業數據分析常常需要融合多類模型,而不僅僅是統計學習算法。刻畫物理世界有3大類模型,如圖1-2所示。認知模型提供了一些概念和理念層面的指導,是物理世界在概念和結構上的抽象;唯象模型[6]從輸入—輸出關系上逼近物理過程,主要包括統計模型(本節將統計模型、分析模型、數據挖掘和機器學習等提法等同,不做嚴格區分)和模擬仿真;機理模型是基于公理體系和簡化假設等邏輯體系下的模型;經驗模型是對過程和決策的經驗性總結,包括專家規則和經驗公式。當然,不同類別的模型也可以相互轉化,例如,開普勒三定律是唯象模型,在廣泛被證明前甚至也可以被認為是經驗公式,一旦形成相對完善的公理體系,萬有引力定律就成為機理模型。

圖1-2 刻畫物理世界的3大類模型

在行業應用中采用的模型大多是形式化模型,下面重點討論理論模型和經驗模型,并且不刻意區分專家規則與經驗公式(以專家規則為代表討論)。不同類別模型的特點和適用場景如表1-3所示,簡單來說,機理模型推演能力強,但不夠精準(很多理想化假設);統計模型自適應能力強,但不充分(概率意義上的外推);仿真模型對極端情形檢驗能力強(對系統和策略設計很有用),但通常不解決日常運行情形;專家規則實用,但不完備(有很多反例,邏輯自洽性差)。因此,在解決問題時,需要根據實際問題的情形選擇模型的類型,或者采用多種類型的融合。

表1-3 各類模型的特點與適用場景

1.統計模型的應用范式

一般來說,大數據模型的作用與機理復雜度密切相關。本節從產品相似度和機理復雜度兩個維度出發,將分析算法應用總結為6個范式,統計模型在不同情形中的作用如圖1-3所示,在不同的組合情形下,統計模型可以發揮的作用不同。

圖1-3 統計模型在不同情形中的作用

(1)從工業產品的相似度來看,可分為大量相似產品(例如,風力發電機組)和少量定制化產品(例如,大型水力發電機組)。對于大量相似產品,在數據分析時可以充分利用產品間的交叉信息;而對于少量定制化產品,應深度挖掘其時間維度的信息。

(2)從產品機理的復雜度來看,可分為無須了解內部機理的產品(例如,電子消費品,通常不需要深入元器件內部分析)、簡單明確機理產品(例如,風力發電機組)、復雜機理產品(例如,大型鍋爐)。當工業大數據分析被應用到復雜機理產品時,應更加注重機理模型和專家經驗。

有了大量狀態監控后,很多短時預測變得很簡單,但這并不能取代機理模型或結構方程的作用。機理模型在僅知道狀態變量初始值和輸入的情形下,就可能實現很長時間段內的外推。而根據短時擬合出來的統計模型通常做不到這一點。

2.統計模型與機理模型的融合

在不同場景下,機理模型對物理過程描述的精度不同,因而對其他模型的需求也不同,在不同工業場景下,數據與模型的可信度如圖1-4所示。微觀機理模型通常無法直接用到中觀決策,例如,腐蝕電化學模型無法直接用到地下管道的季度預防性維修計劃。很多機理模型在環境(如充分光滑、沒有阻力)、模型(如集中參數、剛體、模型參數可以相對精準獲得)、動力學形態(如不存在湍流)、初始狀態(可測且測量成本可接受)等方面都有一定的前提假設或合理簡化,在實際過程中需要用數據來檢驗其合理性,或與分析模型融合,進一步提高模型的適用性。

圖1-4 不同工業場景下數據與模型的可信度

分析模型與機理模型融合有如下4種范式。

(1)分析模型為機理模型做模型校準,提供參數的點估計或分布估計,例如,Kalman濾波。

(2)分析模型為機理模型做后期處理或補充。例如,利用統計方法對氣象研究與預報模式(Weather Research and Forecasting Model,WRF)的結果進行修正;或者利用統計方法綜合多個機理模型,以提高預測的穩定性。機理模型由于未建模因素、參數不精準造成精度低。機理模型的系統辨析需要有效激勵輸入,但實際的工業系統為了安全和壽命,會限制激勵信號的形式。這造成機理模型與物理過程存在一定偏差。分析模型雖然是數據自適應,但在參數維度高時,對訓練數據集要求過高,泛化能力差。通常做法是分析模型以擬合機理模型的殘差[7]

(3)機理模型的部分結果作為分析模型的特征。例如,在風機結冰預測中,計算出風機的理論功率、理論轉速等,并將其作為統計分析模型的重要特征。更進一步,將機理模型作為深度學習模型結構的一部分。如果使用傳統的深度學習,即使訓練數據滿足所有的物理規律,訓練好的深度網絡仍然可能違反物理規律限定,例如,慣性矩陣非正定,外插無約束。深度拉格朗日網絡(Deep Lagrangian Networks,DeLaN)[8]和哈密爾頓神經網絡(Hamiltonian Neural Networks,HNNs)將力學系統作為先驗知識成為深度網絡模型的一部分,保證了關鍵物理量的合法性,比傳統的前饋神經網絡訓練速度更快,預測結果更物理,對新的徑跡預測也更健壯。

(4)分析模型與機理模型做集成。例如,在空氣質量預測中,WRF-CHEM、CMAQ等機理模型可及時捕獲空氣質量的全局動態演化過程,而統計模型可對空氣質量的局部穩態周期模式有較高精度的刻畫。模型集成可有效融合兩類模型各自的優勢。

除嚴格意義上的融合外,對計算量大的機理模型,分析模型還可以替代機理模型。例如,物理神經網絡(Physics-informed Neural Networks,PINN)[9]用于替代復雜的有限元計算,在訓練時,將微分方程或偏微分方程作為深度學習模型損失函數的一部分。物理神經網絡已經被廣泛用于解決方程求解、參數反演、模型發現、控制與優化等問題。對基于復雜的動力學仿真的優化,強化學習可以用來學習最佳控制策略,強化學習也可以用于求解大規模組合優化問題[10]

3.統計模型與專家規則的融合

在很多設備異常預警等工業數據分析中,缺乏足夠的標記樣本。此時除無監督學習(包括異常樣本的相似度匹配)方式外,可采用專家規則與統計模型融合的方式。

專家規則通常不夠完備,專家規則中很多參數和閾值通常不夠精準,大數據平臺可以為專家規則提供一個迭代式驗證平臺,數據分析師將當前版本的專家規則形式化,在大量歷史數據運行,領域專家對關鍵結果(例如,預測為故障狀態)進行研究,完善專家規則邏輯,通過這樣多次迭代運行,通常可以獲得一個相對可靠的專家規則。另外,也可以采用主動學習(Active Learning)[11]策略,統計學習模型可以挑選一些易混淆的樣本,讓領域專家進行標記。

4.統計模型與仿真模型的融合

仿真模型通常用于做模擬分析(What-if Analysis)、設計驗證與預案設計。按照時空尺度,仿真模型可以分為4種類型:① 系統層級的仿真,包括機械、電子、電力、液壓、熱力學、控制系統等,典型的語言包括Modelica、MATLAB Simulink/SimScape等。注意,這里的“系統層級”是個相對的概念,覆蓋了元件級、組件級、部件級、套件級及機組級等不同工業系統級別。② 連續介質理論的計算機輔助工程(Computer Aided Engineering,CAE)模擬,包括有限元法(Finite Element Method,FEM)、計算機流體動力學(Computational Fluid Dynamics,CFD)、電磁仿真及多物理場耦合仿真等。③ 非連續介質理論或介觀尺度的模擬方法,涉及微觀組織的演變及缺陷、斷裂和損傷等各類問題,主要采用第一性原理、分子動力學、蒙特卡洛、相場、近場動力學及元胞自動機等技術。另外,如果把生產經營活動的仿真也納入進來,可以將其作為第四類,即④ 離散事件仿真,主要仿真活動過程等離散事件下的系統性能。第③類因為涉及微觀尺度,通常缺乏大量測量數據的支撐,所以目前工業大數據和第①、②、④類仿真結合比較多。

如果仿真模型結果和實際運行狀態相比有一定的可信度,仿真模型將有可能用于指導工業系統的運行控制與運維管理。此時,仿真模型與統計模型有多種結合方式。

(1)仿真作為統計模型的訓練驗證平臺。在現實世界中,數據的場景覆蓋度有限,故障樣本數量更有限,這對統計學習模型訓練通常是不夠的。這時可以發揮仿真模型場景覆蓋全面的優勢,模擬在工業現場出現不了或極少出現的場景(如重大故障、極端工況)。仿真模型為統計模型生成訓練數據,統計模型基于這些數據進行訓練與驗證,可以驗證統計模型的技術可行性與性能,也可以用統計仿真訓練一個基礎模型,根據實際現場數據做遷移學習。反過來,可以通過強化學習,根據統計學習的結果調整仿真參數,讓仿真更有針對性,如圖1-5所示。

這里需要注意,統計模型的輸入數據要素要保持與工業現場相同。仿真模型輸出大量狀態變量,但現實世界可測量只是其中一部分。統計模型學習的也不是整個系統機理生成式模型,而是解決某個具體問題(例如,故障診斷)的模型。

圖1-5 仿真作為統計模型的訓練平臺

(2)機器學習作為仿真加速器。很多仿真模型計算時間長,不能支撐在線生產決策或控制。可以基于離線仿真結果庫,利用統計學習的回歸分析算法(如神經網絡、隨機森林等),訓練得到一個回歸預測模型。在線時利用回歸模型進行預測計算,快速得到一個相對可信的估算值。深度學習在這方面也有不少研究,前面介紹的PINN、DeLaN、HNNs等模型明確將機理或守恒關系構建為深度學習模型的損失函數或模型結構,深度學習模型訓練和仿真是兩個獨立的過程,需要大量額外存儲。還有一種方式是深度學習模型訓練伴隨仿真計算,不需要額外存儲中間結果數據,ModelingToolkit.jl、Modelica等系統仿真語言通常要求系統模型為微分代數方程(Differential-Algebraic Equation,DAE)形式,如果神經網絡可以表達為DAE形式,那么可以實現訓練與仿真的伴隨執行,目前主要神經網絡模型包括連續時間的回聲狀態網絡(Continuous Time Echo State Networks,CTESN)[12]、隱性深度學習(Deep Implicit Layers)[13]等。回聲狀態網絡使用大規模隨機稀疏網絡(存儲池)作為信息處理媒介,將輸入信號從低維輸入空間映射到高維狀態空間,在高維狀態空間采用線性回歸方法對網絡的非隨機連接權重進行訓練。回聲狀態網絡的優點是訓練簡單,可以作為遞歸神經網絡的簡化方法。而CTESN可以近似為DAE形式,與仿真軟件引擎有良好的融合接口。腳注①將CTESN作為代理模型開發JuliaSim軟件,訓練后CTESN模型可以替代仿真模型做快速推演預測。目前的深度學習用多層顯式(explicit)非線性結構y=fx)來實現強大的擬合能力,但其本質仍是尋找復雜系統的不變點。因此,隱性深度學習嘗試用隱性(implicit)聯合函數分布gxy)=0來表達系統的不變關系,以期望用形式簡潔、內存需求量小的模型實現復雜系統不變點的表達。主要有深度平衡模型(Deep Equilibrium Model,DEQ)、常微分方程(Ordinary Differential Equation,ODE)[14]、可微優化(Differentiable Optimization),一旦表達為DAE形式,就很容易結合Modelica等系統仿真引擎訓練深度學習模型。

(3)機器學習最優控制策略。很多動力學問題的逆問題(根據當前狀態和目標狀態,求解最佳控制策略)比較復雜,很多時候不存在唯一解,直接求解難度大。基于仿真實驗,利用強化學習等策略學習最佳控制策略。

主站蜘蛛池模板: 苏尼特左旗| 鄂温| 平武县| 西青区| 安远县| 玉山县| 怀宁县| 建瓯市| 房山区| 锦屏县| 伊川县| 灵丘县| 汾西县| 扬中市| 额尔古纳市| 留坝县| 会理县| 贵阳市| 武安市| 曲水县| 合作市| 湟源县| 桂阳县| 鸡东县| 德昌县| 蚌埠市| 南乐县| 黄浦区| 绥德县| 湘潭市| 阳曲县| 临湘市| 无棣县| 泌阳县| 顺昌县| 进贤县| 梁山县| 武城县| 延边| 保德县| 丰原市|