- 工業大數據工程:系統、方法與實踐
- 田春華 張碩等
- 1834字
- 2024-02-01 14:56:03
前言
數字化浪潮席卷全球,很多工業企業也在嘗試通過數字化技術的深度應用,推動研發、生產、服務、運營、決策等關鍵環節的數字化轉型。但工業行業大多機理復雜,其進程仍不及數字化親和度更高的服務業。在工業數字化推進中,大家也一直在思考,工業數字化的本質是什么?工業大數據帶來了什么新的能力?工業大數據如何推進更有效率?
從社會生產力要素這一宏觀層面看,“數據分析”是一種生產工具的本質一直沒有變。只不過,不同時期,生產力水平不同,核心生產力要素不同,對數據分析的業務需求不同,再加上數據的供給成本和水平不同,使得數據分析的落地途徑與價值也不同。在工業1.0時代,生產活動與能源/動力供給是緊密綁定的。隨著電氣化革命(工業2.0),電力能源供應與動力裝置可以相對解耦,但工業技術仍是生產力的關鍵要素,這時候數據采集成本也高,少量的數據分析集中在關鍵工業技術的研發與驗證上。工業3.0階段實現了社會的充分分工,跨組織協作變得更加重要,管理信息化是提高生產效率的重要手段之一,另外,很多人工操作環節也成了效率或質量的瓶頸,自動化手段是解決這些問題的重要手段之一。這個時期的數據分析大多集中在協作效率提升上。在工業4.0階段,生產制造能力很多時候不再是瓶頸。復雜產品的定制化能力與創新速度成為核心競爭能力,生態鏈協同和響應速度變得很重要,但生態鏈涉及的因素更加復雜動態,基于人工的傳統決策模式不再有效,從而決策效率與質量也變成了數據分析支撐的重點,將隱性知識顯性化(可檢驗、可繼承、可發展),通過人工智能等適應能力更好的技術,不斷擴展認知的邊緣,提高決策能力。
從思維范式的中觀層面,從工業2.0到工業4.0,數據分析技術還是發生了根本性的變化。從領域知識驅動的假設檢驗的邏輯思維(第一性原理范式)和基于數據統計的實證思維,發展到基于統計歸納的數據思維,以及與機理/仿真模型結合的構造思維(或稱為計算思維)。工業系統是精心設計的、能夠長期穩定運行的系統,工業大數據分析中的樣本不均衡問題更加嚴重。在工業領域,先驗知識不再局限于概率關系(聯合、條件概率),還有大量體系化的因果關系(設計機理、運行機制、運營邏輯等)和很多非系統化的經驗知識(以領域專家為載體)。這些特點決定了工業領域的數據平臺與分析技術和服務業領域不同。
無論在服務領域還是工業領域,數據都是對自然現象和社會現象的不完備刻畫,這也從根本上決定了數據技術的適用范圍。但在具體項目實施中,決策要素和決策邏輯對應的數據對象很難描述完備,數據中蘊含的規律也沒有先驗知識,工業大數據的不確定性比信息化項目要高得多。工業大數據的維度通常很高,且跨越多個領域,這也進一步增加了工業大數據項目的復雜度。工業大數據的處理鏈條通常比較長,再加上大數據量、高采集速度、多樣性等特點,分析模型從技術原型變成日常生產力常常需要業務應用的開發,這些因素造成了工業數字化項目落地周期很長。一個分析應用投入生產后,也要面臨復雜運維的需求,這對工業企業和服務商的協作模式提出了新的要求。在多年的數據分析實踐中,筆者一直在思考一個問題:是否存在一些工業大數據工程化方法與技術,讓工業數字化過程更加順暢有效?
本書的寫作目的是為工業大數據工程實施提供一些參考。全書共10章,第1章討論了工業大數據的內涵與特點,并給出了工業大數據工程的三個要素,即數據資源、數據分析和數據應用;第2~4章提出了領域模型驅動的數據資源的建模技術,并給出了工業大數據系統技術與建設方法;第5、6章討論了敏捷工業大數據分析與運維方法,并闡述了背后的分析軟件技術;第7章討論了用戶驅動數據應用的低代碼開發技術;第8~10章用風電、水電、煤礦綜采三個行業,展示了工業大數據工程方法的應用過程。
本書的第1、5、6章由田春華編寫;第2、3章由張碩主筆,2.4節由李令萊編寫,2.1.2節、2.1.4節由田春華編寫,3.1.2節、3.1.4節由徐地編寫;第4章由徐地編寫;第7章由胡志勇、張浩編寫,7.1.1節、7.1.2節由胡志勇和張浩編寫,7.4節、7.5節由張浩編寫,其余部分均由胡志勇編寫;第8章由蔣偉、孫忠誠編寫;第9章由劉少波、張弋揚、肖劍等編寫;第10章由孫忠誠、張幸福、李國威等編寫,10.3節引用了曾聿赟的工作成果。全書由牛莉、陸薇、田春華等審校。
本書是對工業大數據工程的一些初步探討。鑒于精力與篇幅限制,很多行業實踐內容沒有詳細展開;再加上筆者才疏學淺,行業實踐有限,有些提法和表達尚欠推敲;書中難免有疏漏、錯誤之處。望廣大讀者不吝賜教,日后有機會加以勘正。
田春華
2023年10月于北京