- 工業大數據融合體系結構與關鍵技術
- 高聰 王忠民 陳彥萍
- 2991字
- 2020-08-10 17:30:34
前言
近年來,隨著信息通信技術的發展,各類互聯系統的物理資源和計算能力顯著增長。作為第四次工業革命的先驅,德國于2013年4月正式發布“工業4.0”實施建議,旨在充分利用信息化技術促進產業變革,提高德國工業的競爭力,在新一輪工業革命中占領先機。同年6月,美國通用電氣(GE)提出了“工業互聯網”的概念,與德國提出的“工業4.0”有異曲同工之妙,被稱為美國版“工業4.0”。2015年5月,我國國務院印發《中國制造2025》,部署全面推進實施制造強國戰略。作為我國實施制造強國戰略第一個十年的行動綱領,該文件制定了未來10年內中國制造業的頂層規劃和發展路線圖,旨在強化工業基礎能力,促進產業轉型升級。同年10月,中德兩國宣布將推進“中國制造2025”和德國“工業4.0”戰略對接,共同推動新工業革命和業態。我國具有完備的工業體系和巨大的市場,在兩化融合的進程中,工業制造領域的數字化轉型與互聯互通持續促進著相關產業的建設和發展,以信息化為支撐的新型工業化發展戰略逐步形成了高效、環保的可持續發展模式。
在工業制造環境中,基于物理空間與網絡空間內包含的信息,網絡化的設備之間能夠形成高效的協同,各類生產線和生產過程持續不斷地產生著大量的數據。為了能夠更好地對海量數據進行管理和利用,傳統的工廠需要被轉化成工業4.0環境下的智能工廠。智能工廠作為承載工業4.0的最主要的應用實體,能夠對現代化的生產線和生產過程中產生的數據進行采集與分析,對制造過程進行實時監控和調整,進而實現提高生產效率、降低生產成本的目標。由于信息流在多種不同的信息物理子系統之間存在流通不暢的問題,因此需要研究智能工廠中海量多源異構數據的智能采集、異常檢測和信息融合方案,以使制造網絡中的所有設備形成一個自組織的、具有高度靈活性和可重配置性的制造系統。針對工業無線傳感器網絡數據融合與異常檢測的需求,探討以下內容十分必要:突破無線傳感器網絡、數據科學、異常檢測等領域現有理論及技術的局限性,實現理論與關鍵技術的創新,解決多源異構數據的統一描述與管理、苛刻工業環境下網絡的可用性維護、時間序列的模式異常檢測和時間序列的異常值檢測等問題,以及研究科學高效的工業大數據體系結構及相關技術。
本書針對工業大數據的體系結構與關鍵技術進行了研究,在對工業4.0、物聯網和云計算進行分析的基礎上,從定義、技術以及管理三個方面對大數據進行了闡述,給出了工業大數據研究與應用的體系結構。針對工業制造領域的特定應用場景,充分研究了數據的感知、采集和異常檢測技術,闡述了現有方法的利弊,分析了存在的問題,并提出了一系列創新的解決方案。全書分為七章,具體內容如下:
第1章介紹工業大數據的研究背景。首先介紹了工業4.0的發展歷程、設計原則和成熟度模型;然后分析了信息物理系統的發展階段、體系結構和關鍵技術;最后對大數據的定義、技術以及管理進行了詳盡的闡述。
第2章介紹工業無線傳感器網絡數據融合的體系結構的基礎知識以及研究現狀。首先分析了工業4.0和智能工廠的關系,著重介紹傳感器云的概念與研究現狀,并對工業無線傳感器網絡與傳感器云的概念及相關技術進行了歸納;然后提出了面向工業領域的多源異構數據的統一描述與管理機制,闡述了基于傳感器云技術的工業無線傳感器網絡;最后設計并實現了基于分布式云的數據感知與管理軟件,為后續章節所涉及的主要問題奠定了研究基礎。
第3章介紹面向工業4.0的數據采集機制,針對智能工廠生產車間的生產線和生產過程,基于傳感器云技術提出了大規模無線傳感器網絡的部署方案以及數據采集機制。首先對設施位置問題進行介紹,隨后引出了k中點問題;然后詳細描述k資源調度器,提出了漸進交換算法、貪心算法和RK算法,并對三種算法在理論上進行了分析和對比,根據工業無線傳感器網絡的應用場景,對制造網絡的層次化體系結構進行了詳盡的闡述,并使用八類實體通過八類消息來完成數據采集所涉及的操作;最后,針對五個重要參數進行了大量的實驗,繼而對提出的三種算法進行評估。
第4章介紹工業過程數據的故障預測與質量預測,針對生產過程的海量數據,提出了基于高斯過程回歸的故障預測模型與質量預測模型。首先介紹了現代工業系統領域基于數據驅動的故障預測方法,對自回歸模型、支持向量機模型、相關向量機模型、神經網絡模型以及隨機過程模型進行了描述;然后基于高斯回歸理論提出了單步預測模型、多步預測模型、基本模型和反饋模型;最后針對已有的反向傳播神經網絡和徑向基核函數高斯過程模型,基于大型工業過程田納西–伊斯曼仿真平臺對本章提出的故障預測方法進行了對比與分析,并針對已有的支持向量回歸模型、核偏最小二乘模型和反向傳播神經網絡模型,通過核函數重構以及將預測值引入高斯過程回歸模型來提高預測精度。
第5章介紹時間序列的模式異常檢測方法,針對工業無線傳感器網絡中的數據的模式異常,提出了基于骨架的模式表示異常檢測方法。首先介紹了時間序列中的異常分類,給出了點異常、模式異常和序列異常的聯系與區別;接著針對可感知重要點方法和分段聚合近似模型表示法的優缺點進行了詳細分析;然后提出了改進的可感知重要點方法,并基于該方法設計了骨架模式表示法,根據由骨架模式表示法得到的矩陣,計算不同時間序列的相似性分數,進而實現異常檢測;最后針對陽性檢出率、假陽性誤報率和異常分數比值三個性能指標,基于合成數據集和真實數據集進行了大量實驗。
第6章介紹時間序列的異常值檢測方法,針對工業無線傳感器網絡中數據的異常值,提出了新型的分布式檢測模型:基于最近鄰居集合的隔離型分布式異常值檢測模型。首先介紹了常見的異常值檢測技術,并分析了現有方法的不足,著重對隔離森林方法和本地異常值因子方法進行了分析;然后根據工業制造網絡的特定應用場景對異常值檢測問題進行建模,給出了子網絡、超球體、隔離分數和異常值分數等定義,設計了基于最近鄰居集合的隔離型分布式異常值檢測模型,詳細闡述了分布式檢測模型的三個工作階段(訓練階段、檢測階段和更新階段);最后針對準確率、檢測率、誤報率和曲線下面積四個性能指標,基于兩個著名數據集進行了大量實驗。
第7章對全書進行總結,概括本書內容的不足,并指出未來可繼續探索的方向。
本書由高聰、王忠民、陳彥萍所著,共35萬字,高聰負責全書大部分內容的撰寫以及整書的統稿工作,完成32萬字,王忠民參與了第6章的撰寫,完成1萬字,陳彥萍參與了第4章和第5章的撰寫,完成2萬字。本書的出版工作得到了陜西省科技統籌創新工程計劃項目(2019ZDLGY07-08)、陜西省科學技術廳國際科技合作計劃項目(2018KW-049)、工業和信息化部通信軟科學研究計劃項目(2019-R-29)、陜西省教育廳自然科學專項科研項目(17JK0711)和西安郵電大學學術專著出版基金的資助。機械工業出版社的編輯們為本書的出版付出了辛勤汗水,在此表示衷心的感謝。
本書既包含完整的理論推導,又注重實際應用方面的研究,各章內容既相輔相成,又相互獨立,讀者可根據自己的興趣和時間來選擇性地閱讀。為保證各章內容的完整性,若干重要內容在相關章節均有提及。本書的各部分內容都向西安郵電大學計算機系統結構專業的碩士研究生講授過,其中絕大部分是作者新近完成的科研成果。盡管如此,由于數據科學領域近年來發展迅速,且分支眾多,與其他領域的交叉甚密,因此該領域不僅內容龐雜,而且具有十分可觀的深度和廣度。作者水平有限,且成書時間倉促,雖嚴謹治學、精業勤業,但書中疏漏之處在所難免,敬請讀者批評指正。