- 工業大數據工程:系統、方法與實踐
- 田春華 張碩等
- 684字
- 2024-02-01 14:56:05
1.2 工業大數據的內涵與范疇
1.2.1 工業大數據的概念
工業大數據在不同語境下有不同的含義。單純從數據的角度,工業大數據是工業數據的總和[3],包括企業信息化數據、工業物聯網數據及外部跨界數據,很多工業物聯網數據也符合一般大數據的體量特征(數據量大、多樣、快速等)。從企業應用的角度,工業大數據泛指各種數據驅動的思維模式、業務創新和應用實施。從技術的角度,工業大數據很多時候被用來指代工業大數據技術,包括數據的接入、存儲、查詢、分析及應用等相關技術,被分為平臺技術、分析技術和應用技術。大數據平臺解決大量、多源、異構、強關聯數據的接存管用的問題[4],通常結合基礎設施特征、數據特征、計算負荷特征進行經濟化和靈活化設計。大數據分析關心如何從大量數據中挖掘出有用的模式,構建具有業務實操性的模型。大數據應用主要針對特定需求,基于大數據平臺和分析技術,以合適的形態(例如,私有部署、SaaS服務、工業數據應用)相對完整地支撐業務應用場景。
需要強調的是,數據體量不是工業大數據的關鍵特征,維度高、強上下文才是工業大數據的關鍵特征之一。10000臺設備,每臺設備100個測點,秒級浮點型數據(按8Bytes估算)增量僅為250 TB/年。在很多工業應用中,數據量并不大,但一個分析應用需要關聯設備和產品的維度高達幾十個,變量的組合數目遠大于樣本數量。此外,一個數據項背后關聯著大量的隱形信息和經驗知識,例如,在風電發電機組的風速測量值的背后,需要考慮尾流/湍流/剪切、氣象/地形環境、偏航等控制動作對風速測量的影響。因此,在很多工業應用領域,數據量不是技術瓶頸,多源異構數據的物理信息對象建模、多模型融合(機理、經驗、統計模型)和專家知識沉淀等才是其關鍵技術。