官术网_书友最值得收藏!

1.3.3 思維模式視角

數據思維已成為邏輯思維、實證思維、構造思維之后的第四大思維模式。實證思維是基于有限觀察和控制實驗的歸納,邏輯思維是基于若干公理的推理和演繹,構造思維是算法過程的構造與模擬(也稱為計算思維),而數據思維是基于數據分布結構的擬合。

數據思維是對其他3種思維模式的有益補充。實證思維和邏輯思維是現代科學體系的基礎,基于觀察,形成抽象,通過形式化框架,構建一個自洽的理論體系,并接受新實驗的證偽檢驗。構造思維是很多復雜工程研發的典型模式,通過數字空間的迭代,減少物理空間實驗的成本。但如果理論模型與物理世界相差較大,這些方式就有一定的應用局限性。例如,化工中的分子擴散、流體流動、熱量傳遞等過程是可以用物理、熱力學、化學反應、單元傳遞函數等數學模型來描述的,進而可以用計算機做化工設備單元設計和全流程集成優化等工作。然而用流程模擬和仿真來解決生產運行問題時,會發現計算結果與實際現場并不吻合,預測誤差甚至高達50%[17]。其主要原因包括未建模要素(理想假設、排除非重要因素)、模型參數不精準、現場缺乏必要的測量數據等。雖然理論上有無限多種組合狀態,但現實中工廠大部分時候運行在設定參數附近,現實的生產狀態數目有限,這樣生產3年就基本已經經歷過90%可能發生的狀態。數據模型本質是查表和插值,通過尋找與待預測點相似的狀態點,根據相似歷史狀態預測新輸出。雖然數據模型沒有全局的推斷能力,但已經可以應對有限狀態了,在這種情形下,數據模型也許是一種最經濟的做法。

很多具有工科背景的從業人員更相信確定性關系,對數據思維中的概率性關系常持懷疑態度。這種思維定式需要轉變。首先,概率是一種關系描述方式,很多關系是天然隨機的,例如,一個單詞的音頻中,音素的持續時間和停頓時長都是隨機的,不但不同人會不同,同一個人兩次說話都可能完全不同,但總體上有一定規律,這樣的規律用概率模型描述比確定性模型或規則描述更合適。其實,概率可以近似看作研判的“置信度”,很多問題的研判本身也不是非黑即白的,存在模糊地帶。最后,很多過程本質是確定的,但結果對模型參數、初始狀態的敏感度太高(學術上說的混沌系統),對模型參數、初始狀態的精確估算不可能或不經濟,這時將模型簡化為一個概率模型也許更實際。例如,拋硬幣預測落地是正面、反面,在不存在空氣擾動、地面平整且摩擦系數均勻的假設下,這個過程可以建模為一個常微分方程[18],結果完全由硬幣的質量分布、拋出時的初始狀態確定,但結果對參數和初始狀態的敏感度太高,還不如通過多次觀察,建立一個概率分布模型更直接。錢學森[19]曾指出,從決定性的牛頓力學演化為非決定性的統計力學是一次科學進步;客觀世界是決定性的,但由于人認識客觀世界的局限性,會有暫時引入非決定性的必要。這是前進中的驛站,無可厚非,只是絕不能滿足于非決定性而不求進一步澄清。

在信息化時代,數據作為一種信息溝通的媒介,通過數據透明和信息對稱,提升企業的綜合決策水平。在豐富的數據積累前提下,數據思維提供了另外一種認識世界的方式,用數據來發現問題、洞察規律,機器可以自動發現人工認知手段看不到的一些規律,將過去實證思維(觀察試驗、歸納總結)的小群體人工探索行為變成大規模機器自動挖掘的行為,加速與擴大了認知拓展能力。從行業應用的角度,數據思維把業務問題描述為數據分析需求,把數據分析規劃為一個具有業務可行性的數據應用的能力。

在不同應用場景中,大數據發揮價值的途徑不同。以工業設備為例,有些設備是標準化或參數化產品,有些設備是高度定制化的產品;有些設備工作相對獨立,有些設備與其他系統強耦合。在不同情形下,設備大數據分析的價值途徑不同,如表1-5所示。

表1-5 不同情形下設備大數據分析的價值途徑

大數據的作用還體現在專家經驗的精準化方面。工業中存在大量的操作經驗和運行經驗,有些經驗比較模糊,只能靠語言和實踐來掌握,有些經驗可以用自然語言或專家規則表達出來,但仍存在歧義且不夠定量,造成理解不一致。工業大數據有能力將部分經驗明確化、定量化和標準化,形成結構化的模型,并可接受大量案例的檢驗,以提高經驗的傳承效率。雖然結構化模型可能會損失一部分經驗信息,但結構化后,傳遞效率才能提高。在大數據時代,數據還有可能成為知識經驗和技能的新載體,推動基于數據模型的知識共享和技能賦能,可提升生態組織開放合作與協同創新能力。

在微觀層面,思維模式還體現在不同技術背景的人身上。工業大數據實踐通常是操作技術(Operational Technology,OT)、數據技術(Data Technology,DT)、信息技術(Information Technology,IT)的3T融合。對同一個問題,OT專家與DT專家會從不同視角來審視,OT專家從機理角度,可以給出很多先決性研判或猜想;DT專家從數據統計的角度,可以給出數據上的現象表征。二者的不一致,可以讓很多隱含或忽略的假設明確化。對OT專家來說,數據提供了一些額外的認識世界、驗證猜想、分析問題的工具手段。

在工業數據分析項目中,機理模型與數據分析有3種結合方式(見圖1-6):① 有大量先驗知識的課題,首先,明確OT的經驗和假設,通過數據檢驗,形成有用的特征,接著,數據分析建模進一步定量化;② 數據驅動的課題,基于統計假設進行建模,在分析結果或現象解讀時,融入OT專家的認知或經驗,進一步提升模型結果;③ 數據驅動的課題,但存在前人的模型,這時做的是盡快用前人模型在新數據上運行,進行結果解讀,然后再改進模型。另外,在這些計劃中的執行模式外,通常存在很多“意料之外”的分支,在分析數據的過程中,存在臨時發現的一些新課題,這些新課題發現的前提是對數據敏感性與領域認知的結合。

圖1-6 機理模型與數據分析的3種結合方式

在數據分析項目中,歡迎專家直覺但更喜歡直覺背后的“研判依據”,盡管直覺或研判依據不一定完備或正確,但直覺觸發了跨領域討論的可能,“研判依據”給出了數據探索的思路,經過數據的檢驗和跨領域的推理討論,不斷追尋數據現象背后的要素和關系,形成相對完備和自洽的動力學關系圖。

但數據思維自身并沒有完全解決知識積累與傳承的問題。在知識積累方面,從數據中自動學習的機器學習模型蘊含了知識,但通常為黑箱知識,缺乏演繹能力,與既有的形式化理論框架或領域專家的概念體系并不能無縫銜接,也就是說,還需要領域專家的解讀、邏輯思考與驗證工作,才能納入既有知識框架體系。另外,物理過程的關鍵要素是否在大數據中有體現,在實際應用中也是需要校驗的。在工業場景下,數據思維與專家知識的融合是一個待研究的課題。

主站蜘蛛池模板: 南平市| 桂林市| 清水河县| 壤塘县| 七台河市| 佛冈县| 涿州市| 嫩江县| 阳西县| 简阳市| 香格里拉县| 长泰县| 东丰县| 崇明县| 依安县| 泗洪县| 正镶白旗| 锡林浩特市| 杭锦后旗| 时尚| 军事| 榕江县| 三门峡市| 内乡县| 五常市| 安福县| 外汇| 琼海市| 柞水县| 师宗县| 晋州市| 河池市| 和龙市| 祁连县| 灵宝市| 曲阳县| 浏阳市| 宝兴县| 克拉玛依市| 广平县| 内乡县|