- 反饋:化解不確定性的數字認知論
- 韓博
- 4373字
- 2024-02-27 11:40:15
1.2 數據經濟新體系
反饋流數據加速HFL周期,那么如何加速數據價值的流動?如果說數字化帶來的大規模數據反饋正在改變世界,那么數據作為繼土地、資本、勞動力、技術之后的新生產要素必將推動新的經濟體系形成,而這個新經濟體系要為反饋數據在商業世界的流動加速。像ChatGPT這樣的大模型會對數據的需求越來越大,特別是高質量的數據。
1.2.1 被數字化永久改變:優化權經濟
據測算,采用共享經濟模式的公司將在12年內增長2133%。到2021年,超過8600萬美國人使用共享經濟,另外,Airbnb上已經上架了1400個可以共享的島嶼。相對于滲透正在變得越來越廣泛的共享經濟,我們看到所有權的價值越來越缺少彈性。真正創造價值的是使用,特別是通過共享來突破所有權限制,在使用最大化的時候,增量的價值創造也被最大化。基于所有權買賣轉移的交易經濟,在逐步轉變為基于數據對使用過程優化,創造更大價值的優化權經濟,例如Uber、Airbnb、WeWork顯著優化了固定資產的使用效率。收益分配也將基于優化使用過程所創造的價值來決定收益權,而不是單純基于天生擁有,或者所有權與使用權同時集中在所有者身上的所有權體系,從而更公平地鼓勵通過增量價值創造獲得收益,這就是鼓勵通過使用數據來優化資源、創造增量價值,并因此獲得收益權利保障的優化權經濟。特別是對于數據,所有者、使用能力、使用者并不統一,只有最大化共享才能最大化使用,從而使價值創造最大化。
讓數字資產局限于所有權的限制是不合時宜的,因為這更多是零和博弈的價值轉移,會形成保守和對抗性合作關系。從所有權到使用權,再到優化權,讓數據流到合適的價值創造環節,和其他數據一起通過聚合效應創造更多的優化價值,更符合規律。但是,這一切都應放在隱私和公平等準則之下討論,在數據資產精確溯源、記錄、確權體系上開展。而且,這種轉變是基于數據資產的獨特性。
數據資產具有五個特性:
●聚合效應:維度增加后的價值提升效應。
●正反饋:越透明越安全,越使用越多,越使用越有價值。
●虛擬屬性:數據使用的無邊界和無限可能性。
●不對稱:數據使用知識的不對稱性。
●價值原則:能夠用數據創造更多的用戶價值是基礎,所有的數據流通和使用都必須通過最優的價值增長過程,其模式才能正常運轉。
數據資產還面臨監管的挑戰。首先,我們要面對的是數據應用價值創造者應該被激勵的效率規則與數據所有者隱私權、收益分配權的矛盾。其次,是智能優化不斷創新與監管規則滯后的矛盾。無論是基于事前規則和白名單,還是基于過程、結果的各種監管方式均有不足之處,用不變的東西限制智能的東西總存在局限,因為它有更強的主動規避能力。
數據作為虛擬資產和新生產要素,獨特性在于,它通過聚合、更新、分析創造價值,具有類似恒星的負比熱特性,即向外輻射能量的同時,自身溫度會上升,直至引發聚變反應。價值驅動的數據自聚合體現為,相關性分析會讓相關的數據自動趨向集中,圍繞同一主題的數據維度增加會產生聚合效應提升數據的價值,并且可以交叉檢驗提升確定性。如何借鑒宇宙演化中建立平衡秩序的機制,讓數據和信息借鑒能量的運行機制,讓權屬和利益激勵機制的設計可持續,這一切都需要創新者引領。
數據驅動的智能技術并未像互聯網在網絡效應的驅動下迅速掀起全面的革命。在調研AI商業模式的時候,我最初的設想是,強大的AI應用和由其帶動的數據聚合生態會形成和網絡效應一樣強大的正反饋效應,讓領先的企業難以被超越。但是,這種現象遲遲沒有出現,其中一個重要的原因是數據無法有效流通,無法形成智能與數據的正反饋,導致整個行業發展緩慢。
數據是智能的瓶頸,是下一代戰略和商業模式的核心課題。對于數據的流通性,誰能解決隱私和利益分配的機制問題,誰就是共享平臺;誰能最大化價值,誰就是應用者。這種共享是相互監督而不是暴露,這種使用是共有、共享、共治、共用。雖然未來的機制設計仍是難題,但去中心化和隱私計算都是需要加速探索的重要方向,應用驅動會是持續性機制和健康生態的長期基礎。
數據資產的特性要求我們只有做到可用不可知,才能可控可計量,才能流通和激勵。隱私計算有助于將數據的所有權和使用權分離,形成數據價值的流通,目前已經形成了很多相關的解決方案。其中,同態加密可以實現數據流通過程中不向第三方泄露,“可信執行環境”可以構建一個獨立于各方,且受各方認可的安全硬件環境。谷歌提出的“聯邦學習”在數據不出“本地”的情況下,通過去中心化的CoLearn用各方數據對模型進行訓練,而后得出結論供各方使用。姚期智院士提出的“百萬富翁問題”解決方案是多方安全計算問題,可以幫助人們在加密的數據中計算并最終獲取有用信息,呈現計算結果,而不泄露原始數據。通過解決隱私問題降低數據應用成本是必須走通的路。
基于模型貢獻率的分配規則
優化權經濟如何度量并實現公平呢?數據價值的最佳量化方式,是在通過模型得出有意義結論的計算過程中,評估不同數據對模型的貢獻,并以此為基礎,考慮數據的所有權和優化權共同分配收益。姚期智院士認為,可以根據合作博弈理論,來確立不同的數據對于決策模型的貢獻度,貢獻度大的數據要素更有價值。因此,通過經濟主體功效函數與決策模型貢獻度的耦合,就可以對不同數據要素起到的經濟價值做合理公平的定量評估,從而計算出數據要素在經濟活動中產生的經濟價值。在華潤集團內部的實踐中,根據數據定價算法在集團不同法人主體以及不同部門之間根據數據的貢獻度進行要素價值的分配和部門貢獻的獨立核算,這樣就可以市場化的力量使整個集團協同運作,用經濟動力將基于數據要素的生產活動統一調動起來,使經濟效率提升。
超級解決方案
將物理的世界抽象為數據,能夠實現更快的反饋速度和流動性,突破原來的組織邊界和關系框架,為更高效的資源組織效率帶來可能,組織的定義、規模和邊界也將因此延伸。
跨平臺數據的個人化整合與產業解決方案視角的整合,是目前數據創造價值的兩個主要方式。數據將成為重新整合的紐帶,重構生產要素關系,以算法指引系統性優化的每一步。這種優化的結果是,用戶將完全沉浸在個人化的體驗當中,產業解決方案將圍繞對需求的比特化以及對原子化的生產要素做高效重構。價值的杠桿發生了不可逆的變化,這就像廣告行業的杠桿從創意人腦袋里的想法變成了分析師圖表里的數據之后,一切都會隨之改變,傳統的利潤池分布也將被重新劃分。數據不可交易,但基于數據的價值可以,從技術上分離,并以商業機制激勵,是當務之急。數據在這個時代的價值,決定了這個時代的商業一定會基于數字資產形成超級解決方案。
1.2.2 數字資產的轉化
在我們討論了海量數據結合反饋理念改變商業策略的同時,如何將數字資產這個新的關鍵生產要素的潛力,用更普適的方法轉化為新生產力,這將是一個新的重要課題。
信息溢出
人們從撒哈拉沙漠的隕石高溫讓沙子變成了玻璃的現象中發現了玻璃。后來,因為玻璃制造工藝容易引發火災,管理者將玻璃手工藝人們聚集在一個小島上(他們既是同行,又是競爭對手),一起鉆研手藝,這讓技術發展得更加飛快。這在經濟學中就形成了一個被稱為“信息溢出”的環境,這個環境帶來的效益可能比你設想的收益更大。在這里,人們第一次把海藻燒成灰加到原來的玻璃溶液中,發現了一種水晶玻璃,這就是現代玻璃的起源,玻璃因此變得透明了。
在找到玻璃的制造工藝之后,望遠鏡、顯微鏡、光纖等一切關聯發明的出現對人類歷史產生了深遠的影響。這就是信息溢出產生的影響。那么,大量的數據集中在一起是否會產生類似的效果?從數據到信息,再到廣泛的溢出效應,這是我們在數字化時代正在經歷的。
數據盈余
如果說21世紀還有哪些重要的資源沒有被充分開采,那么數據盈余首當其沖。據IDC預測,2025年,全世界每個聯網的人平均每天有4909次數據互動,是2015年的8倍多,相當于每18秒產生1次數據互動。在物聯網方面,據HIS的數據預測,到2025年,全球物聯網(IoT)連接設備的總安裝量預計將達到754.4億臺,約是2015年的5倍。而且,這還不包括已有的存量數據。例如,協和醫院自1921年成立以來,以百年時間積累了335萬份病歷。總體上,我們處在數據規模和產生速度都在不斷上升的曲線上。
三個轉化之道
據統計,人類歷史上90%的數據都是在過去幾年間產生的,50%的數據在短短兩年內產生。Gurjeet Singht是Ayasdi的聯合創始人兼CEO,他認為:研究人員只是對每天收集到的1 quintillion(百萬的3次方)字節數據中的1%進行分析和提取見解。而就是這1%被分析的數據創造了革新和見解,現在我們稱之為“大數據”。
若要將剩余99%的數據轉化為認知,至少要在三個方面有突破:
第一,從專家分析到算法自學習。呈指數級增加的數據規模只有通過自學習算法才能得到有效處理并被轉化為知識,現在從查詢出發去利用數據的潛能是不夠的,低效的分析和假設過于依賴少數人的想法,這限制了數據資產轉化為洞察的速度。算法應逐漸學會自動生成假設,通過自監督的方式自動地完成學習,這將提升數據分析轉化為洞察的效率。
第二,突破非結構數據的解析和抽取的效率瓶頸。處理和索引PB級的非結構化數據現在主要還是依賴人工工作。大型組織雇用大量的數據專業人員來搜索、分類和移動這些數據,以便分析工具能夠使用這些數據。現在迫切需要簡化和自動化這些過程,在多個文件和云存儲之間輕松索引文件,自動完成系統數據“移動”的解決方案。
此外,真正的數據洞察一定是非結構化的,寄希望于有一個標準化的數據產品解決數據洞察問題本身就是矛盾的。為了避免過度發散,非結構化數據的數據分析解決方案可能是垂直的,因此它們特定應用于某行業或某應用。例如,醫學圖像及其解釋方式是一個上下文事件,需要臨床數據集的特定知識。商業數據管理解決方案的時機已經成熟,幫助非結構化數據分析的工作實現流程自動化,很多公司開始提供類似的跨平臺服務。對于人工智能算法訓練,非結構化數據的多尺度表示和統一的數據生態運營也是必要的基礎設施。
第三,讓數據的使用權、優化權流通,讓工具的使用門檻更低。基于數據的洞察和知識流通,而不是隱私,技術要解決這種分離工作,例如聯邦學習就提供了一個很好的嘗試。同時,讓合適的領域專家去解決分析問題,將數據分析的重心從數據科學家和算法工程師轉移到授權領域專家。數據科學家出現的頻率已完全跟不上企業的需求。給商業用戶(生物學家、地質學家、安全分析師等)開發對應的工具,他們比任何人都明白環境的問題,但可能不了解最新的技術。但我們始終相信,全面的智能變革將由行業內的人來推動。
數據需要在流動中才能匹配到需求,數據需要在流動中被充分應用才能持續在新的應用中放大和發揮數據的價值,數據需要在流動中才能和其他數據共同形成規模化的數據應用價值。在數據共享方面,在最重要的生產力紅利面前,我們不能卻步不前,面對數據過于保守,我們就會失去未來。
以往的人類歷史中從來沒有出現過這么大規模的反饋數據,也不具備處理規模化反饋的計算機制與計算能力,進而提出和優化假設。基于此的HFL運行速度和大規模并行,在未來將加速幾乎所有事情的進程。