官术网_书友最值得收藏!

前言

反饋是什么

在2019年,曾經有朋友和我討論,傳統搜索引擎的地位會被采用相近模式的新競爭者取代嗎?我告訴他,概率不大。互聯網超級應用的核心優勢在于海量的用戶反饋數據。在搜索引擎里,有億萬用戶正在通過搜索與內容產生互動,這些反饋數據和其他信號一起對內容質量和相關性進行排序。更重要的是,反饋數據的規模已經形成不斷自我強化的正反饋效應,即用戶搜索和點擊越多,搜索引擎就越能準確地對內容進行排序,從而促使更多用戶使用。如果不能用新一代的規則建立新的正反饋效應,產品很難在存量市場里實現“翻盤”,就像很多“搜索市場爭奪戰”在成熟的PC(個人計算機)搜索市場打響卻并未改變競爭格局,而短視頻、社交等其他賽道的應用產品內的搜索則很難使用戶對其形成第一認知,并以此促進用戶規模和反饋規模的正反饋循環。不僅搜索引擎如此,推薦引擎等互聯網分發產品背后的運行邏輯也是如此,即大規模的用戶在以海量、實時的瀏覽行為對內容、商品和服務的質量做出反饋。

互聯網的變革,本質上是大規模用戶行為的實時數字化反饋。普通數據價值有限,反饋數據才更有價值,用戶的應用反饋是基于某種假設的反饋,其中包含需求的表達、質量的評估等關于世界如何運轉的規律。但是,這需要算法的自學習能力、符合高價值數據分布和算法自學習機制的產品架構,才能充分釋放海量反饋數據的潛在知識價值。

這一代AI技術也是基于反饋機制創新實現了突破。對于樣本數據中隱藏的規律,算法會有一個初始預測假設。然后,復雜的高維計算會被簡化為梯度反饋問題來優化求解。我們也可以簡單理解為,預測值與真實值的偏差度量會被反饋給模型,進而向偏差最小的方向自動調整模型參數,并不斷重復這個假設和反饋的循環以達到持續學習的效果。就像在練字的過程中,我們要從字帖與自己書寫的字之間的偏差中找到改進方向。智能在并不追求細節完全精確的海量數據反饋下涌現,結合強大算力,神經網絡計算模式在反饋機制創新的作用下,將具備越來越強大的自學習能力。

DeepMind(一家AI研究公司)首席研究科學家、倫敦大學學院教授大衛·席爾瓦及其合作者在一篇題為“Reward is enough”(獎勵反饋)的論文里提到,人工智能及其相關能力不是通過設置和解決復雜問題產生的,而是通過堅持一個簡單而強大的原則——獎勵最大化產生的,這本質上也是一種反饋機制。

不僅是在互聯網和AI領域,反饋還有更廣義的存在價值和內涵。反饋是有假設檢驗能力的信息,能夠基于此發揮推動假設演變的交互作用。而假設是我們在深入認識這個世界的動態過程中不斷更新的認知和狀態,假設也是世界自身向前演化的基礎方式和起點。對于觀察者的認知過程,假設就是A/B測試里面的題目,反饋就是結果。對于被觀察者的演變過程,例如人們基于生物的基因變異會提出新假設,而自然選擇就是反饋。觀察者的認知和被觀察者的演化,其實是同一個過程的兩個視角。

“一切只能證偽不能證明。”波普爾說,一切真理換個角度看都是等待證偽檢驗的假設。反饋則是一種測量,是一種分類,是化解復雜性的根本方式。我們通過反饋對假設的檢驗來收斂相對分散的假設,并使我們有足夠的信心將這些假設付諸實踐。這個過程就是從假設與反饋的偏差中找到打開新世界的線索。只有在我們把腳伸進水里的那一刻,皮膚感受到的刺激才能告訴自己這里的水溫適不適合游泳,我們的感受就是反饋。就像歌詞里寫的“不去開始就永遠不知道”,就是這個再簡單不過的檢驗方式所包含的信息,在驅動認知與萬物演化。

我們將要討論的反饋和經典控制論里的“反饋”并不完全相同,本文中的反饋是基于主動、有傾向性的假設,是對假設的測試、應用、模擬,是對假設的檢驗和推動。而假設也會在反饋的驅動下,基于從假設到反饋的快速循環形成知識進化和持續升級的復利效應。例如,算法模型的預測就是一個主動假設,并非被動和隨機。建立假設的能力和反饋一樣重要,假設和反饋共同決定了效率。更準確的界定是“假設-反饋循環”(Hypothesis Feedback Loop,HFL)框架下的反饋。或許,我們稱之為“數字認知論”會更貼切一些。在這個框架里,抽象演繹體系和實證歸納體系統一在一起,并在相互推動中被不斷加速。特別是以數字化的方式抽象概括、虛擬化之后,以數學邏輯的方式基于HFL可以實現更快演化。下一步,HFL還要將數字化升級為智能化,加速萬事萬物運轉,使整個社會的成本歷史性地下降。

反饋看起來極其簡單而常見,但它的內涵遠不僅是維納最早在經典的控制論中提到的,反饋是為了消除偏差、帶來控制,如今更多是從偏差反饋中擬合、學習和解釋世界。我們希望討論的是,當它與具體的場景結合起來并運行于其基礎層面時,呈現出的不同具體實踐。

反饋為什么如此重要

反饋在一個強調學習能力的時代尤為關鍵。我們的世界正在不同層面上經歷兩個轉變,一個是從由水平、規模驅動的增長轉向由深度和創新驅動的增長;另一個轉變是大環境正在加速復雜化。應對這些變化,需要我們提升學習效率,而學習的本質就是假設和反饋的循環,特別是在數據和智能算法革命性加速反饋效率的新技術條件下。其實,認知的突破和世界的演進都是在反饋的驅動下發生的。

復雜性和不確定性混淆的世界

復雜性和不確定性經常被混雜在一起。復雜性是計算問題,是由很多簡單因素和規則的疊加、交互影響和反饋效應加速帶來的。比如,“少了一顆釘子,掉了一個馬掌,失去一匹戰馬,輸掉一場戰爭,滅掉一個國家”的混沌現象,比如天體之間的三體現象。不確定性是世界運行規則及對其本質屬性的認知問題,如量子態。我們將重點討論可計算的復雜性,人們平時所說的“不確定性”并不是量子物理所描述的不確定性,其本質上是復雜性。為了保持表述一致,本書中也會使用“不確定性”這個詞語,其內含與大眾用法一致,即表達認知層面的不明確。

瑞典皇家科學院將2021年的諾貝爾物理學獎授予三位在復雜系統研究上做出突出貢獻的物理學家,他們正在嘗試以更多元的交叉視角來尋找對復雜系統的更好解釋。今天的世界越來越呈現出復雜系統的特點,創新和復雜性就是這個不斷加速中的世界所呈現出的兩面性。更加違反直覺的是,這種復雜性通常都是在沒有控制的情況下,由極少數簡單的反饋規則演化而來;開放系統的內外部反饋使其比封閉更容易在混亂中形成自發秩序;不精確的,由自適應性反饋驅動的演進系統,也比追求精確控制性的系統更容易在快速變化中獲得生存機會。無論是否準備好,我們就生存在這些新假設中。有很多我們已經習以為常卻在不斷失效的做法,都需要在新的假設之下被重新評估。

以簡單化解復雜的反饋機制

1997年,擊敗國際象棋世界冠軍卡斯帕羅夫的方法是基于大量人工規則的深度搜索,早期的機器翻譯也是基于大量人工規則,然而這些方法后來都因為不可逆變得越來越復雜而不可持續。基于通用、簡單的反饋機制和算法規則配合算力和數據的放大來解決問題被證明是可持續的,算法會不斷提升通用性,強化學習就是簡單反饋規則在海量重復學習中涌現智能性,ChatGPT(預訓練語言大模型)代表的大規模預訓練模型基于簡單規則和海量數據就能涌現讓人意外的語言能力。而基于人工規則的系統更適合在數據驅動的模式下做可靠的底線保障。

在進化的過程中,基因變異形成的新假設和自然選擇的反饋,共同幫助生物向更強大的適應能力演化;科學家的假想和思想實驗,以及實驗室內外不同形式的實驗和實踐反饋,在推動科學發展;互聯網通過海量用戶行為“投票”反饋來決定排序策略的預估模型,從而實現個性化;AI算法根據反饋數據調節模型參數和網絡結構,從而涌現智能;反饋信息促進了腦和思維的形成。甚至,我們身邊的更多例子都在基于這個樸素的方式運行。就像我們在讀過本書之后才能形成反饋,才會知道自己對它的預期是否準確,這可以幫助我們在以后做出更好的判斷。

這看似是一個簡單的框架,卻在不同的組織團體內、在不同的生物神經系統內、在不同的具體情景下,表現為形式不同的反饋傳遞機制。而且,這種細小的差別會在反饋循環中被迅速疊加和放大,在不同的反饋循環之間交互影響,這造就了世界的復雜萬象。反過來看,在同一類別、同一領域中,不同參與者、不同模式的差異,就有來自不同“假設和反饋”機制的作用。這也是我想在這本書里討論的,簡單的規則在反饋機制作用下演化出一切,在案例、規律、原理三個層面分別展開。切入點可以是反饋的結構、主體、關系、機制等角度,也可以是反饋數據的規模、速度等角度。

這個簡單框架的復雜性還體現在,任何看似確定的假設都已經被市場充分消化,基于此的靜態推演不可靠,因為參與者總是會基于此做出進一步的反饋,就像股票市場。特別是在復雜交互增加的環境中,只有持續的動態反饋機制才可以幫助我們更好地把握明確的機會。

數字化加速反饋,逼近認知加速的奇點

反饋本身沒有意義,以不同的方式更高效地轉化和利用反饋中隱藏的信息,才使反饋有了意義。如果說這個時代有什么特別之處,一個很重要的變化是數字化從根本上改變了反饋數據的規模、全面性、速度、精度,在反饋數據質量和效率同步提升的背后,是數字化技術創新與反饋結構、機制的共同進展。顯著的例子,包括互聯網和物聯網節點的密度及其產生的實時數據流;也包括AI深度神經網絡的深度和層次結構,在反向傳播反饋機制下涌現的智能;還包括區塊鏈技術支持下的個體對個體的去中心化反饋結構,以新信用機制催生Web3.0(第三代互聯網)。基本的反饋機制規律會以不同的形式重復出現在不同的應用場景,并起到決定作用。

此外,AI在處理大規模數據方面也具備了統計潛在規律并發現假設的能力,從而能夠實現自學習。特別是在物理等自然學科陷入實驗手段不足的困境階段,新的研究范式出現,對我們來說是一個好消息。

這些重要的變化組合在一起,就形成了更加快速的HFL,就像把整個世界裝進了數字化的加速器,隨時有新的撞擊幫我們打開新的世界。如果說互聯網改變了連接價值的方式,那么數字化將改變創造價值的方式。當數字化和智能化的能力越來越普及,比軟件、數據和算法這些工具更重要的是數字化和智能化的思想,我們是否建立了適合新時代的世界觀、數字化思維方式和基礎知識體系?這正是當下造成基礎創新空白的主要瓶頸。基礎的思想通常被認為是虛的東西,具體的工作更容易量化為短期成果。

在未來,智能就是在數據反饋中高效自學習的機制,物聯網和云計算就是反饋數據獲取、加速連接與計算的助推器,最終將整個世界裝進云端模擬引擎。更進一步,數字化模擬可以更高效地獲得反饋,還可以通過算法等反饋機制創新實現對反饋學習的加速。

基于數字化反饋的商業3.0

數字化反饋、計算、模擬技術的進展使遠期和微觀事物的實時可見性得到了顯著提升,可以支持算法自學習和實時優化。如果說工業時代是存量的博弈,產生了基于市場空間競爭的五力模型和基于心智空間競爭的定位理論,在互聯網時代則產生了低成本和快速的MVP(最小可用產品)測試模式。在今天,隨時可用且實時在用戶的使用反饋中自學習、自主進化的產品和服務,在新的數字時代,我們稱之為RSS(Real-time Self-Learning System,實時自學習系統)。例如特斯拉影子模式(Shadow mode)、實時升級的推薦策略、柔性響應的供應鏈。這應該是屬于數字化、智能化時代的定義性模式,我們會在第4章討論這一課題。

這個時代給我們的另一個關鍵信號是,從假設到反饋的循環周期正在數據和算法的推動下變得越來越短,世界將被這種趨勢徹底改變,一切的競爭將歸結為學習速度的競爭,這就是RSS的價值。商業戰略需要參與所在時代市場內在結構演化中發生的根本變化。在今天,我們和我們的公司,顯然需要使戰略基于高效的反饋系統,建立學習效率優勢,并善于利用反饋效應。

如何建立數字時代的反饋系統

回歸最基本的框架,世界上有三類反饋系統對我們極其重要,第一類是來自外部世界的反饋,可數字化的反饋,就像雷達告訴我們距離車庫的墻還有多遠。在本書里,我們會討論互聯網和AI如何回歸本質,在反饋機制創新的指引下找到下一階段的方向,并實現人類認知外部世界能力的本質性進展。第二類來自人類本能對外部世界的反饋,古老的大腦邊緣系統和快速進化的人類文明之間的不同步,導致了由內而外的過激前反饋問題,這是導致焦慮、肥胖等現代社會病的部分原因。我們從中也可以理解用戶為什么投訴我們的服務,新消費面對現代社會中人們焦慮的本能如何做出恰當反饋,提供滿足感。第三類是獨立于人與自然界之間,修補兩者之間的裂縫,以各自的HFL機制,相對平行獨立的反饋演化系統。受限于碳基生命的緩慢進化周期,人類在自己創造出的多重混合進化系統中,正取得更快的進化和更強的適應能力。例如,在自然界之外,人類創造了令人沉浸的藝術世界,提供滿足感的消費世界,以及元宇宙和人機結合體。其中,我們將重點討論“新消費”“個人化創造力”“自組織”“科技和智能”,并嘗試從中找到不同系統如何基于反饋機制實現演化,從而獲得這些領域內趨勢和機會的洞見。例如,我們會在組織部分討論公司的內外部反饋效率如何基于“最小反饋單元”實現提升,Web3.0會如何基于新的去中心化反饋機制重新組織世界等具體課題。

然后,基于此的商業世界也會發生根本性的變化。例如,如何建立自己的數字化反饋流(新假設在應用和測試中的實時、全面、連續的反饋數據流)?特斯拉、亞馬遜、TikTok(短視頻應用)這些領先企業如何基于數字化反饋流變革業務?如何基于反饋效應制定適應當今時代的商業戰略?如何基于數字化反饋優化決策?如何為高效公司反饋系統設計機制?我們會在第4章從數據、人、組織、機制、技術等不同的角度討論具體的方法和規則。

最后,我們會在第5章重點討論模擬計算如何高效地處理復雜性問題,以及如何實現對反饋的終極加速。在第6章會提及如何基于數字化反饋建立新的認知科學。

這些內容是寫給未來的讀者的,有些內容會有生澀的新知識,但這也許就是我們面向下一個時代缺少的,我們現在可以一次性刷新認知。特別是對于那些希望在數字時代持續引領創新的新一代管理者,以及新一代的跨界思考者,他們不會再以傳統的狹窄學科界定自己。當然,不同的讀者可以選擇與自己相關性更高的反饋應用場景來了解,不同的場景之間并沒有嚴格的依賴關系。

對于簡單本質的追求

本書追求以盡可能簡單的方式解釋復雜,當我們躺在草地上仰望星空,看不見的引力作用于自己;當我們眷戀家鄉土地上長出的美味,我們會更加理解自己的本能;當我們追趕牛群,它們逃跑的時機和路線可以教會自己博弈論;當我們和孩子一同玩耍,可以了解生物智能是如何學習的。偉大的知識作用于身邊每一個細節,自己睜開眼睛就可以學到,就像海灘上撿貝殼的孩子,這就是亞里士多德說的第一性原理。所以,在不同的領域,我一直在用同一個方法和體系工作,因為我相信所有好的方法都可以還原為基本的常識,而對常識的組合運用可以解決所有問題。

幾乎沒有一個未知課題的研究會完全按照預期發展,如果有,這種研究可能很難有新突破。本書并不是按照一條線寫下來的,我并沒有對各部分的語言風格做完全的統一,因為對一些特定領域的知識做簡化的表達可能會使其喪失準確性。有不同興趣的讀者可以選擇閱讀不同的部分、不同的專業方向和專業深度,不求甚解,各取所需,它們都是圍繞“反饋”的不同方面來展開的。本書試圖客觀描述這個時代的內在客觀規律和相同中的不同,很多觀點是一種新的假設,如果你能證明它是錯誤的,那么它的價值在于提供了更多反饋,從而激發了新的假設。微小的努力只要有反饋就有意義。

主站蜘蛛池模板: 忻州市| 周至县| 舞阳县| 富川| 武穴市| 唐山市| 西乡县| 平山县| 广汉市| 海淀区| 乳山市| 且末县| 平遥县| 原平市| 商河县| 朝阳县| 即墨市| 万宁市| 玉田县| 呼图壁县| 剑阁县| 余庆县| 桂阳县| 大悟县| 乌兰浩特市| 沙洋县| 南安市| 漳州市| 房山区| 利川市| 雷州市| 齐河县| 吴忠市| 安乡县| 通许县| 景德镇市| 鄂尔多斯市| 深水埗区| 方城县| 聂拉木县| 房产|