官术网_书友最值得收藏!

節(jié)儉的大腦

用預測來解釋感知還有一個重要的好處:它揭示了大腦如何以一種非常高效的方式處理傳入的感覺信息。眾所周知,信息科學的主要目標之一就是提高通信效率,這門科學在開發(fā)非常節(jié)儉的信號傳輸方式方面發(fā)揮了重要作用。20世紀中葉,全球電信系統(tǒng)由于需求持續(xù)增長而不堪重負。對電信巨頭來說,要使用老式電話線傳遞越來越多的信息,就要直面通道噪聲干擾嚴重且傳輸能力有限的問題。這給了信息科學以用武之地:信息理論家最終為提高信號傳輸?shù)慕?jīng)濟性而開發(fā)了一項沿用至今的強大技術——線性預測編碼。[12]

線性預測編碼的起源可追溯至1948年香農(nóng)發(fā)表的一篇論文,他是供職于貝爾實驗室的數(shù)學家和密碼學家。這篇重要的論文指出,英文文本可以利用單詞和字母之間的可預測性,以一種非常高效的壓縮方式進行編碼。如果某個字母之后幾乎總是跟著另一個字母,那么一個高效的編碼方案就可以做這樣的簡單假設,除非遇見需要特別標記的例外情況。僅標記那些偶發(fā)的例外要高效得多——比編碼每個字母更節(jié)約帶寬。

有了恰當?shù)念A期,即便沒有信號也能攜帶大量信息。假設你制訂了一個計劃,告訴別人,如果你不給他們打電話,那么一切都將“按計劃進行”,也就是說,你會在當?shù)貢r間下周三上午9點飛抵邁阿密,他們應該接機。直到那天,接機者都沒接到電話,但這一事實(可轉化為1比特的信號)恰恰傳達了非常重要的信息:你將會乘坐飛機,在那個時間、那個地點抵達。其巧妙之處在于,接收者擁有的智慧與先見之明抵消了你本該為編碼和傳輸所有信息而承擔的成本。

各種基于預測的壓縮技術已讓電信技術的發(fā)展受益匪淺。[13]原則上,你可以利用關于特定信號最可能形態(tài)的先驗知識來幫助預測接收端的信號,這樣,珍貴的電線和電纜就可以只用來傳輸與預測模式不同的信號。接收端只要根據(jù)該殘差對信號進行更新即可。這個過程的精妙之處在于,只需要傳輸少量的誤差,就可以重構豐富的內(nèi)容(比如圖像或消息)。這些豐富的內(nèi)容主要建立在預測的基礎上,但能通過殘差與現(xiàn)實錨定。

這種借助有依據(jù)的預測壓縮信息的方法,其實就是通過“回補”(adding back in)所有能被成功預測的元素來有效地節(jié)約帶寬。正因有了這門絕技,我們才能用JPEG和MP3等格式以經(jīng)濟的方式存儲和傳輸圖片、聲音、視頻文件。對圖片文件而言,預測編碼的原理是假設每個像素的值都可以根據(jù)相鄰的各像素的值來實現(xiàn)較好的預測。在滿足這種條件下(通常都滿足),我們不需要傳輸該像素的值。所有需要編碼的僅僅是預測值的偏差。但這只是一個簡單的規(guī)律。只要存在任何形式的可檢測的規(guī)律,預測(和借助預測的數(shù)據(jù)壓縮)就可以實現(xiàn)。

我們再看看視頻文件的運動壓縮編碼。1959年,視頻文件的幀間預測編碼技術問世。為了更好地理解,想象一下視頻的內(nèi)容是一個人在沿著走廊跑步。[14]視頻的第4幀和第5幀的視覺背景沒有任何區(qū)別,唯一的差異是跑步者前進了一點兒。有了現(xiàn)成的可預測內(nèi)容(背景),我們只需要傳輸少量的差異(殘差),就能完整地捕捉第5幀畫面。換言之,你可以認為第5幀是對第4幀的微調(diào),兩幀畫面的差異只在(比如說)腳的位置,因此將腳的位置信息通過系統(tǒng)傳輸?shù)某杀具h遠低于傳輸?shù)?幀中每個像素的新值。這種技巧至今仍在使用。

現(xiàn)在請想象一個已經(jīng)了解了更多信息的系統(tǒng),比如,一個了解各種不同的奔跑步態(tài)的動態(tài)細節(jié)的系統(tǒng)。這樣的系統(tǒng)能利用更詳細(更“高層級”)的信息進行預測,因此只有意料之外的腳部動作才會引發(fā)預測誤差信號。假設腳部動作和預期一致,那么就不需要更新幀間信息。這種更智能的系統(tǒng)甚至可以產(chǎn)生通常的持續(xù)運動幻覺,僅在有意外發(fā)生時更新(比如跑步者突然被絆了一跤)。無論預測有多復雜或高級,新異信息都要由預測誤差來傳遞,在不符合預期之處發(fā)出信號,從而讓我們與一個不斷變化且時而令人驚訝的世界保持接觸。

人類大腦似乎受益于這種智能的預測策略,并使用了“多層信息處理”這一強大的方式。[15]在這種多層級的情境中,簡單的預測被嵌套在不那么簡單、更抽象的預測之中,就像我們在奔跑步態(tài)的例子中所示,對步態(tài)的預期是一種更高層級的預測,反過來又會生成關于實際腳部位置的預測(更低層級的預測)。在那一刻,預測誤差形成并通過系統(tǒng)向上傳輸。這些細微的差異進而對各層級的猜測進行微調(diào),比如跑步者當前的步態(tài)與我們的預期不符,因此要調(diào)整我們的預測,使其與信號更加契合。

在大腦的預測處理架構中,我們通常認為有不同的神經(jīng)元集群專門負責不同的功能,因此較高的層級就能利用自己的專業(yè)知識和專屬資源來嘗試預測較低層級的狀態(tài)。具體而言,一個專注于預測完整單詞的層級可能會利用自己的知識來幫助預測更低層級的狀態(tài),后者專門識別字母。而負責預測單詞的層級本身可能會被專門從事完整語句預測的更高層級預測。本書附錄中提供了一個與此相關的詳細示例以及其他細節(jié)。

目前需要注意的是,在這種多層級的安排中,所有向前流動(從感受器邊緣流向大腦深處)的都是新異信息——與預期的偏差。這樣非常高效。一些信息如果已得到了很好的預測,就不應占用寶貴的帶寬來向上傳遞。如果你每天按部就班地工作,公司總部又干嗎要費心思過問你的進度?同樣,在神經(jīng)層面,每個層級的預測誤差只會傳遞預料之外的內(nèi)容,即可能需要進一步思考或采取行動的內(nèi)容。

像這樣的系統(tǒng)在利用輸入信息時非常節(jié)儉。相較于嘗試從頭處理每一條信息,它們會高效地篩選和過濾輸入數(shù)據(jù),只突出顯示那些預料之外的部分。說到底,人類對現(xiàn)實的體驗是大腦產(chǎn)生的幻覺。這意味著我們所體驗的世界在某種程度上是我們所預測的世界。感知絕不僅是一扇窺視世界的窗口,非要這樣比喻,那就是鑲在窗欞上的玻璃從一開始就帶有我們自身的預測和期望的色彩:不僅意味著我們的觀念和偏向會影響我們后續(xù)對事物的判斷,預測還會在更深層、更原始的意義上塑造我們的感知過程——作為使我們與世界保持接觸的特殊機制,感知活動始終在豐富的預測和期望的驅(qū)動下進行。

在接下來的章節(jié)中,我將嘗試讓你親身體驗預測的力量如何改變你的所見所聞。

主站蜘蛛池模板: 双桥区| 台东县| 阜南县| 大城县| 炎陵县| 舟曲县| 根河市| 泉州市| 茌平县| 建德市| 常州市| 萝北县| 神池县| 称多县| 呼和浩特市| 湖北省| 东辽县| 长阳| 柳州市| 乐山市| 保康县| 芜湖县| 丹凤县| 水城县| 饶阳县| 顺昌县| 巴马| 罗甸县| 青冈县| 冕宁县| 镶黄旗| 广东省| 神木县| 建湖县| 化州市| 东明县| 商城县| 察雅县| 鄂托克前旗| 宕昌县| 彰武县|