- 體驗機器:我們的大腦如何預測和塑造現實
- (英)安迪·克拉克
- 1072字
- 2025-05-07 12:03:13
正弦波語音和“綠針”效應
我們接下來的例子涉及聲音,鑒于我們大概是用眼睛而不是耳朵來閱讀,這些內容可能不那么直觀。你如果現在不在一個可以聯網的設備附近,僅僅閱讀下面的文字就足夠了。但你如果能夠打開一些音頻文件,就會發現非常值得:你將有機會親身體驗這些非常簡單但又極富戲劇性的效應。
首先要討論的現象被稱為“正弦波語音”。正弦波語音錄音是一種人為降低質量的正常語音錄音,用純音哨聲代替了聲音流的關鍵部分。這項技術是在20世紀70年代初由美國哈斯金斯實驗室發明的,作為研究語音感知的本質[21]的一種手段,具體而言,就是對各種關于聲音流的哪些部分對聽語音至關重要的理論進行檢驗。正弦波語音聽起來像是一系列起初難以理解的、包含升調和降調的嗶嗶聲和哨聲。
網上有許多錄音(登錄我薩塞克斯大學同事克里斯·達爾文的網頁,可以找到一些我最喜歡的,或者只需搜索“正弦波語音”),它們聽起來是這樣的。首先,你會聽到一段“語音”錄音,質量低到聽上去毫無意義可言。然后,你會聽到原始錄音,其中有人會說一個簡單的句子,比如“水壺煮沸得很快”。之后,帶有嗶嗶聲和哨聲的正弦波語音會再次播放。第二次聽的時候,你的聽覺體驗會發生巨大改變。現在,你清楚地聽到了語音中的詞以及它們之間的間隔。這就像之前展示的穆尼圖一樣,只不過這次是以聲音的形式。
如果你使用不同的例子多次練習,你就會迅速變得很熟練,甚至不需要先聽原始的句子。聽母語中的日常用語也有相同的技巧——你的預測越準確(也許是因為你認識說話者或者有相同的口音),聲音聽上去就越清晰。在每種情況下,都有一個良好的預測模型可以改善感知。這樣的模型使用預測來幫助你從噪聲中辨別信號。之前聽起來像一系列無意義的嗶嗶聲和哨聲,現在聽起來像是一個結構化的句子,盡管聲音有點兒失真。與原始體驗相比,差異是如此之大——就像將原始聲音文件用另一個截然不同的文件替換了一樣。
再舉一例(有些人可能對這個例子已經很熟悉了),重復播放聲音,同時從兩個不同的詞(或詞組)中任選一個呈現在屏幕上,比如“brainstorm”(頭腦風暴)和“green needle”(綠針)。令人驚奇的是,你聽到什么似乎取決于眼前的是哪一個詞,可這兩個詞聽上去差異非常明顯!這是因為眼前的詞會使基于證據的平衡偏向于其中一種聽覺預測而非另一種。你所體驗到的顯著差異再次揭示出你的聽覺體驗在多大程度上是由你自己的預測構建的。在搜索引擎中輸入“green needle”和“brainstorm”,你將有機會親身體驗一番。
這些效應看似神奇,但它們都屬于正常的感知現象。我們能借助感知理解自己所處的世界,既離不開外界傳入的感覺信號,又要仰仗豐富的、基于知識的隱形預測。