- 心智探奇:人類心智的起源與進化
- (美)史蒂芬·平克 郝耀偉譯
- 15913字
- 2019-01-03 10:51:42
人的智能=神經網絡+符號處理過程
心理語言中的規則和表征在哪里就停止工作呢,神經網絡又在哪里開始發揮作用呢?大多數認知科學家贊同“兩極分化說”。在最高的認知層次,我們有意識地亦步亦趨,小心運用著我們從學校所學的規則或自己發現的規則,這時,思維就像一個生產系統,記憶中儲存著符號性語句,并由“小幽靈(后臺程序)”來執行程序。在較低的層次,語句與規則是在神經網絡中得到執行的,神經網絡對熟悉的模式做出反應,并將這些模式與其他模式相聯系。但這些層次的界限在哪里卻仍有爭議。到底是由簡單的神經網絡來應付大量的日常思維事務,用顯性規則和命題來處理讀書學習之類的任務呢,還是神經網絡更像一些全然無知的基礎構件,直到它們被組裝成結構分明的表征和程序呢?
有一個學派稱為聯結主義(Connectionism),代表人物是心理學家戴維·魯梅爾哈特(David Rumelhart)和詹姆斯·麥克萊蘭德(James McClelland)。他們認為,簡單的神經網絡自身就可以解釋絕大多數人類智能。更有甚者,聯結主義宣稱,思維就是一個很大的隱含層反向傳播神經網絡(Hidden-layer back-propagation network),抑或可能是一組類似或相同的神經網絡,而當環境這個培訓師調整影響聯結的權重時,智能就出現了。我們比老鼠聰明的唯一原因是,我們的神經網絡在刺激與反應之間有著更多的隱含層,我們生活環境中的其他人同樣也是神經網絡的培訓師。心理學家不可能跟蹤神經網絡里通過聯結所產生的數百萬條激活信號流,而規則和符號可能就是對于網絡中這些信息流的一個簡便而粗略的估計,但其作用僅此而已。
而另一種觀點認為,這些神經網絡本身并不能完成任務,我更傾向于這種觀點。將神經網絡構建成為操控符號的程序這一過程,解釋了大多數的人類智能。對符號的運用是人類語言及與語言相互作用的推理部分的基礎。這并非所有的認知,但已經是很大一部分了;它已是我們能與自己和他人交談的全部了。作為心理語言學家,我在工作中搜集的證據表明,即使是講英語所需的最簡單技能,如動詞過去時態的組成(walk變為walked, come變為came),對單個神經網絡而言,在計算上也是過于復雜而無法處理的。在本節中,我將闡釋一個更為一般意義上的證據。我們的常識性思考內容(我們談話中交流的那種信息),需要一個設計成執行高度結構化心理語言的計算機器呢,還是用通用的神經網絡這類東西(有饒舌者戲稱為聯結漿糊)就能解決?我將向您說明,我們的思想有一個精巧的邏輯構成,這種構成絕非簡單的同質單位層神經網絡(simple network of homogeneous layers of units)所能處理的。
這與您有什么關系呢?因為這些證據對關于心智如何工作這一問題迄今最有影響力的理論提出了質疑。根據該理論,感知器(Perceptron)或隱含層神經網絡(hidden-layer network)就是對一個古老教條——想法關聯——的高科技執行翻版。英國哲學家約翰·洛克、大衛·休謨、喬治·伯克萊、戴維·哈特利,以及約翰·斯圖爾特·密爾都提出,思想是由兩條法則所決定的。一條為鄰接律(Contiguity):時常共同體會到的想法會在頭腦中建立關聯。因而,一個被激活,則另一個也隨之激活。另一條為相似律(Resemblance):當兩個想法類似時,無論什么與第一個想法相關聯,則自動也與第二個建立關聯。正如休謨于1748年所總結的理論:
自身體驗帶給我們一些源自某些東西的一致性效應。當一個具有類似可感知特征的新產品被生產出來時,我們期待它能具有類似的功能,并尋找相仿的效應。從一個與面包有著類似光澤和形狀的東西中,我們期待能獲得相似的營養補充。
基于鄰接律和相似律的關聯方式也被認為是宣傳著名“白板”(洛克對新生兒心智的比喻)的始作俑者。這個被稱為“關聯論”(Associationism)的學說統治英美的心智學界達幾個世紀之久,直至今日,它在很大程度上仍占主導地位。當“想法”被刺激-反應所取代后,關聯主義就變成了行為主義。白板說和上述兩條“一般-目的”學習法則是標準社會科學模型的心理學基礎。我們不時聽到些陳詞濫調,說我們的成長教育如何令我們在食物與愛、財富與快樂、身高與權力等諸如此類事物之間建立“關聯”。
直到最近,關聯論仍過于模糊而無法檢驗。但由于其通常在計算機上進行模擬仿真,神經網絡模型可以使想法更為精確。由教師向神經網絡提交一個輸入和正確的輸出,而神經網絡則力求在未來對該輸入和輸出的配對加以復制。這種學習方案是一個很好的鄰接法則模型。在所分配的輸入表征中,概念本身并沒有自己的單位(“鸚鵡”),而是由圍繞其特性(“有羽毛”“有翅膀”,等等)的多單位激活模式來表征。這種輸入表征使相似的概念得到自動的一般化歸納,因而很好地符合了關聯論的相似法則。如果心智的所有部分都能像同一種神經網絡來運作,我們就能得到“白板”的程序執行了。因而聯結主義提供了一個機遇。通過觀察簡單神經網絡能做什么和不能做什么,我們就能夠對持續幾個世紀之久的想法關聯學說進行嚴格的檢驗了。
在開始之前,我們需要做一些解釋性的說明。聯結主義并不是心智計算理論的替代學說,而是對該理論的一個變體,它主張,人腦信息處理的主要類型就是多元變量統計。聯結主義也并不是對人腦如電腦理論的必要更正(該理論認為人腦就像具有一個高速、無差錯的序列性核心處理器的商業電腦。事實上,沒有人認同這種理論)。阿契利斯認為,所有形式的思考都包含了對邏輯課本中上千條規則的嚴謹遵循,但現實生活中沒有阿契利斯。最后,聯結主義者所設想的網絡是不現實的腦模型,盡管他們滿懷希望地貼著“神經網絡”這樣的標簽。例如,“突觸”(聯結權重)可以由興奮轉到抑制,信息可以沿著“軸突”(關聯)雙向流動,但這在解剖學上都是不可能實現的。當面臨的選擇是完成任務還是反映實際腦工作時,聯結主義者往往選擇完成任務;這說明他們所提出的神經網絡只是一種大致基于神經元比喻的人工智能形式,而并不是一種神經建模。問題在于,這種神經網絡是否執行了正確的計算來反映人腦思考的工作運行呢?

原始的聯結漿糊不能合理地解釋日常思考的5大不凡之處。這些不凡之處最初并不顯眼,在邏輯學家、語言學家和計算機科學家們將句子的含義放到顯微鏡下仔細研究前,甚至沒人意識到它們的存在。但正是這些不凡之處為人類思考賦予了獨特的準確性和力量,而且我認為它們對回答一個問題提供了重要素材。這個問題就是:心智如何工作。
第一個本領是具有個體性的概念。首先我們來看看神經網絡與類似計算機表征的第一個差別。那時我們不是將一個實體符號化為一串字符的任意模式,而是將它表征為一個單位層的模式,每一層代表這個實體的一個性質。這樣的一個直接問題就是,無法再區分具有同樣性質的兩個個體。它們是以一種相同的方式來表征的,系統無視它們是不同的兩塊物質這一事實。我們已經喪失了個體性:我們可以表征蔬菜或馬,但卻無法表征某種蔬菜或某匹馬。無論系統對于一匹馬獲知了什么,都會合并到它對另一匹完全相同的馬的認知中。沒有自然的方式來表征兩匹馬。讓馬的結點激活兩次沒有用,因為那與兩倍地確信馬特征的呈現或者認為馬特征呈現程度增加一倍無法區分開來。
我們很容易把級別與亞級別之間的關系,混淆為亞級別與個體之間的關系。這兩種關系確實在某方面很相似。兩者中,任何高級別實體的特性都是從低級別實體那里繼承來的。如果動物呼吸,且馬是動物,那么馬呼吸;如果馬有蹄子,Ed.先生是馬,那么Ed.先生有蹄子。這可以誘惑建模者將一個個體視為一個非常非常具體的亞級別,運用兩個實體之間的某些細微差異來區分近似的“小幽靈(后臺程序)”。—— 一個雀斑單位對于一個個體是開啟的,而對于另一個個體則是關閉的。
正如許多聯結主義者所提倡的,要回溯到英國聯結主義。伯克萊寫道:“拿走對柔軟、潮濕、紅色、酸味的感覺,你就等于拿走了櫻桃,因為櫻桃不是與感覺性質不同的東西。要我說,櫻桃是一個感覺印象的集合。”但伯克萊的建議絕對是錯誤的。你對于兩個物體特征的認識可以是完全相同的,而你仍覺得它們是可區分的。想象一個房間里有兩把完全相同的椅子。有個人進來把它們彼此調換了一下位置。這個房間與從前一樣嗎?還是有所不同?很顯然,每個人都明白它是不同的。但你不知道兩把椅子的差異——除了你可以把一個想作一號椅子,另一個想作二號椅子。我們又回到了記憶插槽的任意標簽,就像令人鄙夷的數字計算機中的一樣!喜劇演員斯蒂芬·賴特的一個笑話也傳達了同樣的含義:“在我不在的時候,有人偷了我公寓里所有的東西,然后換成了完全相同的復制品。當我與室友說這事時,他說:‘我認識你嗎?' ”
當然,有一條總可以用來區分個體:它們不可能在相同的時間處于相同的地點。或許心智能夠給每個物體都貼上時間和地點的標簽,然后不時地更新這些坐標,使它能夠區分具有共同性質的個體。但即使這樣,也不能反映出我們心智中區分個體的能力。假設一個無限的白色平面上除了兩個完全相同的圓圈之外什么都沒有。其中一個圓圈滑過來在第二個圓圈上面貼住了一會兒,然后又滑走了。我想,任何人都會把這兩個圓圈看作是不同的東西,即使它們在同一時間同一地點附著在一起的那一小會兒也是如此。這說明在某一時間處于某一地點并不是我們對于“個體”的心理定義。
這并不是說,個體無法在神經網絡中得到表征。很簡單,只需將一些單位用于表示為個體的識別身份,而獨立于個體的性質特征。可以賦予每個個體它自己的單位,或者賦予每個個體一個以激活單位模式編碼的等價序列號。寓意在于心智網絡的設計要能夠執行對個體的抽象邏輯內涵,就像計算機中標記任意標簽的內存位置所起的作用。有問題的是受限于物體可觀察特征的模式協關器,這個亞里士多德名言“感覺是理智的前提”的現代例證。
這個討論只是一次邏輯練習嗎?當然不是。個體的概念是我們社會推理整體知識的基本粒子。我讓你看看兩個現實生活中的例子,涉及那些人類交流的偉大領域,愛與正義。
同卵雙胞胎的大多數特征都一樣。除了外表的相似之外,他們思維相像,感覺相像,行為也相像。當然并不是完全一致,正因如此,有人可能會想把它們表征為非常狹窄的亞級別。但任何把它們表征為亞級別的生物體,都應當至少完全相同地對待同卵雙胞胎。這個生物體應當將它的想法從一個傳到另一個,至少在概率上或一定程度上如此——記住,這是聯結主義及其在聯結漿糊中貫徹的一個賣點。例如,無論雙胞胎中一人的什么吸引了你——他的走路方式、談話方式、他的外表,等等——這也會令雙胞胎的另外一人吸引你。這應當將同卵雙胞胎置于傳說中圍繞真正完美輪廓的嫉妒與背叛。事實上,什么事也沒發生。同卵雙胞胎中一個人的配偶對于另一個并沒有感覺到羅曼蒂克式的吸引。愛將我們對另一個人的感覺鎖定為那個人,而不是那種人,無論對那種的細分有多狹窄。
1988年3月10日,有人咬掉了警官戴維·J .斯托頓的半個耳朵。毫無疑問,是他倆中的某一人干的:要么是肖恩·布里克,一個住在加州帕洛阿爾托的21歲年輕人,要么是約納森·布里克,他的同卵雙胞胎兄弟。兩人當時都在與警官扭打,其中一個咬掉了警官的半個耳朵。兩人都被指控故意傷害罪、盜竊未遂罪、襲警罪和加重故意傷害罪。加重故意傷害罪,就咬耳朵行為而言,將被判終身監禁。斯托頓警官證實了雙胞胎中的一個留著短發,另一個留長發,是留長發的人咬了他。不幸的是,3天后兩人自首時,兩人的發型都變成了相同的平頭,而且兩人也不說話。他們的律師辯稱,兩人誰也不應當因加重故意傷害罪而被判處嚴厲的監禁。對于兄弟倆中的每一個,都有合理的懷疑是否是他所為,因為有可能是另一個人所為。這項爭辯很有說服力,因為我們的正義感要讓我們選擇做了某個行為的個體,而不是那個個體的性格特征。
我們對于個體位格的執迷并不是一個過于費解的奇癖,其進化的原因很可能是因為,我們所遇到的每個人,與我們所觀察的任何財物大不相同;而這種不同之處在于,由于人類獨特的胚胎學和個人傳記式歷史,人確定地容納了大量不可復制的記憶和欲望。在第6章中,當我們反向逆推正義感和浪漫愛情的情感時,我們會看到記錄個體位格的心理活動位于他們設計的核心。
人類并不是我們需要區別對待的唯一一種易混淆的個體,騙局是另一個真實世界中的例子。許多動物需要施展騙局才能保持個體的區分。一個例子是,需要辨別她孩子的母親,她的這些孩子看上去和其他所有的并無二致,但卻攜帶著她的基因。另一個例子是,牧群動物的捕獲者,它需要追蹤目標獸群中的一員,采取的就是像盯著游泳池里的標簽一樣的策略:如果你是目標獵獲物,一旦確定就不再更換,分秒必爭地直奔目標物。在肯尼亞的動物學家為了使他們的數據收集更加容易,在麻醉針麻翻了的角馬角上涂了彩色的編碼,但他們發現,在把被作了標記的動物放回獸群之前,無論怎樣小心地使它恢復精力,它總會在一兩天之后被鬣狗捕殺。一種解釋是,彩色標記使鬣狗容易將那只角馬與其他的區別開來,從而追趕它直至其力竭而成功將其捕獲。最近關于斑馬條紋的新觀點是,它們不是為了要與條紋高草相混淆而將其作為保護色——這一直是一個可疑的解釋——而是為了使斑馬成為一出活生生的騙局策略,令獅子和其他捕食者很難將注意力只保持在一匹斑馬上時。當然,我們無從知道鬣狗或獅子是否有個體的概念;也許一個古怪的人要站出來會看上去更令它們食欲大開。但這些例子說明了從類別中區分個體的計算問題,并強調了人類心智是如何輕而易舉地解決了這個問題的。

關聯主義的第二個問題被稱為組成性問題:一個表征如何由各種部件組成,以及各個部件的含義和它們的組合方式又如何構成整個表征的含義。組成性是所有人類語言的精華特征。“The baby ate the slug”(嬰兒吃了毛蟲)的含義可以根據baby、ate、the和slug各詞的含義以及它們在句中的位置而得出。整體不是部分的總和;當這些詞的順序變為“The slug ate the baby”(毛蟲吃了嬰兒)時,傳達的意思就不一樣了。因為你之前從沒聽說過這兩句話,你必須通過在這串詞上應用一套運算法則(整合句法的規則)才能解釋整句的含義。每句話最終的含義是你在匆忙中組合在一起時的全新想法。你已經有了“嬰兒”、“毛蟲”和“吃”的概念,并能夠為它們在心理公告板上安排相應的符號,而這種安排是根據能夠讀取的“小幽靈(后臺程序)”所注冊的方案而進行的。這樣,對整句的理解就成為你從未有過的全新想法。
記者們說,“狗咬人不是新聞,人咬狗才是新聞”。心理表征的組成性使得我們能夠理解新聞。我們可以具有瘋狂的、奇妙的新想法,無論這想法多么荒誕不經。奶牛跳過月球;格林奇偷走了圣誕節;宇宙源自一個大爆炸;外星生物降臨哈佛;邁克爾·杰克遜娶了貓王的女兒。感謝數學中的組合理論,我們永遠也不會缺少新聞。還有百萬萬億個想法足夠我們去想呢!
你可能覺得,將組成性問題放到神經網絡中是件很容易的事情:只要開啟“嬰兒”“吃”“毛蟲”的單位就行了。但如果那就是你的心智所做的,你將會感到一頭霧水:究竟是嬰兒吃了毛蟲,毛蟲吃了嬰兒,還是嬰兒和毛蟲吃了。概念必須被分配給角色(邏輯學家們稱之為“參數”):誰是吃東西的,誰是被吃的。
那么,也許有人可以給每個概念和角色的組合分配一個結點。那就有了一個“嬰兒吃毛蟲”結點和一個“毛蟲吃嬰兒”結點。有人可能會想,既然大腦包含了海量的神經元,為什么不那么做呢?不這么做的原因是,海量和真正海量是兩個概念。組合的數目會隨著可允許的大小呈指數增長,這種組合數量的爆炸式增長遠超過了我們對腦容量最大膽的猜想。據傳說,宰相西薩·班·達依爾因其發明了國際象棋向印度舍罕王索要微薄的獎賞。他請賞的只是將一粒小麥放在國際象棋盤的第一個方格里,兩粒小麥放在第二個方格里,四粒放在第三個,以此類推。還遠沒到第64個方格時,國王就發現,他已經無意中將他整個王國所有的小麥都送出去了。獎賞總計達四萬億蒲式耳,相當于全世界2 000年的小麥總產量。與之類似,思維的組合數目會遠遠超過腦中神經元的數量。如果每句含義都要有它自己的神經元,那么一億兆個句子含義怎么壓縮也塞不到擁有1 000億個神經元的大腦里去。
即使能夠容得下,一個復雜思維也一定不是一個神經元對一個思維那樣整體儲存的。原因在于,我們的思維是彼此相關的方式。假設每個思維都有它自己的單位,就會有不同的單位分別對應于嬰兒吃小毛蟲,小毛蟲吃嬰兒,小雞吃小毛蟲,小雞吃嬰兒,小毛蟲吃小雞,嬰兒看見小毛蟲,小毛蟲看見嬰兒,小雞看見小毛蟲,等等。單位必須被分配給所有這些以及更多的思維;任何能想到“嬰兒看到小雞”的人也能夠想到“小雞看到嬰兒”。但這種思維對應單位的儲存有些可疑之處,它的匹配方式純粹出于巧合。我們不斷地有嬰兒吃、毛蟲吃、嬰兒看、蟲子看,等等。所有的思維完美地對應到一個巨大矩陣的各行、列、階、超行、超列以及超階。但如果思維是一個各個獨立單位的大集合,而這些單位代表的同樣也是一大堆彼此割裂、毫無關系的仿真陳述,那么這種驚人的模式就令人難以理解了。當自然交給我們可以合適地放進一個長方形分類儲物架的物體時,它是在告訴我們,這些物體一定是由那些對應到各行各列的更小部件所組成的。這就是元素周期表如何引導了人們對原子結構的理解的原因。出于類似的原因,我們可以得出結論,我們思維的經緯線就是組成它們的概念。思維來自概念的組裝,概念不是作為整體而儲存的。
對于聯結漿糊理論而言,組合性有些出乎意料地復雜。所有表面明顯的把戲都成為不適當的半吊子測量標準。假定我們為每個單位分配一個概念和角色的組合,也許一個單位代表嬰兒-吃,另一個代表小毛蟲-被吃;或者可能一個代表嬰兒-做-一些事,另一個代表小毛蟲-有些東西-被-(做)。這樣就大量減少了組合的數量——但代價是增加了“誰對誰做了什么”的疑惑。“卷毛狗吃小毛蟲時,嬰兒在吃雞肉”的思維會與“卷毛狗吃小雞時,嬰兒在吃小毛蟲”的思維混淆。問題在于,嬰兒-吃的單位并沒說吃什么,小毛蟲-被吃的單位也沒說誰吃了它。
向正確方向邁出的一步是,在硬件中構建概念(嬰兒、小毛蟲等)與它們扮演角色(執行者、被執行對象等)的區分。假設我們確定好各自分開的單位組,一組表示執行者的角色,一組表示行為,一組表示被執行對象。要表征一個命題,每組單位都要裝滿正在扮演角色的概念模式,這些概念是由另一個分開的概念儲存內存那里調入的。如果我們將每一個結點都彼此相連接,我們就有了一個命題的自動協關器,它能夠具備少量的組合思維能力。我們可以儲存“嬰兒吃小毛蟲”,當任意兩個部分作為問題呈現時(比方說,“嬰兒”和“毛蟲”,表示問題“嬰兒和毛蟲的關系是什么”),網絡會通過開啟第三個部分的單位而完成其模式(在此例中,“吃”。見圖2-12)。

圖2-12
是這樣的嗎?可惜不是。我們來看看這些思維:
嬰兒 等同于 嬰兒
嬰兒 不同于 毛蟲
毛蟲 不同于 嬰兒
毛蟲 等同于 毛蟲
如果一組連接權重允許第一糟的“嬰兒”和中間槽的“等同于”開啟第三槽的“嬰兒”;同時允許“嬰兒”和“不同于”開啟“毛蟲”;同時還允許“毛蟲”和“不同于”開啟“嬰兒”,那么這組連接權重絕不會再允許“毛蟲”和“等同于”開啟“毛蟲”。這是一個改頭換面的抑或問題。如果“嬰兒-于-嬰兒”和“嬰兒-等同于”的連接足夠強大的話,它們會開啟“嬰兒”以回應“嬰兒等同于___”(這是好的),但它們也會開啟“嬰兒”以回應“嬰兒不同于___”(這不好)和“毛蟲等同于___”(也不好)。無論你怎樣調整權重,你也無法找到能夠滿足所有4句話的連接組。既然任何人都能毫無疑問地理解這4句話,那么人類心智一定表征了比一組“概念-到-概念”或“概念-到-角色”關聯更為復雜的命題。心智需要一個對命題本身的表征。在本例中,模型需要一個額外單位層——更確切地講,一個專供表征整個命題,而與概念及其角色相分離的層級。圖2-13以簡化的形式展示了杰歐弗瑞·欣頓修訂的一個能處理這些句子的模型。

圖2-13
儲存“命題”單位的記憶是以任意模式開啟的,有點像標志完整思維的序列數字。它就像一座將每個命題中的概念都容納到其相應槽中的超級架構。請注意,這種網絡架構是在多么嚴密地執行著標準的、像語言一樣的心語啊!還有其他一些組成性網絡的提議,不像這樣具有明顯的模擬性,但所有的提議都必須有一些專門設計的部分來將概念與其角色區分開來,并將每個概念與其各自角色適當地結合起來。還是需要偷偷借來諸如謂項、中項和命題等邏輯要素,以及處理它們的計算工具,才能得到一個模型,來做類似心智一樣的事情;僅靠關聯這些東西本身是不夠的。

另一個你或許從沒意識到的心理稟賦被稱為量化或變量約束。它源自個體性與組成性的結合。我們的組成性思維往往是關于個體的,而且個體如何與思維的各個部分相聯系各不相同。“某個嬰兒吃某個毛蟲”的想法與“某個嬰兒總是吃一般毛蟲”的想法是不同的,與一般意義上的“嬰兒吃毛蟲”的想法也不一樣。有一種笑話,其幽默之處需要聽者理解那種不同之處。“Every forty-fi ve seconds someone in the United States sustains a head injury(每45秒鐘美國就有人頭部受到傷害。)”“我的天,可憐的家伙!”(someone可理解為“有人”,也可理解為“某人”)。當我們聽到“Hildegard wants to marry a man with big muscles”時,我們不知道究竟她是用她的男性般的氣概發出召喚呢,還是她只是滿懷希冀地在體育館里游蕩。亞伯拉罕·林肯說:“你可以在某些時候愚弄所有人;你甚至可能永遠愚弄某些人;但你不可能永遠愚弄所有人。”(You may fool all the people some of the time; you can even fool some of the people all the time; but you can' t fool all of the people all the time.)如果沒有計算量化的能力,我們就不可能理解他說的這句話的含義。
在這些例子中,我們有幾個句子,或者對一個語義含混的句子有幾種理解方式,其中相同的概念扮演著相同的角色,但整體意思則完全不同。僅僅將概念與它們的角色連在一起是不夠的。邏輯學家用變量和限量詞來區分它們。一個變量是指像x或y一樣保持位置的符號,它代表著不同命題中或一個命題不同部分中的同一個實體。一個限量詞是一個符號,它可以表達“存在著某個x,它……”,且“對于所有的x, ……是真實的”。這樣,一個想法可以體現在一個命題中,構成這個命題的符號表示了概念、角色、限量詞和變量,所有的都予以精確地排序并加括號分類。例如,比較“每45秒鐘{就有一個X[受傷]}”和“有一個X{每45秒鐘[就會受傷]}”。我們的心語肯定也擁有可以做類似事情的工具。但目前為止,我們尚沒有線索了解在一個關聯網絡中,這是如何做到的。
一個命題不僅可以是關于一個個體的,它自身必須被視為一種個體,這就引發了另一個問題。聯結漿糊的力量來自單個一組單位中添加的模式。不幸的是,這可能產生怪異的四不像或是建一個兩頭都落空的網絡。對于聯結漿糊,這是無處不在的怪物的一部分,被稱為干擾或串擾。
這有兩個例子。心理學家尼爾·科罕(Neal Cohen)和邁克爾·邁克勞斯基(Michael McCloskey)訓練一個網絡學習兩個數的加法。他們起初訓練它把“1”加到其他數上:當輸入“1”和“3”時,網絡學會輸出“4”,諸如此類。然后他們訓練它把“2”加到所有其他數上。不幸的是,這個加2的問題將聯結權重提升到加2為最優的值,因為網絡沒有富余的硬件來設定如何加1的知識,它竟將如何加1忘掉了!這種效應被稱為“災難性遺忘”,因為它不像日常生活的輕度遺忘。另一個例子是麥克萊蘭德和他的同事阿蘭·川本(Alan Kawamoto)設計的網絡,將含義分配給語義含混的句子。例如,“A bat brokethe window”的意思可以是一根棒球棒(bat)被扔到窗戶上,也可以是一只長翅膀的哺乳動物(蝙蝠:bat)撞到窗戶上。而下面這個解釋則是人類得不出來的:一個長翅膀的哺乳動物用一根棒球棒打碎了窗戶!
正如任何其他工具一樣,令聯結漿糊對某些事有效的特點,也令它對另一些事無效。網絡概括的能力來自于它密集的交互聯結性和它輸入的疊加重合。但如果你是一個單位,有幾千個其他單位在你耳邊聒噪,還被一浪接一浪的輸入所蹂躪,這并不總是一件樂事。經常是不同的信息組塊被分開打包和存儲,而不是隨意混在一起。一種這樣做的方式是給每一個命題分配它自己的存儲槽和地址——這再顯示了并不是計算機設計的所有方面都可以被草率歸結為硅的好奇心。畢竟設計計算機不是來用作室內加熱器,設計它是為了以一種對人類使用者有意義的方式來處理信息。
心理學家戴維·舍莉(David Sherry)和丹·夏克特(Dan Schacter)將這種推理推得更遠。他們注意到,對于內存記憶系統不同的工程設計要求往往是目標交叉的。他們辯稱,作為回應,自然選擇給了有機體專門化的記憶系統。每個系統都有一個優化的計算架構專門適合于動物心智必須完成的一個任務的要求。例如,貯藏種子以備收成欠佳日子里食用的鳥類進化出了一種對于隱藏地點的大容量記憶(以星鴉為例,它可記憶10 000個地方)。雄鳥歌唱吸引雌鳥,或者恫嚇其他雄鳥的鳥類進化出對于歌聲的大容量記憶(以夜鶯為例,它可記憶200種歌聲)。對于儲藏地和歌聲的記憶是位于不同的腦部結構,并且有著不同的神經元連接模式。我們人類對于記憶系統同時有著兩種非常不同的要求。我們要記住誰在什么時間、什么地點、為什么對誰做了什么這種獨特場景,這需要在每個場景都標記上時間、日期和一個序列號。但我們還必須推斷出關于人們如何工作和世界如何運轉的一般性知識。舍莉和夏克特提出的觀點是:自然對每種要求分別賦予了我們一種記憶系統:一種“情景式”或自傳體式記憶,另一種是“語義式”或一般性知識的記憶,心理學家恩德爾·托爾文(Endel Tulving)最早提出了這種區分。

思維成倍增加到真正的天文數字的把戲不是將概念插槽分配給三四個角色,而是一種被稱為遞歸的心智能力。為每個角色安排固定一組單位是不夠的。我們人類可以將一整個命題放到一個更大的命題中,賦予它一個角色。然后我們可以將這個更大的命題嵌套到一個還要大的命題中,這樣創造一種命題中有命題的層級式樹形結構。不僅這個嬰兒吃毛蟲,而且父親看見這個嬰兒吃毛蟲,我想知道父親是否看見這個嬰兒吃毛蟲,父親知道我想知道他是否看見這個嬰兒吃毛蟲,以及我能猜到父親知道我想知道他是否看見這個嬰兒吃毛蟲,等等。正如給一個數字加1的能力是一種產生一組無限多的數的能力,將一個命題嵌套到另一個命題中的能力,也是一種增加了無限多思維的能力。
為了在圖2-13所展示的網絡中完成命題之中嵌套命題,可以在圖的頂部增加一個新聯結層,將整個命題的儲存單位聯結到一個更大命題的角色插槽中;這個角色可以是像“觀察的事件”一樣。如果我們繼續添加足夠的層級,我們就可以通過在聯結漿糊中侵蝕全部樹形結構而容納整個成倍增加的嵌套式命題。但這種方法太笨拙,而且會引起疑惑。對于每一種遞歸式結構,都有一種不同的物理連接網絡:一個網絡供思考一個命題的一個人;另一個網絡是為思考一個關于一個思考一個命題的人的命題的一個人,第三個網絡是供一個人與另一個人進行關于某個人的命題的交流,等等。
在計算機科學和心理語言學中,采用了一種更為強大和靈活的機制。每個簡單結構(一個人、一種行為、一個命題,等等)都在長期記憶中得到一次表征,處理器的注意在一個結構到另一個結構之間不斷穿梭轉移,將轉移的路線記錄在短期記憶中,從而將命題編織在一起。這種被稱為遞歸式轉換網絡的動態處理器,特別適合于句子理解,我們是一次聽或者讀一個單詞,而不是一次吐納一個整句。我們似乎也是在一點一點咀嚼深思我們的復雜思維,而不是囫圇咽下或噴出,這說明,心智配備的遞歸式命題計算研究機不僅僅是為了句子,而且是為了思維。心理學家邁克爾·喬丹(Michael Jordan)和杰夫·艾爾曼(Jeff Elman)構建了一些網絡,這些網絡的輸出單位發出的聯結回送到一組短期記憶單位,觸發了新一輪激活流。這種回送設計使我們隱約看到,迭代信息處理在神經網絡中是如何執行的,但它還不足以解釋或匯編結構性命題。最近,有研究者嘗試將一個回送式網絡與一個命題式網絡組合在一起,從聯結漿糊的碎片中完成一種遞歸式轉換網絡。這些嘗試說明,除非神經網絡中特別裝配了一個遞歸式處理器,否則將無法處理我們的遞歸式思維。

心智還具有的另一項認知本領很難從聯結漿糊中提取出來,因而也很難用關聯論來解釋。神經網絡輕易地解決了模糊邏輯的問題,即任何東西都是在某些程度上的某種東西。確切地說,許多常識性的概念在其邊界處都很模糊,并沒有清晰的定義。哲學家路德維希·維特格斯坦舉了“a game”(游戲、比賽)的例子,其典型例子彼此并沒什么共同之處(包括拼圖、速度輪滑、冰壺、角色扮演游戲、斗雞,等等)。我在前面也曾給出了另外兩個例子,“單身漢”和“蔬菜”。模糊類別的成員缺少一個單一確定的特點;它們的許多特點都有所重疊,很像一個家庭中的成員或是繩子的每一股,每一股都沒有延續到整個繩子的長度。漫畫《布盧姆縣》中,企鵝奧普斯患暫時性失憶,當被告知它是一只鳥時,它不同意。它說,鳥的身材苗條,符合空氣動力學;而它不是。鳥能飛,它不能。鳥能歌唱,它唱的《昨天》令聽眾哄堂大笑。奧普斯懷疑它實際上是駝鹿布爾溫克。所以即使是“鳥”這樣的概念似乎也沒有圍繞必要和充分條件來組織,而是根據原型成員來界定的。如果你在字典里查“鳥”,例圖顯示的不是一只企鵝,而是小鳥喬伊——一只典型的麻雀。
認知心理學的實驗顯示,人們對于鳥、其他動物、蔬菜和工具都有刻板印象。人們對一種刻板印象達成共識,把它反映到一個類別中的所有成員上,比較對于那些不符規范的成員更為迅速地識別出這種刻板印象,甚至當見到的實際只是相似的例子時也宣稱其為那種刻板印象。這種反應取決于一個成員與其類別中其他成員之間相同特征的數量:像鳥的特征越多,就越屬于鳥類。從一個類別中呈現例子的自動協關器其實在做同樣的事情,因為它是在計算特征之間的相關性。所以有理由相信,人的一部分記憶是由一些像自動協關器的東西所連接的。
但心智一定還有比這更多的東西。人們并不總是模糊的。我們笑話奧普斯是因為我們的一部分知道它確實是一只鳥。我們或許同意奶奶的原型是這樣的——好心的、灰白頭發的、分發藍莓松餅或雞湯的七八十歲的老人(依我們所談論的各人的刻板印象而定)——但同時我們完全明白蒂娜·特納和伊麗莎白·泰勒也是奶奶(實際上泰勒還是個猶太奶奶)。說到單身漢,許多人——諸如移民官員、太平紳士,還有保健官僚們——因其對于誰屬于某個類別毫不含糊而臭名昭著;眾所周知,很多事情因一頁紙而有天壤之別。毫不含糊的思維例子隨處可見。法官可以根據技術理由而釋放一個顯然有罪的嫌疑人。酒吧服務員拒絕向一個能夠對自己行為負責的人提供啤酒,因其尚未過21歲生日。我們開玩笑說,你不能有點兒懷孕或是有點兒結婚;加拿大的一個調查報告稱,已婚女性每周做愛1.57次后,卡通畫家泰瑞·莫舍畫了一個女人坐在床上,挨著她昏睡的丈夫嘟囔:“唉,這算0.57次。”
事實上,模糊版和清晰版的相同類別可以相安無事地共處于一個腦中。心理學家莎朗·阿姆斯特朗(Sharon Armstrong)、亨利·格雷特曼(Henry Gleitman)和麗拉·格雷特曼(Lila Gleitman)在給大學學生做模糊類別的標準測試時,問他們關于像“奇數”和“女性”這樣有明確定義的類別。被試們愉快地接受了一些愚蠢的陳述,比如,13是比23更好的一個奇數的例子,以及母親是比戲劇女演員更好的一個女性的例子。過了一會兒,被試們卻又斷言,一個數要么是奇數要么是偶數,一個人要么是男人要么是女人,沒有中間地帶。
人們用兩種方式來思維。世界上的東西總是傾向于扎堆兒,人們因此不假思索地吸取了各個特征的相關性,從而形成了模糊的刻板印象。但人們也能創造系統規則——直覺理論——根據適用的規則來界定類別,并依據規則一視同仁地對待類別中的所有成員。所有的文化都有正式的親緣規則系統,這種規則系統非常精確,甚至往往能夠證明其中的定理。我們自己的親緣系統為我們給出了清晰版本的“奶奶”或“姥姥”:父母一方的母親,讓松餅見鬼去吧。法律、算術、大眾科學以及社會慣例(用其生命階段的儀式清晰地將成人與孩童,丈夫與單身漢區分開來)是其他的一些規則系統,世界各地的人們用這些規則系統做出評斷。一門語言中的語法是另一種規則系統。
規則系統使我們從單純的相似性中升華出來,根據解釋來得出結論。欣頓、魯梅爾哈特和麥克蘭德寫道:“人們善于歸納新獲得的知識。例如,如果你得知黑猩猩喜歡吃洋蔥,很可能會提高你對大猩猩喜歡吃洋蔥的預測的概率。在一個使用分布式表征的網絡中,這種概括歸納是自動的。”他們的夸口其實是休謨言論在20世紀的回響,休謨曾說,人們看到色彩和外形都像面包的一個東西,會指望能從中得到類似的營養。但在任何一個人熟悉的領域,這個假設都會土崩瓦解。當然,愛吃洋蔥的大猩猩只是一個刻意的例子,但有趣的是,即使是這么一個簡單的例子也低估了我們。我知道一些動物學知識,不過對大猩猩不甚了解,但我絕不會提高我對大猩猩喜歡吃洋蔥的預測概率。動物能夠被交叉分類。它們可以根據家譜和相似性分作不同的類群,如猩猩類,但也可以根據獲取食物的專有特定方式分作不同的種群,如雜食動物、食草動物和肉食動物。知道這個原則令我做出如下推理:黑猩猩是雜食動物,它們吃洋蔥不奇怪;畢竟我們也是雜食動物,我們也吃洋蔥。但大猩猩是食草動物,它們整天大嚼野生芹菜、薊和其他植物。食草動物往往對它們賴以為食的植物種類十分挑剔,因為它們的消化系統最適合于化解某些種類植物的毒性而不是其他植物的毒性。一個極端的例子是考拉,它們只吃桉樹葉子。所以如果大猩猩不吃辛辣的洋蔥,我不會感到奇怪。根據我所想到的不同解釋系統,黑猩猩和大猩猩可以同屬于非常相似的種類,也可以像人和奶牛一樣差之千里。
在關聯論及其聯結漿糊的應用中,物體的表征方式(即作為一組特征)自動地委托系統以一種特定的方式來進行概括歸納(除非用專門提供的相反例子來訓練它不做這樣的歸納)。我所推銷的替代方案是,人們可以在心理上對各種物體予以符號化,而那些符號可以指向我們腦袋里配備的多個規則系統。在人工智能中,這項技術被稱為基于解釋的歸納;關聯論者的設計則被稱為基于相似性的歸納。我們的多規則系統包含知識的特點包括組成性、量化性、遞歸性命題,以及匯集這些命題而形成的關于特定范疇經歷的模塊或直覺理論,這些范疇包括親緣關系、直覺科學、直覺心理、數字、語言和法律。第5章我們將探討其中的一些范疇。
清晰的類別和多個規則系統有什么好處呢?在這個社會性世界中,當討價還價的雙方都指著一個邊界模糊類別,一個說某東西在里面,另一個說在外面,這時清晰類別和多個規則系統就可以對此做出評判。人生階段儀式、法定年齡、證書、許可證以及其他法律文件劃出了各方心理上都能明確的清楚界線,這些界線令所有人都知道其他任何人所占據的位置。類似地,全或無規則反對的是步步為營的戰術,在這種戰術下,人們盡量利用模糊的類別,為自身的利益一次又一次地發起邊界爭執。
規則和抽象類別也有助于處理自然界的事務。它們避開相似性,使我們能夠深入,探索出事物運行的隱含法則。因為它們在某種意義上是數字性的,它們使得表征更為穩定和精確。如果你從一盤模擬磁帶翻錄一連串模擬復制品,那么其質量會隨著被復制次數的增加而逐漸下降。但如果你制作一連串數字復制品,最后一個與第一個的質量會一樣好。與之類似,在推理鏈中清晰的符號表征,將符號逐一不落地復制到連續的思維中,形成了邏輯學家們所稱的一種詭辯法。
所有的烏鴉都是鴉。
所有的鴉都是鳥。
所有的鳥都是動物。
所有的動物都需要氧氣。
無論經驗多么貧乏,詭辯法都使思想者充滿信心地得出結論。例如,一個思想者得出結論認為烏鴉需要氧氣,即使沒有人會真這么做來看看會發生什么。即使他從來沒見證過任何一個剝奪動物氧氣的實驗,而只是聽到一位可信賴專家的陳述這個思想者仍會得出這個結論。但如果這個推導中的每一步都是模糊的或者概率性的,或者胡亂堆砌了前一步類別成員們的特征,那么稀泥就越和越亂了。上面這個陳述會像第N代的私販磁帶一樣充滿噪音、雜亂無章或是像糟糕的傳話游戲中的最后一聲低語那樣難以識別。各個文化中的人們都在進行長鏈式的推理,無法直接觀察這些推理所基于的連接是否真實。哲學家們常常指出,科學就是因為這種能力才成為可能。

就像許多圍繞心智的問題一樣,對關聯論的爭論往往被當作是先天稟賦與后天學習之間的爭論。這幾乎不可能想清楚。當然,在關聯論者的建模中,學習扮演著極其重要的角色。建模者往往在被我前面提到的那些問題所難住,不得不重新考量時,就會利用隱含層網絡的能力,學習一組輸入和輸出,然后將它們概括運用到新的、類似的情況。經過對通用隱含層網絡的辛苦培訓,人們有時可以令它做到近似正確的事。但英雄式的灌輸式培訓自身并不能成為聯結漿糊的救世主。這不是因為網絡天生結構太少和外部環境輸入太多,而是因為原始聯結漿糊的動力不足,所以網絡的構建往往必須用最差的組合:太多的天生結構結合太多的外部環境輸入。
例如,欣頓修改了一個三層網絡來計算家庭關系。他本意是想用來展示網絡是如何工作的,但其他的關聯論者都把它當作是一個真實的心理學理論。輸入層有為名字而設的單位,也有為關系而設的單位,比如“科林”和“母親”。輸出層有為與之相關人的名字而設的單位,如“維多利亞”。既然單位和聯結都是網絡的天生結構,就只有聯結權重是習得的了,如果我們確實認為網絡回應腦中的一個天生模塊,只是為了對誰以一定的方式與一個有名字的人有關系這類問題分別作答的話。這不是一個對一般性親緣關系進行推理的系統,因為知識被涂抹到了問題層和答案層之間的聯結權重上,而不是被儲存在能夠以不同提取方式獲得的數據庫中。所以,一旦問題略微變動一下,比如問兩個人是什么關系,或者問一個人家庭成員的姓名和關系時,知識就沒用了。在這個意義上,模型就有了太多的天生結構,成了為某個特定測驗量身定制的了。
在培訓了其模型在一個小規模自制家庭中的關系后,欣頓請大家注意,這個模型能概括歸納出新的幾對親屬關系。但仔細研究他的研究結果后,我們發現,這個網絡需要對可能的104對中的100對加以學習,才能夠概括歸納出剩余的4對。而培訓過程中這100對的每一對都需要被注入網絡達1 500次之多(培訓課程共計150 000次)!很顯然,孩子們學習家庭親屬關系的方式肯定與此大相徑庭。這個數字對于關聯論者的網絡來說比較普通,因為它們并不用規則的方式來獲得解決方案,而是需要將絕大多數例子生敲硬塞進網絡,并只在例子之間進行插補。每種大體不同的例子都必須列入培訓的內容,否則網絡就會胡亂插補,就像統計學家們講述的獵鴨故事一樣:一人射得高了一米,第二個射得低了一米,第三個大聲喊:“我射中它了!”
為什么要把聯結漿糊放到強光下這么審視呢?當然不是因為我認為神經網絡建模不重要——恰恰相反!若沒有它,我對于心智如何運作的整個理論體系將像空中樓閣一樣搖搖欲墜。也不是因為我認為這種網絡建模只是將構建“小幽靈(后臺程序)”和數據結構的工作從神經硬件工作中外包了出去。許多關聯主義者模型為心智運算的最簡單步驟所能取得的成就提供了意外的洞見。但我確實認為關聯主義論調過于泛濫了。因為網絡被宣傳為柔性的、平行的、類推的、生物性的以及連續的,所以它們得到了討喜的內涵和廣泛的擁躉。但神經網絡并不創造奇跡,它們不過是在執行一些邏輯和統計運算。選擇輸入表征、網絡數量、每個網絡的聯線方式,以及數據路徑和連接這些路徑的控制結構,比起聯結漿糊組件的通用能量來說,神經網絡更多地解釋了怎樣令一個系統變得智慧。
但我的主要意圖不是為了證明某種模型不行,而是為了展示心智能夠做什么。本章的目的是給您一個粗略的認識,我們的心智是由什么做成的。思維與思考不再是“小幽靈(后臺程序)”般的謎團,而是可以研究的物理過程,在解釋思維與思考時,不同理論的優點、缺點可以被檢驗和辯論。我覺得,這尤其說明了古老的關聯學說的缺陷,因為它們昭示了我們日常思考的精確性、微妙性、復雜性和開放性。人類思維的計算能力有著真實的后果。它被很好地用于我們對于愛、正義、創造性、文學、音樂、親緣關系、法律、科學以及其他一些活動的能力,這些我們在后面幾章將要繼續探討。但在這之前,我們還必須回到在本章開篇時提到的另一個問題。