- 行為慣性
- (美)拉塞爾·波德拉克
- 12字
- 2022-07-07 15:00:01
第一部分
大腦中的慣性機器
第一章 學習、記憶和習慣
我們的思想和行為表現得十分流暢,以至于很難想象它們是由我們腦袋里像果凍一樣的組織中嘈雜的電活動引起的,然而事實就是如此。大腦的復雜性遠遠超出我們的想象,一般人可能不知道,許多神經科學家對人類能否完全了解大腦的工作原理是感到絕望的。即便如此,從大腦細胞如何處理信息開始,我們對于大腦的基本要素還是有了很多的了解。
人類大腦是由數以億計的神經細胞構成的,其中,神經元負責處理信息。此外還有許多支持細胞,稱為神經膠質(glia)細胞。神經元將電信號從一端傳送到另一端,然后釋放出化學信號,影響鄰近神經元的電活動。神經元胞體產生的信號通過一個叫作軸突(axon)的線狀結構傳遞到另一端,在那里釋放一種叫作神經遞質的化學物質。正是這種電信號和化學信號的結合,以及確定神經元如何進行連接的大腦構造,決定了我們所做的一切。
舉個例子,講講當我的貓Coco看到窗外的一只鳥時,它的大腦里發生了什么。鳥反射的光投到Coco的視網膜上,那里有專門的感光神經元;當光子擊中位于細胞表面(細胞膜)的特殊受體分子時,細胞的電學特性發生了變化,光能量轉化成了電信號。這個電信號稱為動作電位,它沿著神經纖維傳導。這些感光神經元與視網膜中的其他神經元接觸,動作電位導致化學信號的釋放,從而使傳導鏈中的下一個神經元激活或失活。這些信號通過眼內的幾層神經元傳播,最終通過一條神經(由許多軸突組成的線纜)到達大腦。信號首先抵達大腦深處一個叫作丘腦的結構,你可以把它想象成大腦的總機——幾乎所有進入大腦的信號都要經過丘腦傳入。信號從丘腦傳遞到大腦的外表面,即大腦皮質,大腦中很多高級信息加工都是在這里進行的。大腦皮質的不同部位接收不同類型的信息;在Coco的例子里,視覺信息傳遞到大腦后部一個稱為視覺皮質的區域,接著層層向前移動。在每個階段,信息處理都會變得更加復雜一些。在接受丘腦傳入信號的視覺皮質中,特定的神經元只對視覺世界的一小部分信號敏感,對相對簡單的特征敏感,如輪廓或線條。這些區域將視覺信號向大腦前部傳遞,后者對信號中復雜的特征更加敏感,如形態或整個物體。在某一時刻,這些信號讓Coco能夠識別視覺刺激中的形態是一只鳥,并將信號發送到大腦中負責處理情緒的部分,從而釋放神經化學物質,讓它感到興奮和激動。其中一些信號還會導致運動皮質的活動,使得它跑向門口,發出一些奇怪的聲音。
在整本書中,我會更詳細地探討大腦功能如何導致我們的各種想法和行為,其中的很多細節對于我們理解習慣如何形成,以及為什么它們會持續影響我們是至關重要的。
習慣與有意記憶
無論是在執行習慣的過程中,還是在隨后對它們進行回憶時,習慣與我們對過去事件的有意記憶都是完全分離的,這是習慣的一個顯著特征。以我們離家時鎖門的習慣為例:一旦我們學會了鎖門,就不會再去想怎么鎖門,或者試圖去回憶曾經鎖門的情景;我們只是不假思索地去做,就像所有習慣一樣。如果我問你鎖門的時候你是朝哪個方向擰鑰匙的,你可以很形象地描述這個過程,告訴我是沿順時針方向轉動,然而,平時在鎖門的時候,你從來不會去想“現在,我需要順時針轉動鑰匙了”。反過來說,有多少次你離開了家,后來卻想不起自己是否鎖了門。通常情況下,習慣系統是值得信賴的,它會確保門被鎖上,但它往往不會給我們留下什么經驗的痕跡。
對于那些因大腦損傷而失去記憶的人來說,習慣和意識體驗之間的區別尤其明顯。有一個著名的例子來自法國神經學家艾德華·克拉帕雷德(édouard Claparède)的研究。當他與一名記憶障礙患者見面并握手時,他用事先藏在手里的大頭針扎了一下她的手。幾分鐘后,她已經不記得自己被大頭針扎過了,但當克拉帕雷德再次和她握手時,她卻沒有把手伸出來。他問她為什么拒絕了握手,她說:“有時人們手里會藏著大頭針。”克拉帕雷德的患者顯然保留了一些被針扎的體驗,盡管她并非有意識地記住具體的情節。基于這類奇聞逸事,始于20世紀60年代的大量神經科學研究已經確立了這樣一個觀點,即大腦里存在多重記憶系統。最主要的區別存在于這兩個記憶系統中:一個允許我們有意識地記住過去的事件(比如,記住早上你把車停在了哪里),一個不涉及對過去事件的有意記憶(包括習慣和技能,比如如何開車)。
有意記憶系統
對過去事件的有意回憶尤其依賴于陳述性記憶系統,它涉及位于顳葉深處的一組大腦區域(稱為內側顳葉),包括海馬體及其周邊的大腦皮質部分(見圖1.1)。這些區域的損傷會導致人喪失對過去事件的記憶以及無法形成新的記憶。事實上,海馬體只要受到輕微損傷就會導致這種記憶障礙。研究者拉里·斯奎爾(Larry Squire)及其同事通過研究一位姓名縮寫為R. B.的男子的大腦證明了這一點。R. B.經歷過幾次心臟事件,導致大腦暫時缺氧,從而出現了嚴重的記憶問題。他還活著的時候,斯奎爾和同事用多種方法測試了他的記憶,發現他的記憶有諸多方面的問題。R.B.智力完好——事實上,他的智商有111分,高于平均水平。然而他對新材料的記憶能力受到了嚴重的損傷。例如,當向他呈現一篇散文時,他可以在讀完以后立即將故事中的細節復述出來,但20分鐘后,他就幾乎無法再記起任何細節了。R. B.能夠清楚地意識到自己的記憶問題,就像斯奎爾及其同事所描述的那樣,“他解釋說,對于過去發生了什么事,他需要反復向他的妻子詢問。如果某天他和孩子通過電話,第二天他就什么也想不起來了”。1

圖1.1 這是我大腦的磁共振成像(MRI)掃描圖,它呈現了陳述性記憶系統的解剖結構,圖中標明了海馬體(包括CA1區)、內側顳葉和丘腦的相對位置。右上方的小圖顯示了這個切面在我腦部的大致位置,就在耳朵前面。
R. B.去世時捐出了自己的大腦用于科學研究,這樣一來,斯奎爾和同事就能夠更詳細地觀察他的大腦是如何受損的。R.B.的大腦整體上看來很健康,但是當研究者使用顯微鏡觀察時,發現他的海馬體中一個叫作CA1的特定區域受到了損傷。大腦的這一微小區域中包含大約1600萬個神經元,聽起來似乎很多,但它們在人腦中的近1000億個神經元中只占了極小的一部分。盡管如此,這些神經元的損傷卻足以讓R. B.產生持久和嚴重的記憶問題,而他的其他認知功能卻保持完好。
從20世紀60年代開始,人們逐漸清楚地認識到,雖然海馬體損傷可能會導致個體想不起來過去發生的事,但不會影響他其他的學習能力。率先提出這一發現的是布倫達·米爾納(Brenda Milner)和蘇珊娜·科金(Suzanne Corkin),她們研究了一個名叫亨利·莫萊森(Henry Molaison)的人,更廣為人知的是他姓名的縮寫H. M.。H. M.曾患有嚴重的癲癇,當時沒有任何藥物可以治療,只能進行手術,但在接受了癲癇手術后,他開始變得健忘。外科醫生切除了他大腦兩側的大部分內側顳葉組織,這極大地減輕了他的癲癇癥狀,卻讓他無法記住手術前幾年間發生的事情,未來也不能形成新的記憶。與此同時,科金和她的同事通過與H. M.互動發現,他學習其他事物的能力保留得出奇地好。在《永遠的現在時:失憶癥患者H.M.留給后世的禮物》(Permanent Present Tense: The Unforgettable Life of the Amnesic Patient H.M.)一書中,科金探討了H. M.是如何學習新的運動技能的,比如,他在1986年進行髖關節置換手術后學習使用助行器,而且經過練習,他能夠學會并正確地使用它。雖然他不能確切地記住自己為什么需要助行器,但當他被問到為什么需要助行器時,他能簡單地回答“這樣我就不會摔倒了”。
在20世紀50年代及60年代進行的一系列研究中,米爾納和科金廣泛測查了H. M.的學習能力。她們發現,盡管他仍然不能有意識地回憶過去,但他能夠很好地學習一些運動技能,并在很長一段時間內保持這些技能。這些針對H. M.的早期研究為后來幾十年中的一系列研究奠定了基礎,也促使科金隨后對遺忘癥患者的學習能力進行了更深入的探索。科金的一個主要研究發現是,遺忘癥患者不僅可以學習新的運動技能,還可以學習新的感知和認知技能。我的博士生導師尼爾·科恩(Neal Cohen),早年與拉里·斯奎爾一同在加州大學圣地亞哥分校做研究,他們提供了一個非常引人注目的研究例證。在這項具有里程碑意義的研究中,他們考察了個體學習閱讀鏡像文字的能力,這是一種感知技能(見圖1.2)。2加拿大心理學家保羅·科勒斯(Paul Kolers)在20世紀70年代開展的研究表明,通過練習,人們閱讀鏡像顛倒文字的速度會越來越快,準確率也會越來越高,而且他們一旦掌握了這種閱讀技能,此能力會持續至少一年。在科恩和斯奎爾的研究中,他們將不常用的單詞以3個一組的方式鏡像呈現給受試者,并測試受試者大聲朗讀這些單詞所花的時間。他們測試了3組因不同原因導致遺忘癥的受試者,其中一組遺忘的成因堪稱恐怖,斯奎爾等在后來的一篇論文中對此做了描述。3一個姓名縮寫為N. A.的患者,他在美國空軍服役期間的一次意外中被一把小型銼刀刺中了腦袋。斯奎爾及其同事對他進行了MRI成像檢查,發現銼刀損傷了他的丘腦,而丘腦對記憶來說是很重要的腦區,因為它與海馬體有著緊密的聯系。另一組受試者患有柯薩科夫綜合征,這是一種長期酗酒的人因缺乏硫胺素(維生素B1)而引起的大腦失調病癥,它也會導致丘腦損傷。第三組是一些因慢性抑郁而接受電休克治療的人,這種治療結束后,也會引起一段時間的遺忘癥狀。

圖1.2 一個鏡像文本的例子。試著在最短的時間內從右往左大聲讀出這幾個單詞。
科恩和斯奎爾首先需要確定這些人確實是有遺忘癥狀的。為此,他們向每個受試者呈現兩兩配對的10對單詞,接著對他們進行測試,測試時只給他們呈現配對中的第一個單詞,并讓他們回憶另一個單詞是什么。當完整地看完這10對單詞3遍以后,健康的受試者平均能回憶起8~9個單詞。相比之下,遺忘癥患者只能回憶起兩個,這說明相較于健康受試者,他們的有意記憶能力嚴重受損。為了測試他們學習鏡像閱讀技能的能力,科恩和斯奎爾讓受試者在3天時間里練習閱讀鏡像顛倒的單詞。大約3個月后,他們又對這些人進行了測試,看他們的技能保持得如何。結果顯示:遺忘癥患者在學習如何閱讀鏡像文本上不存在問題,他們的閱讀反應和健康對照組差不多。在3個月后的測試中,遺忘癥患者依然很好地保持了這項能力,沒有表現出技能的喪失,事實上,他們還能夠在任務中繼續進步。這些結果有力地證明了,即使患者患有遺忘癥,也沒有影響學習能力。同時,研究結果也清楚地表明了,海馬體及其相關的大腦系統并不是學習新技能所必需的。那么問題來了:如果不是海馬體,大腦中對習慣和技能至關重要的系統是什么呢?
爬行動物大腦進化的殘留
如果上網搜索“蜥蜴腦”(lizard brain),你會發現,它似乎是許多人類深層次問題的根源,搜索結果如:
· 你那2億歲的蜥蜴腦是如何拖你后腿的
· 不要聽信你的蜥蜴腦
· 如何打敗你的蜥蜴腦
· 讓蜥蜴腦安靜下來
……
神經學家保羅·麥克林(Paul MacLean)認為,行為的慣性源自爬行動物大腦的進化殘留,這一觀點最近逐漸流行起來。麥克林在美國國立精神衛生研究院建立了準自然實驗室,并花了幾十年時間(從20世紀60年代到90年代)在那里研究蜥蜴的大腦和行為。麥克林對哺乳動物的大腦是如何從2億多年前的爬行動物大腦進化而來的很感興趣。由于哺乳動物的祖先——類似蜥蜴的生物(獸孔目動物)如今已不復存在,因此麥克林將目光投向了它們現存的近親:蜥蜴。根據他的描述,我們會看到藍刺蜥蜴在日常生活中擁有極其習慣化的行為,而我們人類又何嘗不是如此:
每天清晨,當藍刺蜥蜴從實驗場中的藏身處冒出來時,它都會慢慢地、小心翼翼地向前挪動身體,那樣子就像可能會隨時被捕食者抓住似的。它繼續往前,來到一個它偏愛的曬太陽的地點,在那里,它擺出一個能夠讓自己最大限度從人造陽光中吸收熱量的姿勢。一旦身體熱起來,達到一個最適宜的溫度后,它的下一個動作就是在曬太陽處附近的一個固定的地方排泄。換句話說,與其他哺乳動物一樣,它有一個固定的排便點……排便后,它開始朝著最喜歡的休憩處前進,中途或許會停下來喝點兒水……到達休憩處后,它會做一下簡短的特征展示,然后用一種悠閑的姿勢,在這片區域內搜尋移動的獵物。它的樣子看起來與釣魚者等魚上鉤的樣子頗有幾分相似……在一段固定的等待獵物的階段之后,它會進入一段不活動的午后時光……隨著一天的結束,雌性藍刺蜥蜴開始回到藏身處它最喜歡的地方,接著閉上眼睛,慢慢安靜下來,把頭埋進一個縫隙里過夜。雄性藍刺蜥蜴最終也會這樣做,但它們通常需要再曬一會兒太陽,占統治地位的那一只比其他蜥蜴吸收熱量的時間更長。4
麥克林基于自己的研究,提出了“三重腦”的觀點,把大腦分成了3個主要部分。“爬蟲腦”由大腦深處的一些區域組成,這些區域存在于所有的脊椎動物中,包括腦干和基底神經節。麥克林強調了爬蟲腦的日常行為和習慣,以及求偶時的鳴叫、展示支配或服從等活動中的作用。麥克林認為,“邊緣系統”對哺乳動物而言是一套新結構,它與情感體驗有關。“新哺乳類腦”指的是哺乳動物大腦皮質中最發達的部分,它的體積會隨著哺乳動物的進化而增大。
當闡述“爬蟲腦”在習慣或日常行為中的作用時,麥克林尤其關注基底神經節,為他帶來啟發的是那些對亨廷頓病患者的研究發現。亨廷頓病是一種遺傳模式非常簡單的遺傳疾病:如果父母中有一方患有這種疾病,那么孩子有50%的概率遺傳導致該病的基因突變。這種突變是非常強大的——任何有這種突變的人,在他們的一生中一定會發展成這種疾病,通常發病年齡在50歲左右。亨廷頓病最明顯的癥狀是無法控制自己的動作,從而導致四肢抽搐、行走不協調,也會伴有精神癥狀,如精神異常、易怒、抑郁等。亨廷頓病的大腦紊亂是由于一種叫作亨廷頓蛋白的蛋白質在結構上發生了基因突變,這一病癥就是因這種蛋白質而得名的。亨廷頓蛋白存在于全身的細胞中,但在大腦的某些部位尤其常見,特別是基底神經節內的神經元中。亨廷頓病的基因突變導致細胞產生亨廷頓蛋白的變異體,這種突變蛋白會使細胞功能異常或過早死亡。
這種疾病最終會攻擊大腦的大部分區域,其最早的信號就出現在基底神經節中。事實上,在一項對攜帶亨廷頓病突變基因的年輕人進行的腦成像研究中,在這些預計10多年后才會出現亨廷頓病明顯癥狀的人中,其基底神經節的變化跡象當時就已非常明顯了。5
為了確立亨廷頓病與喪失習慣和日常行為之間的關系,麥克林用了埃里克·凱恩(Eric Caine)等于1978年發表的研究作為證據。6例如,一個患有此病的人抱怨說,雖然她知道準備一頓感恩節晚餐所需的所有步驟,但她無法像過去那樣做出來;她對如何按順序執行每個步驟感到困惑。雖然這篇論文的作者從“組織、計劃和排序方面存在困難”的角度來看待患者的這些抱怨,但麥克林卻將其解讀為:喪失了從事慣性行為的能力。
這類例子雖然具有啟發性,但并沒有直接表明亨廷頓病患者在學習新習慣方面存在問題。受科恩和斯奎爾研究的啟發,加州大學圣地亞哥分校的另一組研究人員首次通過實驗,測試了亨廷頓病患者學習新技能的能力。由于技能與習慣之間存在緊密聯系,因此被試者的這種能力是否受損是可以預測的。瑪麗安娜·馬爾托內(Maryanne Marton)等使用了與科恩和斯奎爾相同的鏡像閱讀任務,除了測試患有柯薩科夫綜合征的人,他們還測試了亨廷頓病患者。7在鏡像閱讀任務中,他們發現這柯薩科夫綜合征受試者和亨廷頓病受試者表現出了幾乎相反的缺陷模式。柯薩科夫綜合征受試者的表現與科恩和斯奎爾研究中的同類受試者表現相似,他們學習鏡像閱讀技能的能力相對正常,但很難記住任務中出現的單詞。相反,亨廷頓病患者的單詞記憶能力相對正常,雖然他們通過練習也能在鏡像閱讀任務中有點兒收獲,但與柯薩科夫綜合征受試者或控制組受試者相比,他們的技能學習能力要弱得多。這種情況就是我們所說的“雙重分離”(double dissociation),即兩組不同受試者在兩項不同的任務中表現出相反的正常或受損模式。這種分離狀態充分證明了不同任務(鏡像閱讀和記憶)依賴于不同的大腦系統,這項研究也首次揭示了基底神經節病變的人在技能學習方面存在缺陷。
有趣的是,盡管麥克林關于基底神經節在慣性行為中扮演了重要角色這一觀點經受住了時間的考驗,但他關于人類大腦有一部分具有“爬行動物”特點的觀點,卻在很大程度上遭到了神經科學家的反對。后續的研究比較了許多不同脊椎動物(從爬行動物類到鳥類再到哺乳類)的大腦解剖結構,發現它們的大腦構造總體上是非常相似的。8即使是現存最古老的脊椎動物七鰓鰻,也有與哺乳動物類似的大腦結構。
從整體結構上看,爬行動物與人類在大腦結構上并沒有本質區別,人腦只是包含更多的組織,以更復雜的方式集合起來。不過,正是這種發展,尤其是前額葉皮質的發展,使人類能夠超越其他物種。
大腦里的“中央交換機”
在人類大腦深處有一系列神經核群(成束的細胞集合),稱為基底神經節。人類的基底神經節由幾個獨立的區域組成,包括尾狀核、殼核、伏隔核(合稱為紋狀體),以及蒼白球(包括內側部和外側部兩部分)和丘腦底核,(見圖1.3)。此外,黑質和腹側被蓋區也被認為是基底神經節的一部分,兩者都含有能夠釋放多巴胺的神經元。雖然這些區域分布在大腦中部的不同位置,但它們之間能夠通過特定的方式緊密相連。

圖1.3 (左)基底神經節不同部位在大腦皮質側面圖中的相對位置。(右)紋狀體不同部位的位置,包括尾狀核(C)、殼核(P)和伏隔核(NA)。
大量連接從大腦皮質神經元通往基底神經節,與紋狀體區域產生聯系。重要的是,紋狀體的各個部分接收來自大腦皮質不同區域的傳入信號:殼核接收來自運動和感覺區的輸入,尾狀核接收來自前額葉皮質和涉及視覺的顳葉區的輸入,伏隔核接收來自處理獎賞和情感的額葉區(以及其他皮質下的區域,如杏仁核)的輸入。正是由于這些不同的連接決定了各個部分的功能——伏隔核在成癮中起著核心作用,而殼核在日常行為中扮演了重要角色。
當來自皮質的傳入信號到達紋狀體時,它通常與一組特定的神經元相連,這組神經元在顯微鏡下呈多刺狀,而被稱為中型多棘神經元(medium spiny neurons)。從這里開始,信號通過基底神經節有兩條通路:一條直接通路,一條間接通路。直接通路從紋狀體開始,最終到達蒼白球,更具體地說,是到達蒼白球內部;間接通路是經過基底神經節的一個更迂回的線路,信號從這里傳送到丘腦,然后傳送回大腦皮質,通常會到達一個接近信號傳入起始點的區域。因此,我們把這兩種循環叫作皮質紋狀體環路(corticostriatal loops)(見圖1.4)。

圖1.4 基底神經節環路圖,顯示了直接通路(左)和間接通路(右)。興奮性連接用箭頭和加號表示;抑制性連接用圓頭和負號表示。直接途徑有兩個抑制步驟,最終導致大腦皮質興奮;間接途徑還多了一個抑制步驟,從蒼白球外部到丘腦底核,最終導致蒼白球內部的興奮和大腦皮質的抑制。
讓我們看看當信號經過直接通路時發生了什么。為了更清楚地理解這一點,我們需要知道,神經元的區別在于它們對相連的神經元所產生的影響:興奮性神經元使目標神經元的活動增加,而抑制性神經元使目標神經元的活動減少。稍后我們還將討論第三類神經元,它們對其他神經元的反應具有調節作用。
當大腦皮質中的一個神經元向紋狀體發送一個傳入信號時,它會導致接收這個傳入信號的中型多棘神經元更加活躍,這是因為皮質中的神經元是興奮性的。事實上,幾乎所有從大腦的一個區域向另一個區域發送信號的神經元都是興奮性的。紋狀體中接收傳入信號的中型多棘神經元是抑制性的,這意味著當它們放電時,會導致蒼白球中的目標神經元活動減少。蒼白球中的神經元也是抑制性的,當它們放電時,會抑制丘腦中目標神經元的活動。在動物休息時,蒼白球中的神經元會以每秒60~80次的速度放電9,這種持續(或“緊張性”)抑制使丘腦中的神經元大部分時候都保持沉默,這樣它們就不能使大腦皮質中位于環路末端的目標神經元興奮。注意這里發生了什么:我們有兩個連續的抑制性神經元,這意味著第一個神經元(紋狀體中的中型多棘神經元)傳入的信號將減少第二個神經元(位于蒼白球中)的持續抑制,最終導致丘腦和大腦皮質興奮。這就好比把兩個負數相乘,得到一個正數。因此,直接通路的刺激作用是通過讓環路末端的皮質產生興奮活動從而引發一個行為或想法。
基底神經節間接通路的作用正好相反——通過抑制大腦皮質中位于環路末端的神經元,從而停止了行為和想法。間接通路的起始階段與直接通路非常相似,有一個從紋狀體到蒼白球的連接,但連接點在蒼白球的外部。接著,蒼白球向外發送抑制信號到一個叫作丘腦底核(STN)的區域。丘腦底核向蒼白球內部發送一個興奮性輸出,這與直接通路中第二個抑制階段類似。當這個抑制階段開啟以后,丘腦底核活動所產生的作用就會是抑制丘腦和大腦皮質的整體活動。這樣一來,通過在環路中增加一個步驟,間接通路中的活動就產生了抑制行為和思想的作用。
從大腦皮質傳入紋狀體的信號是如何知道該走哪條通路的呢?事實證明,紋狀體中不同組的中型多棘神經元會將信號傳遞到直接通路或間接通路,而這兩組神經元的主要區別之一與人人都喜愛的一種神經化學物質有關:多巴胺。
復雜的多巴胺
多巴胺似乎無處不在。科學記者貝瑟尼·布魯克夏爾(Bethany Brookshire)在2013年的一篇博客文章中完美地捕捉到了這一點:
人們喜歡描述大腦中“充斥著化學物質”,但有一種化學物質——多巴胺,似乎總能脫穎而出。它是我們所有罪惡行為和秘密欲望背后的分子:多巴胺是愛,多巴胺是欲望,多巴胺是婚外情,多巴胺是動機,多巴胺是注意力,多巴胺是女性主義,多巴胺是上癮。
天啊,多巴胺太忙了。
你一定在大眾媒體中讀到過“多巴胺”這個詞,事實上,這是一種最受喜愛的神經遞質,在媒體中它常常被描繪成一種“快樂激素”。多巴胺似乎與任何事物都有關系,從愛到成癮,但這其實是很多人對多巴胺在大腦中扮演的許多復雜角色的誤讀。
首先,讓我們來看看多巴胺從何而來,它的作用是什么。大腦中絕大多數的多巴胺都產生于大腦深處的兩個小核團:黑質(更具體地說,產生于這個區域中一個叫作致密部的部分)和腹側被蓋區(見圖1.5)。10這些神經元向大腦的大部分區域發送投射,但對基底神經節的投射尤其強烈。大腦中多巴胺能神經元的數量很少——人腦中大約只有60萬個多巴胺能神經元11,但它們卻影響著我們思想和行為的幾乎所有方面。多巴胺是一種神經調節遞質,它不會直接引起受其影響的神經元的興奮或抑制。它的作用是調節信息傳遞的效率,增強或削弱神經遞質的效應,就像吉他擴音器上的音量旋鈕,其作用是調節吉他發出的聲音對揚聲器音量的影響。此外,大腦會因經驗而發生變化(神經學家稱之為可塑性),我們將會看到,多巴胺在這個過程中也起著關鍵作用。

圖1.5 產生多巴胺的神經元位于大腦深處,位于黑質致密部(SNc)和腹側被蓋區(VTA)內。這些神經元將輸出信號廣泛傳送到整個大腦,其中很大一部分傳送到了紋狀體。(圖片由阿里亞斯-卡里翁等提供)
多巴胺的另一個復雜之處在于神經元上存在不同類型的多巴胺受體。其中一些受體會增強神經元的興奮性(類似于調高音量),另一些受體會減弱神經元的興奮性(類似于調低音量)。單個神經元傾向于表達(產生受體并將它們置于細胞表面)這兩種多巴胺受體中的一種。對直接及間接通路中中型多棘神經元的研究表明,直接通路中的神經元主要是增強興奮性多巴胺受體,而間接通路中的神經元主要減弱興奮性多巴胺受體。多年來,這一區別一直備受爭議,但一套新的神經科學技術——光遺傳學(optogenetics),為這一區別提供了強有力的證據。
加州大學舊金山分校的亞歷克塞·克拉維茲(Alexxai Kravitz)和阿納托爾·克里澤(Anatol Kreitzer)進行了一項里程碑式的研究,他們測試了不同類型的多巴胺受體在基底神經節通路中的定位,方法就是用光遺傳學技術來激活小鼠紋狀體神經元,這些紋狀體神經元表達了增強或抑制。他們還研究了這種激活對小鼠行為的影響。12表達增強受體的紋狀體神經元位于直接通路中,因此,激活它們應該會使小鼠的活動增多。當克拉維茲和克里澤激活表達增強受體的神經元時,他們發現小鼠在籠子里走動的時間更多,而靜止不動的時間更少,這與這些神經元驅動大腦皮質活動增強的觀點是一致的。當他們激活表達抑制受體的神經元時,情況正好相反——小鼠待在原地的時間更長,而在籠子里走動的時間則更少。這樣的結果進一步證實了不同類型的神經元具有不同的作用,有的會導致行為的發生,有的會阻止行為的發生。
有了這些背景知識,我們現在就可以理解為什么亨廷頓病會導致出現動作不受控的癥狀。由于一些原因,亨廷頓病對間接通路神經元的影響遠早于對直接通路的損害。在健康的大腦中,動作會受到間接通路的抑制,而在亨廷頓病患者的大腦中,這一通路受到了破壞,平衡被打亂,而這對直接通路是有利的,因此會導致動作不受控制。再來看一下帕金森病的情況,這是一種比亨廷頓病更常見的神經系統疾病。帕金森病在某些方面表現出與亨廷頓病相反的癥狀:動作遲緩、姿勢僵硬和震顫。帕金森病的主要致病原因是黑質多巴胺能神經元的變性死亡。這些神經元的死亡導致了大腦中多巴胺的缺乏,而多巴胺會抑制間接通路中表達抑制受體的神經元的活動,因此,多巴胺缺乏導致了間接通路的活動增加。相反,由于多巴胺會增加直接通路中增強受體神經元的活動,因此,多巴胺缺乏就導致了直接通路的活動減少。這就表明,為了實現健康的大腦功能,這兩個通路的活動必須達到一個平衡狀態。
可塑的大腦
多巴胺在大腦中還有許多不同的作用,其中之一是它在習慣形成過程中所起的核心作用——調節大腦中變化的基本機制,即突觸可塑性(synaptic plasticity)。為了理解突觸可塑性,讓我們來看看當一個神經元與另一個神經元交流時會發生什么。
假設皮質中有一個神經元將信息投射到紋狀體的一個中型多棘神經元上,皮質神經元會產生一個動作電位,導致興奮性神經遞質從位于軸突末端的小泡中釋放出來,軸突末端與紋狀體中的神經元相連。這些神經遞質分子會被釋放到一個位于軸突與紋狀體中目標神經元之間的開放空間中,這個開放空間稱為突觸(synapse)。釋放后,神經遞質分子漂浮在突觸的間隙中,其中一些分子與突觸另一端神經元表面的受體接觸。當這種情況發生時,它們會引起神經元的電變化,最終導致目標神經元產生自己的動作電位。重要的是,有許多不同的原因可以解釋為什么一些特定的神經元在引發動作電位時會比其他神經元的影響更大:可能因為它們能釋放更多的神經遞質,也可能因為它們有更多的突觸,或者它們有更大的突觸等。此外,還有一種可能性是下游神經元的表面有更多的受體。突觸可塑性是指經驗使突觸強度發生變化的過程,一些神經元在激活其他神經元時相應地變得更強或更弱。這種可塑性被認為是學習的關鍵。13
多巴胺并不直接導致突觸可塑性,但它在調節可塑性方面起著關鍵作用,稱為三因素規則(three-factor rule)(見圖1.6)。可塑性最常見的一種形式是當一個神經元快速連續地引起另一個神經元放電,其突觸傳遞效能就增強了。這種以神經科學家唐納德·赫布(Donald Hebb)的名字命名的赫布可塑性(Hebbian plasticity),通常被描述為“一起放電的神經元連接在一起”。在大腦的某些區域,包括紋狀體,這一概念有略微修改,以滿足三因素規則:“在多巴胺的存在下,一起放電的神經元連接在一起;在沒有多巴胺存在時,一起放電的神經元會斷開連接。”這3個因素是:傳入神經元的放電,隨后目標神經元放電,以及多巴胺的存在。在這種方式下,多巴胺就像是一扇通向新行為(包括習慣)發展的大門。

圖1.6 三因素可塑性規則示意圖。在該圖中,多巴胺調節紋狀體中的突觸可塑性。皮質神經元釋放谷氨酸(G),導致紋狀體神經元放電。突觸的變化取決于多巴胺(D)是否存在;如果多巴胺存在(右圖),那么突觸得到強化,如果多巴胺缺失(左圖),突觸則會弱化。
塑造“獎勵”的多巴胺
沃爾夫拉姆·舒爾茨(Wolfram Schultz)是一位德國神經科學家,他一直試圖理解多巴胺,他的工作成為解開多巴胺釋放之謎的關鍵。他的研究包括記錄猴子大腦中釋放多巴胺的神經元的活動,并嘗試理解它們放電的機制。長期以來,多巴胺都與獎勵聯系在一起。早前的研究表明,如果在大鼠大腦中放置一個電極,刺激多巴胺釋放,大鼠幾乎會做任何事來獲得這種刺激。舒爾茨早期對猴子進行的研究證實了,獎勵事件確實會引起猴子大腦中多巴胺能神經元的活動。然而,他注意到一個現象,這可能會顛覆我們對于多巴胺角色的認知。當猴子被給予一個意料之外的獎勵時,多巴胺能神經元就會放電。接著,舒爾茨測試了一種情境,即猴子在獲得獎勵之前首先接收到一個信號(一束閃光)。14在實驗剛開始時,猴子還不知道光束是獎勵之前會出現的東西,此時它的多巴胺能神經元不會放電,直到獎勵出現才會放電。然而,猴子一旦知道了光束出現后會有獎勵,多巴胺能神經元就會在光束出現后馬上開始放電,而在獎勵出現時則不放電。而且如果預期的獎勵在光束之后沒有出現,則多巴胺能神經元的活動就會下降到基線水平以下。這說明多巴胺能神經元并不是嚴格意義上的對獎勵敏感,而似乎是對世界與我們預期不一致的情況敏感,這一概念稱為獎勵預測誤差(reward prediction error)(見圖1.7)。

圖1.7 多巴胺能神經元獎勵預測誤差信號的演示。每張圖顯示了多巴胺能神經元在一段時間內的活動。上圖顯示了多巴胺能神經元對意外獎勵的反應(R)。中圖顯示了多巴胺能神經元對預期獎勵的“條件刺激”(CS)產生反應,而對預期獎勵本身缺乏反應。下圖顯示了當預期的獎勵沒有出現時,由于消極的預測誤差而導致的活動抑制。(改編自舒爾茨等)
這一發現至關重要,因為它有助于將多巴胺與計算機科學和心理學的一系列觀點聯系起來,促使我們用當今主流的計算框架來理解多巴胺的作用。在計算機科學領域,研究人員一直對如何構建經驗學習的系統感興趣。這一領域如今被稱為機器學習(machine learning),它是我們自身的許多自動化系統的基礎。機器學習中有一個領域叫作強化學習(reinforcement learning),大意是通過“嘗試-錯誤”的過程來進行學習的。強化學習理論的一個基本觀點是:學習應該基于我們的預期與我們的實際經歷結果的匹配程度。也就是說,這個世界和我們預期不一樣的地方,就是我們需要學習的地方。大多數強化學習理論認為,做決定者基于他所有可能采取的行動的預期價值來做出一個行為,隨后通過觀察結果(輸或贏),利用這一信息去更新下一輪的預期。重要的是,我們并不是利用輸或贏的絕對次數來更新預期,而是用預期和觀察結果之間的差異來更新預期。在舒爾茨等的研究中,這種差異就是多巴胺所代表的預測誤差信號。實驗證明:多巴胺可以通過強化學習的計算機科學來進行理解,這項研究提供了一個在大腦決策中非常有用的計算框架。
愛因斯坦曾開玩笑說,科學理論應該盡可能簡單,但不能過于簡單。就此而言,盡管獎勵預測誤差理論成功地解釋了多巴胺功能的許多方面,但它可能過于簡單化。伊拉娜·威滕(Ilana Witten)是普林斯頓大學的一位神經科學家,通過研究小鼠,她希望理解多巴胺功能的各種復雜細節,并且她也找到了可用于研究小鼠大腦的強大技術。為了記錄小鼠進行復雜行為過程中的多巴胺能神經元活動,威滕與另一位普林斯頓大學的教授大衛·湯克(David Tank)合作,開發了一種可用于小鼠的虛擬現實系統。在這個系統中,小鼠被置于一個小球上(有點兒像乒乓球),它的頭部用一個小型金屬頭盔固定,頭盔中不斷向小鼠播放沉浸式視頻,使它在小球上跑步。頭盔能夠很好地將頭部固定在適當位置,通過一種叫作鈣離子成像(calcium imaging)的技術,用一臺小顯微鏡就能在小鼠做各種行為時記錄下它的大腦神經元活動。這使得研究人員能夠確定多巴胺能系統中的神經元活動是如何與動物行為的許多不同方面相聯系的,而不僅限于獎勵預測誤差。
2019年,威滕發布的研究結果表明:多巴胺能神經元的活動方式比我們之前認為的要復雜得多。在一個十分簡單的游戲中,小鼠從一個虛擬走廊上跑下來,接著向左或向右跑到走廊盡頭。如果轉到了正確方向,就會喝到一口水(這對口渴的小鼠來說是一個相當大的獎勵),而如果轉到了錯誤的方向,就會聽到嗡嗡的蜂鳴聲,然后不得不原地等待2秒鐘。當小鼠在走廊上奔跑時,它會看到走廊兩邊有虛擬的“塔”,這給了它一個線索,暗示它走哪一邊會獲得獎勵;哪一邊的塔越多,獎勵就越有可能出現在那一邊。小鼠學會了這一點,通過練習,它們轉向某一邊的可能性與那一邊塔的占比非常接近。參與實驗的共有20只小鼠,威滕記錄了這些小鼠玩游戲時大腦中300多個多巴胺能神經元的活動。
如果獎勵預測誤差理論是正確的,那么多巴胺能神經元應該只在意外獎勵出現時以及可以預測獎勵時才會放電。為了驗證這一點,威滕與納撒尼爾·丹(Nathaniel Daw)教授進行了合作研究。丹教授是研究多巴胺信號與學習的關系的世界頂級專家之一。研究團隊建立了一個統計模型,用這個模型他們可以測試多巴胺能神經元如何對小鼠在游戲體驗中的不同方面做出反應——從小鼠在走廊上的位置,到它能夠跑多快,再到它在之前的嘗試中是否獲得了獎勵。研究團隊發現,多巴胺能神經元對游戲的不同方面都有反應。有充分的證據表明:許多多巴胺能神經元的反應與獎勵預測誤差理論的預期一致,但這并非導致它們做出反應的唯一因素。威滕的研究已經開始向我們展示出多巴胺到底有多復雜。
你想要什么,多巴胺比你更清楚
當談到科學上流行的錯誤觀點時,榮登榜首的或許就是多巴胺和快樂之間的關系。多巴胺與快樂有關這當然是有道理的,畢竟已有研究證明了,動物會自我刺激多巴胺能系統,直到筋疲力盡。它們一定是覺得快樂所以才這么做的吧。然而,有時候顯而易見的答案恰恰是錯誤的。大腦的神經化學系統非常復雜,在過去的20年里,一個重要的發現就是多巴胺并非直接負責產生快樂的化學物質。多巴胺的作用似乎集中在動機上——或者就像神經科學家肯特·貝里奇(Kent Berridge)所說,是“想要”(wanting),而不是“喜歡”(liking)。
約翰·薩拉蒙(John Salamone)是康涅狄格大學的一名神經科學家,他致力于研究大鼠的動機——主要是通過操縱大鼠的大腦化學物質,試圖把它們變成電視迷。為此,他使用了一種實驗裝置,讓大鼠在不需要額外努力就能吃到少量食物和爬過障礙物后能吃到大量食物之間做出選擇。
當面臨選擇時,大鼠通常都會爬過障礙物去獲取更多的食物。然而,在一些實驗中,薩拉蒙發現,干擾多巴胺會使大鼠更有可能選擇少量的無須努力就能獲得的食物。這并不是因為多巴胺被擾亂后大鼠就爬不過障礙物了,如果讓它們在攀爬后給予食物和不攀爬也不給食物之間做選擇,它們一定會選擇前者。這樣看來,多巴胺被擾亂后似乎只是降低了大鼠為食物而努力的意愿。
薩拉蒙的研究與神經科學家肯特·貝里奇和特里·羅賓遜(Terry Robinson)的一系列觀點相吻合,他們的論述非常有說服力,他們認為多巴胺的作用是激勵顯著性(incentive salience):多巴胺并不會決定機體對獎勵的喜愛程度,而是提供一種信號,告訴你機體想要獲得某種獎勵的程度,以及你應該付出多大努力去得到獎勵。
就多巴胺在動機中的復雜性而言,其中一個表現就是,它在大腦中廣泛釋放,在不同的接收腦區里,它的影響是不同的。例如,將紋狀體運動部分的多巴胺阻斷,會降低動物的整體身體活動水平。伏隔核(紋狀體的一個部分,與大腦中涉及情緒的其他部分聯系緊密)中的多巴胺受體似乎在激勵動機中起著核心作用,但它的角色很復雜。阻斷伏隔核中的多巴胺不會干擾基本的食欲,也不會干擾進食的快樂,但會干擾動物進食的意愿,即它們是否愿意做出獲取食物的行為,或者是否愿意為了獲得更多食物而進行額外的努力。
盡管多巴胺對動機很重要,但獎勵的快樂信號似乎是由大腦中的其他神經遞質系統發出的,包括阿片受體(阿片類藥物如海洛因的作用靶點)和大麻素受體(大麻中活性成分的作用靶點)。最有名的證據來自肯特·貝里奇的研究,他研究了在阻斷大腦中的多巴胺或阿片類神經遞質后大鼠的“快樂反應”(比如,為了獲得甜食而舔嘴唇或爪子,或面對苦味食物時搖頭)。他發現,阻斷多巴胺不會減少動物的快樂反應,而阻斷阿片類神經遞質則會。這些結果與許多關于納曲酮作用的報道一致。納曲酮是一種阻斷阿片類物質作用的藥物,通常用于治療酒精成癮。一些研究檢測了納曲酮對性、賭博、安非他命類藥物的使用等方面的影響,這些研究普遍發現,納曲酮減弱了個體從這些方面獲得的愉快感。
行動的選擇
在任何特定的時間點上,一個人可能做出的行動幾乎是無限多的。即使是一個簡單的動作都有很多種方式,比如,拿起一個咖啡杯:可以快速拿起、緩慢拿起、平穩拿起、搖搖晃晃地拿起、直接拿起、兜著圈拿起……要理解我們為什么做出某個行動,一個重要的問題是,當我們選擇一種行動時,我們的目標是什么?一方面,我們希望從行動中獲得最大的獎勵,這種獎勵可以是喝一口咖啡而不讓咖啡灑出來,也可以是從游戲中贏得最多的籌碼。另一方面,我們希望將行動的成本降至最低,無論是在體力、腦力還是在時間。我們可以拿起咖啡杯,把它舉過頭頂5次,然后放到嘴邊,但是沒有人會真的那樣做,因為這可能會讓咖啡灑出來,而且會增加體力和時間成本。基底神經節和多巴胺能系統似乎在計算中扮演著核心角色,幫助我們決定在特定的時間點做什么以及如何去做。
神經科學家彼得·雷德格雷夫(Peter Redgrave)曾在1999年提出,基底神經節是行動選擇的“中央交換機”。15該理論認為,大腦皮質向基底神經節發送代表潛在行動的信號。這一理論的提出是基于我們之前提到過的蒼白球內強烈的緊張性抑制。假設一個人需要在兩種可能的行動中做出選擇(比如,伸手拿一塊蛋糕或一根胡蘿卜)。每一個潛在的行動都會由一個信號來代表,這個信號從大腦皮質發送到基底神經節。在信號到達之前,基底神經節的緊張性抑制會抑制一切行動。當這兩個信號到達紋狀體時,它們通過直接和間接通路的活動相互競爭,最終其中一個行動被直接通路選中并得到執行。
多年來,這一模型在很大程度上仍然是一種推測,但近年來,神經科學方法的進步已經開始為這個模型提供直接證據。羅伊·科斯塔是哥倫比亞大學的一名神經科學家,他的研究為了解行動選擇在基底神經節中如何進行提供了證據。他在研究中采用了光遺傳學技術,使得研究人員能夠識別紋狀體中的任何單個神經元屬于哪條通路,然后分別測量兩條通路中這些神經元的活動。在實驗中,他們教小鼠執行一系列按壓杠桿的動作。經過練習,小鼠可以按得很快。科斯塔發現,直接和間接通路的神經元在系列行動的開始階段都變得很活躍,這或許反映了不同的可能行動之間的競爭。然而,一旦系列行動開始,就只有直接通路的神經元仍然保持活躍。在系列行動的最后,間接通路的神經元再次變得活躍,這表明在結束一個復雜行動時,這些神經元也參與了。16
本章提到的這些研究向我們展示了,基底神經節是大腦里習慣學習的中心,而多巴胺在建立新習慣的過程中扮演著關鍵角色。我們可以從中看到這些機制是如何使一種習慣變得根深蒂固的。例如,給大鼠提供兩個杠桿,它可以選擇去按壓,但只有一個杠桿會提供食物顆粒作為獎勵。剛開始,按壓兩個杠桿的行動價值大致相等,因為大鼠并不知道哪一個會帶來獎勵(實驗室動物在類似的環境中待久了,通常都會知道杠桿是用來按壓的)。大腦皮質會向紋狀體發送對應于按壓每一個杠桿的指令,其中一個會在紋狀體中獲勝。比如大鼠可能在過去學過,右邊的杠桿更有可能提供獎勵,所以它可能就會選擇右邊的那一個。如果它得到了食物,那么這個意外的獎勵就會導致多巴胺的釋放,多巴胺會通過三因素規則強化大腦皮質和紋狀體之間的連接,從而使大鼠去按壓那個特定的杠桿。這種連接的增強將使皮質神經元更有可能在下一次引起紋狀體神經元放電。如果大鼠沒有得到食物,那么就會導致連接強度的下降。這種連接強度的變化使得下次大鼠在面對同樣的選擇時,得到了獎勵的那種行動更有可能勝出,隨著時間的推移,這種行動就逐漸固化成了一種習慣。
下一章我們會轉向本書中最核心的問題之一:為什么習慣會如此頑固?