第5章 聽覺
- 生理心理學(第二版)
- 沈政 林庶芝
- 6531字
- 2015-04-21 12:34:00
物體振動引起空氣中傳播的聲波,作用于人類聽覺器官并轉換為神經信息,傳入腦內聽覺中樞,從而產生了聽覺。人類口、舌等發音器的振動產生了言語聲波,傳入聽者耳中產生的言語感知覺,是人類交際的主要手段和社會關系賴以形成的基礎。物體振動與聲波參數間的關系是物理聲學的課題;聲波參數與人類聽覺之間的關系構成了心理聲學或心理物理學的課題;聽覺器官和聽覺中樞怎樣對各種聲學參數進行編碼與加工,則是聽覺生理心理學的中心課題。物理聲學和心理聲學的基本概念是探討聽覺生理心理學問題的基礎和前提;而聽覺生理心理學研究又會加深對心理聲學和物理聲學問題的理解。所以本節從物理聲學和心理聲學參數作為討論聽覺問題的起點。
一、聲音刺激的物理參數和心理物理學參數
物體振動使周圍的空氣分子也隨之發生壓縮與寬松交替變換式的振動,這種振動以340米/秒的速度沿其振動方向向遠處傳播開來。聲波的物理參數主要有頻率、波幅等。頻率就是單位時間(秒)內聲波振動的次數,其度量單位是赫茲(Hz),即1次/秒的振動。聲波的振動幅度稱波幅,以其所具有的振動壓強為度量單位,即每平方米面積上空氣受到的壓力變換值,其絕對單位是牛頓/米2(N/m2)。聲壓越高,聲波振幅越高,則傳播得越遠。人耳鼓膜所能覺察出來的最小聲壓大約為2×10-5牛頓/米2.由于人耳所能感知聲壓的范圍甚廣,為了便于計算,物理聲學常采用聲壓的對數單位——分貝(dB)作為聲壓水平的基本單位,P為某一聲壓的絕對值(N/m2)。
聲壓與絕對閾值相等的聲壓水平為0分貝。心理聲學將人耳感知不同聲壓水平時產生的主觀感覺差異稱為響度或音強(loudness),響度的度量單位是方(phon)。
以單一頻率規律性振動的聲波,稱為純音(pure tone),生活中幾乎不存在單獨的純音,大多是含有多種頻率振動的復合音。對復合音進行傅里葉分析,可得到許多頻率的純音。那些振動頻率成倍數變化的一系列純音,稱為諧振音。一個復合音用傅里葉分析得到不同頻率純音的分布圖稱為聲音的頻譜圖。人所能聽到的頻譜大約為20-16000赫茲的各種振動波,對400-1000赫茲的聲波最敏感。1000赫茲60方的聲波是人耳最適宜的言語聽覺聲音參數。心理聲學將人耳所能分辨的不同頻率波,稱為音高(pitch)。在1000赫茲最適宜音高的附近,人們可以分辨出赫茲的變化,稱為頻率鑒別閾限。
物理聲學分析聲音的頻率、振幅或聲壓以及復合聲的頻譜;心理聲學考慮到這些參數與人類主觀聽覺間的關系,則提出相應的參數是音高、音強(響度級)和音色(trem-bre)。音色就是某一復合聲的頻譜,即構成該復合聲的主要頻率組成成分。聽覺生理心理學的核心課題在于闡明人腦感知音高、音強和音色的生理機制,分析內耳與腦聽覺中樞如何對聲波的心理聲學參數進行編碼和加工的。為此,必須對內耳和聽覺系統的結構與功能特點有所了解。
二、耳與聽覺通路
耳由外耳、中耳和內耳構成。外耳包括耳廓與外耳道,具有聚音和聲波傳導功能。中耳由鼓膜和鼓室構成,鼓室內有錘骨、砧骨和鐙骨等3塊聽骨。3塊聽骨構成傳導和調節聲壓的杠桿系統,一端由錘骨與鼓膜相接,另一端由鐙骨與內耳卵圓窗相連,將聲波從外耳傳至內耳。中耳鼓室內還有耳咽管把鼓室和咽腔溝通起來,以調節鼓室內壓力,保證鼓膜和聽骨杠桿作用的適宜壓力條件。內耳由前庭、耳蝸和三個半規管組成。耳蝸內主要有聽覺感受器——柯蒂氏器,前庭與三個半規管內主要有平衡覺感受器。內耳的聽覺感受器和平衡感受器及相關結構統稱為迷路,鑲嵌在顳骨形成的骨迷路腔內。在強振動的特殊情況下或外耳與中耳的聲波傳導與放大系統發生障礙時,骨迷路也能將聲波直接傳給內耳。這種途徑稱骨傳導,一般正常情況下它并不具有重要意義。
耳蝸是由3層平行的管狀組織螺旋式盤繞成二圈半的蝸牛狀結構。這3層平行管狀組織分別稱為前庭階、中間階(或稱耳蝸管)和鼓室階。在前庭階和鼓室階內流動著外淋巴;在中間階內流動著內淋巴。兩種淋巴液的化學組成不同,外淋巴含較高濃度鈉離子,類似細胞外液;內淋巴含較高鉀離子,類似細胞內液。前庭階和鼓室階的外淋巴液在耳蝸頂部經一孔相通。中耳傳導的振動聲波由鐙骨通過卵圓窗傳給前庭階的外淋巴液。中間階的內淋巴以前庭膜與前庭階的外淋巴相隔;以基膜與鼓室階的外淋巴相隔,所以外淋巴液內的振動波分別通過前庭膜和基膜傳給內淋巴。基膜上分布著聲波振動的感受細胞及其支持細胞。感受細胞又稱毛細胞,可分為內、外毛細胞兩種。人耳蝸內含有3400個內毛細胞和12000個外毛細胞,毛細胞的基部通過支持細胞固著于基膜上,頂部有許多纖毛,其上覆以蓋膜。內淋巴中傳導的聲波導致蓋膜與纖毛間的振動,從而使毛細胞興奮,產生感受器電位。
聽覺通路始于內耳的毛細胞,它與螺旋神經節內雙極細胞的外周支神經纖維相聯系。將編碼后的聽覺神經信息傳給雙極細胞。雙極細胞將這些信息沿其中樞支神經纖維——聽神經向腦內傳遞,首先到達延腦的耳蝸神經核,交換神經元后大部纖維沿外側丘系止于下丘,另一部分纖維從耳蝸核經過延腦的上橄欖核與斜方體,再達于下丘。從下丘向左、右兩個內側膝狀體傳遞信息,最后由內側膝狀體將聽覺信息傳送到顳葉的初級聽皮層(41區)和次級聽皮層(21區,22區,42區)。應該指出,在聽神經中,95%的纖維來自于與內毛細胞發生突觸聯的雙極細胞;只有5%的聽神經纖維來自與外毛細胞發生聯系的雙極細胞。前一種雙極細胞與內毛細胞是一對一的聯系;而后一種雙極細胞可以同時與幾個外毛細胞發生聯系。所以,內毛細胞在聽覺感受中,具有較重要的作用。
三、聽覺信息的神經編碼
關于聽覺系統對聲波的各種參數怎樣編碼而產生主觀聽覺的問題,很早就形成了幾種理論假說。隨著科學的發展,逐漸認識到它們各自的局限性,不斷修正舊的理論形成新的理論。
(一)音高的神經編碼與聽覺理論
1863年,德國生理心理學家黑爾姆霍茲(H。V。Helmholtz)提出了聽覺的共振假說(resonance theory)。這種理論把內耳比喻成一架鋼琴,柯蒂氏器官內的基底膜、毛細胞像琴弦一樣,由于長短不同振動頻率不一。外部聲波傳入內耳后,低頻聲波易引起較長纖毛的毛細胞和較寬基膜的共振;高頻聲波引起較短纖毛的毛細胞與較窄基膜的共振。解剖學研究確實發現耳蝸基底膜寬度不同,在耳蝸基部的基底膜較窄,而在耳蝸頂部基底膜變寬。這使共振學說至今還能解釋某些聽覺現象,例如老年人耳蝸基底部血管硬化供血不足,常造成其對高頻音聽力的下降,同時低頻音的聽力卻不發生變化。共振理論的嚴重不足在于機械地在內耳與鋼琴間的類比。事實上,內耳中的內、外淋巴和基底膜的振動總是整體性的,無法實現像琴弦那樣分離地局部振動。為克服共振假說的不足,許多學者對它作了修正,所謂位置理論(place theory)就是修正了的共振假說。這一假說認為,雖然內耳基底膜不能像鋼琴弦那樣進行分離的局部振動,但在基底膜整體振動時,不同部位上最大敏感振動頻率卻存在著微小差異。因此,在不同頻率聲波的感知中,耳蝸基底膜上的不同位置具有不同的作用。
與共振、位置理論不同,還存在著頻率理論(frequency theory)。這一學說認為,不同頻率聲波引起與之頻率相同的神經元單位發放,因而能感知不同音高的聲刺激。這一學說遇到的困難是神經元最大單位發放頻率不超過千赫茲;而人類聽覺卻可以感知16千赫茲以下的聲音。為了克服這個難點,一些人修正了頻率假說,提出了齊射原理(volley principle)。這一原理指出,雖然每個聽覺神經元的單位發放頻率不能超過千赫茲,但聲波作用聽覺系統,同時可以激活許多神經元的單位發放,它們各自產生一定頻率神經沖動排放,疊加在一起,就會造成與高頻聲波相同的發放頻率。提出者也不得不承認,齊放理論最多只能解釋5000赫茲以下的聲音感知現象,對5000赫茲以上聲音的感知應由位置學說加以補足。
美籍匈牙利學者貝克西(G。V。Bekesy)1969年提出了行波學說(travelling wave),以其大量精細數據和模擬研究獲得了諾貝爾獎。貝克西認為聲波從外耳經中耳引起卵圓窗的振動,在內耳的傳播是以行波方式進行的。他設想耳蝸管的內淋巴、基底膜、毛細胞和蓋膜之間發生三維振動,振動的幅度最小為10-10米。因為耳蝸螺旋部的基底膜緊張度較高,耳蝸螺旋頂部的基底膜緊張度較低,行波傳播的速度逐漸降低,振幅也逐漸降低,達耳蝸頂部時,行波幾乎消失,可見在耳蝸管的不同點上,行波振動的最大頻率逐一下降。換言之,不同頻率的行波引起不同感受細胞的最大興奮,在耳蝸內對聲音頻率進行著細胞分工編碼。凱恩(Kiang)應用細胞微電極方法,未能找到對200赫茲以下聲波反應的耳蝸細胞。因此,無法用細胞分工編碼解釋低頻聲波的感知機制。他進一步發現,在低頻范圍內耳蝸螺旋頂部的基底膜與聲波發生同步化振動。還有人用各種頻率聲波合成的白噪聲刺激,以便引起整個基底膜的同時振動。此時被試仍能報告是否有聲刺激出現或消失,說明此時存在耳蝸神經沖動。
綜上所述,關于內耳音高編碼問題,出現過許多理論,但歸結起來不外乎細胞分工編碼和頻率編碼兩種方式。可能對低頻聲刺激以頻率編碼為主,而高頻聲刺激以細胞分工編碼為主。那么在聽覺通路和聽覺中樞內對音高是如何編碼的呢?在聽覺通路上,插入微電極記錄不同水平聽覺神經元對各種音高聲刺激的反應。將實驗數據在頻率(音高)和音強坐標上記錄出反應曲線,結果表明每個神經元的反應曲線均呈V字形,其底下的尖點不相重合。由此說明在聽覺通路上,各個神經元有其自己最敏感的反應頻率,此頻率上給出單位發放頻率變化所需的音強最低。據此可以認為,在聽覺中樞內對音高的感知是由細胞分工編碼機制完成的。在初級聽皮層上,可以明確找到與耳蝸螺旋基部和頂部相對應的空間定位關系,顳橫回內側對應于耳蝸基部高音敏感區,顳橫回外側對應于耳蝸頂部低音敏感區。
(二)音強的神經編碼
在外周和中樞內對音強編碼的機制較為復雜。可分為級量反應式編碼、調頻式編碼和細胞分工編碼。在耳蝸管內的內淋巴與前庭階外淋巴之間,存在著正80毫伏的蝸管內直流電位;而在蝸管中的毛細胞(聲波感受細胞)膜內與外淋巴之間,存在著-60--80毫伏的細胞內負直流電位。所以,在毛細胞膜內與細胞膜外(內淋巴)存在著-140--160毫伏的靜息膜電位。當毛細胞受到刺激時,在其與蓋膜毗鄰的纖毛附近,大量鉀離子通道門開放,內淋巴的高濃度鉀離子進入毛細胞內,導致毛細胞去極化,產生了感受器電位。耳蝸內的感受器電位是一種級量反應,隨聲波刺激強度與波形的變化而變化,沒有潛伏期和不應期,也沒有適應現象。感受器電位觸發毛細胞釋放興奮性氨基酸類遞質(谷氨酸或天冬氨酸),這些遞質達雙極細胞外周纖維的突觸后膜上與受體結合,引起興奮性突觸后電位。這些興奮性突觸后電位發生總和而導致雙極細胞的單位發放。從上述過程可以看到,在雙極細胞單位發放以前的各個環節上,均是級量反應式的編碼過程。毛細胞膜電位去極化和感受器電位是級量反應,毛細胞釋放興奮性神經遞質,引起興奮性突觸后電位是級量反應,這些過程均制約于聲波刺激的強度。但是,在電子顯微鏡下的超顯微結構研究發現,耳蝸毛細胞不但與雙極細胞形成傳遞聽覺信息的突觸,還接受從橄欖核發出的傳出纖維。這些傳出纖維對毛細胞的興奮性產生抑制性調節。所以,毛細胞的級量反應有時并不僅僅決定于聲波的強度,還制約于傳出性抑制機制。這種對毛細胞的傳出抑制效應是通過神經末梢釋放膽堿類神經遞質而實現的。
在耳蝸螺旋神經節內的雙極細胞至皮層下的各級聽覺中樞內,均實現著調頻式的編碼過程,把音強的信息轉換為神經元單位發放的頻率變化。這種調頻編碼過程與其他感覺通路不同,聽覺中樞神經元的單位發放頻率不僅僅決定于聲音刺激的強度,還制約于它的頻率(音高)。各級聽覺中樞的神經元只能在一定的刺激強度和頻率范圍內,才能進行對刺激強度的調頻式編碼,將這種能引起聽覺某個中樞神經元單位發放頻率改變的聲刺激范圍稱為反應區。在聽覺通路上從低級中樞到高級中樞,神經元的反應區基本由大變小,說明高級中樞神經元之間的細胞分工編碼逐漸發揮更大作用。在大腦皮質中,細胞分工編碼已完全取代了單位發放的調頻式的信息編碼。
譚特里(A。R。Tunturi)發現在聽皮質中對音強的信息編碼與對音高的編碼一樣,都是細胞分工的空間編碼。在狗聽皮層的研究中,他發現在薛爾維氏回(相當人類顳橫回)皮層上,對不同聲音強度發生最大反應的細胞依次分布,其排列方向與對不同聲音頻率發生敏感反應的細胞排列方向互相垂直。聽皮層由外側向內側的細胞感受聲音的最適頻率逐漸增高;對不同音強發生最大反應的聽皮層細胞,在聽皮層的前后方向上依次排列。
四、對音色的神經編碼
對復合聲刺激,特別是言語聲音的刺激,聽覺系統靠兩種機制進行著細胞分工編碼。頻率自動分析的機制,使聽覺系統不斷對復雜聲音的頻譜進行傅里葉變換,由大量神經元分別對不同頻率的諧波進行音高和音強的編碼。另一種細胞分工編碼的機制類似于視皮層的復雜細胞和超復雜細胞一樣,在聽皮層內也存在著特征提取的各種特殊神經元及相應的功能柱,分別對音色進行模式識別過程。應該指出,對音色的神經編碼過程,至今還缺乏直接的系統性實驗證據。
五、聲源空間定位的神經編碼
除了心理聲學的上述3個基本參數外,人與動物聽覺系統對聲源空間定位的功能也具有重要的生物學意義,關于它引起朝向反射的神經機制,留在第4章中討論,這里僅就聲源空間定位的神經編碼機制進行討論。
聲源空間定位的神經編碼有兩種基本方式:鎖相—時差編碼和強度差編碼。這兩種編碼都依靠兩耳聽覺差為基礎,前者是由聲波達兩耳之間的時差所形成的空間定位;后者是由聲波強度在兩耳之間差異所形成的聲源空間定位效應。當聲源距離遠時,它對于兩耳之間的距離差可能較大,聲波達兩耳的時間差較易為聽覺系統所鑒別。如果聲源距離較近,其對兩耳之間的距離差很小,則由于兩耳聽覺神經元發放的鎖相機制,仍可感知其3×10-5秒的時差。什么是聽覺神經元單位發放的鎖相(phase locking)機制呢?聽覺神經元在聲波作用時,增加單位發放頻率的現象,并不是發生在整個聲波周期時間內,僅僅出現在聲波周期的某一時相上。頭兩側的聽覺神經元中,有些對同相位聲波產生同步性單位發放。神經元僅在聲波某一相位時改變單位發放頻率,兩側神經元對同相聲波產生同步性單位發放的機制,就稱為聽覺神經元單位發放的鎖相機制。如果聲源距離很近,聲波到達兩耳的時差甚微,僅產生幾分之一周期的位相差,此時由于兩側神經元單位發放的鎖相機制,只能一側神經元增加單位發放頻率,從而造成兩側神經元單位發放的不對稱性,產生了時差效應,對聲源給出準確的空間定位。靠神經元單位發放鎖相機制對距離較近的低頻聲源進行精確空間定位的神經中樞主要位于內側上橄欖核,由此再向高位聽覺中樞發出聲源定位的神經信息,進行更高級的信息處理過程。
對于高頻聲音刺激兩耳時差效應并不如低頻聲刺激那樣有效,對此在聽覺系統中還有雙耳強度差效應。如果一個高頻聲波來自左側或右側,由于頭部本身構成了聲音傳播的障礙物,使其達對側耳中的音強受到損耗,這樣在兩耳之間形成了音強差,導致神經元單位發放頻率的不對稱性。靠雙耳音強差對高頻聲源定位的中樞位于外側上橄欖核。
六、聽覺門控理論與聽覺門控障礙
幻聽是精神分裂癥常見的癥狀,病人常常聽到腦內有人在爭論或評論自己所作所為,還不時發出一些指示或命令,使病人不可違抗地按命令做出荒唐的事情。近年研究發現,聽覺系統的感覺門控機制受損,導致無關的聽覺刺激大量涌入腦內,是造成精神分裂癥精神障礙的原因之一。利用間隔500毫秒的兩個短聲引出的聽覺平均誘發電位中,兩個中潛伏成分P50幅值之比,是感覺門控機制測量指標。正常人由于聽覺適應性,對第二個短聲的反應明顯低于對第一個短聲的反應,所以,第二個P50與第一個P50之比小于0.7,稱為P50抑制;而精神分裂癥病人適應性反應能力差,對兩個短聲的反應沒有太大的差異,所以兩個P50波幅之比近似1或大于0.8,將之稱為P50抑制障礙,這也是聽感覺門控障礙的測試指標。