pg埃及探秘宝典试玩平台官网

書名：超圖解心理學與生活
作者名：《圖解經典》編輯部編著
本章字數： 6233字
更新時間： 2019-11-07 14:38:23

第10講習得性反射—獎賞與懲罰式學習

心理學家對于學習的研究主要是關注人類和動物學習行為的特征，解釋有機體學什么、怎樣學和為什么學，是對學習規律和學習條件的系統總結。

巴甫洛夫的狗——經典條件反射

在“望梅止渴”的故事中，曹操和他的將士在行軍途中口渴難耐。曹操則告訴大家，不遠處有梅林，梅子可以解渴?！懊纷印币辉~起著信號作用，代表著梅子的形狀、顏色、味道等，所以將士們聽到后想起了梅子的味道，嘴里流出了口水，一時間就不口渴了。

狗的唾液反應

俄國生理學家巴甫洛夫為了研究唾液在消化中的作用，以狗為被試，把各種可食用或不可食用的東西放入狗的嘴里，然后觀察狗唾液分泌的情況。通過研究，巴甫洛夫發現，狗在得到流質食物時只分泌少量唾液，而在得到比較干燥的食物時則產生大量唾液。這種在一定條件下分泌唾液的現象被巴甫洛夫稱為“反射”（巴甫洛夫的發現，后來被稱為經典條件反射）。

巴甫洛夫用于研究經典條件反射的設備

反射是一種對特定刺激自動發生的反應，不需要學習。同樣地，人也具備這種在刺激下自動分泌唾液的反射。隨著研究的繼續，巴甫洛夫進一步發現，當食物還沒有進入狗嘴而僅僅是聞到食物的氣味時，狗就已經開始分泌唾液。一段時間之后，即便是在完全沒有消化刺激的情況下，狗也會分泌唾液，例如給狗呈現喂食的容器或者讓狗看到喂食的人，甚至僅僅聽到喂食的人的腳步聲，也會令狗產生這種反射。

無條件反射與條件反射

無條件反射不需要學習，先天具備而自動產生，并且同一物種的無條件反射大體相同。無條件反射的例子有：食物進入口中時人會分泌唾液，燈光熄滅后人的瞳孔會放大，聽到巨大的聲音時人會跳起來，等等。無條件刺激引起無條件反應形成了無條件反射。在巴甫洛夫的研究中，食物就是無條件刺激，而唾液分泌則是無條件反應。

條件反射則正好相反，它需要通過經驗或學習獲得，并且在同一物種的不同成員中可能存在很大的差異。巴甫洛夫實驗室的狗聽到腳步聲時分泌唾液，或者人聞到牙科診室的氣味時會感到牙疼等，這些都是條件反射。條件反射的形成需要條件刺激，如腳步聲（條件刺激）引起了狗的唾液分泌（條件反應）。

條件反射的特點與規律

消退條件反射形成以后，如果得不到強化就會逐漸削弱，直至消失。例如，狗對腳步聲形成唾液分泌的條件反射以后，食物的強化使條件反射進一步鞏固；如果只提供腳步聲而不給食物，已經形成的條件反射就會消退。

泛化在條件反射形成后的初期，類似的刺激也會引起條件反應。如狗形成了對較重的腳步聲的條件反應后，也會對較輕的腳步聲做出相同的反應。新的刺激越接近原來的條件刺激，泛化現象越容易發生。

分化對事物差異的反應。例如，狗可以只對較重的腳步聲做出條件反射，而對較輕的腳步聲沒有唾液分泌的反應。

斯金納的老鼠——操作性條件反射

斯金納箱是心理學研究中最巧奪天工的裝置之一；通過這個裝置，心理學家可以完全控制動物被試所處的環境，同時還可以觀察動物的行為。

斯金納箱

伯爾赫斯·弗雷德里克·斯金納可以說是最廣為人知、最有影響力的行為主義心理學家。雖然他不是行為主義心理學的先驅，但是他很好地發展了巴甫洛夫、華生等人的觀點，并實現了在嚴格的實驗監控下進行行為主義理論的研究，充分證明了他“激進行為主義”的立場——心理學研究依靠的是可觀察的行為，而不是不可觀察的思想。

從實驗中斯金納得出結論，行為的形成主要是通過動作的結果習得的。這一觀點成為行為主義心理學的轉折點。

斯金納在研究期間，對老鼠進行了一系列實驗，他在實驗中使用的裝置被稱為“斯金納箱”——在一只空的籠子或者箱子里，安置了一個用來放食物的碟子或托盤。斯金納箱中裝有一個特殊的杠桿，當放進箱內的老鼠每次按壓杠桿時，碟子或托盤上都會出現食物顆粒。該裝置可以自動記錄按壓杠桿的頻率。剛開始，老鼠或許是出于好奇或者偶然按壓了杠桿，一段時間以后，老鼠就會發現只要按壓杠桿食物就會出現，于是為了得到食物，它們學會了主動按壓杠桿。

斯金納箱

操作性條件作用

根據斯金納一系列的實驗可以得出結論，動物的行為會受到它們的動作或周圍環境帶來的反饋的影響。當老鼠在斯金納箱中探索周圍的環境時，它們的某些動作帶來了積極的結果，而這樣的結果鼓勵它們重復那種行為。斯金納說，動物操縱著它的環境，而它的這種操作性行為（按壓杠桿）又會受到帶來積極影響的刺激（得到食物顆粒）的強化。為了區別于巴甫洛夫的經典性條件作用，斯金納提出了“操作性條件作用”的說法。

與經典性條件作用不同的是，操作性條件作用依賴于產生的行為結果而不依賴于先前的刺激。兩者間的另一個差別是，操作性條件作用不僅通過動作或行為操縱環境，同時也通過環境塑造著行為，也就是說，它是一個雙向的過程。

在實驗后期，斯金納重新安排了老鼠獲得食物的速率，他讓一些老鼠只有在多次按壓杠桿后才能獲得食物，而按壓的次數有的是固定的，有的是隨機的。改變了老鼠獲得食物速率后的實驗同樣得出了先前實驗的結論，并且還有新的發現：當強化刺激使行為發生的可能性較大時，突然停止強化刺激，行為發生的概率就會隨之減小，其模式取決于刺激撤銷的模式。

桑代克的貓——試錯學習定律

跟隨著滿意結果的反應，以后出現的概率會越來越大；而跟隨著不滿意結果的反應，以后出現的概率會越來越小。這種行為與結果之間的反應被稱為效果律。

貓與“迷籠”

當巴甫洛夫在俄國致力于用狗做實驗時，愛德華·李·桑代克（Edward Lee Thorndike）在美國也開始了動物行為的研究。最初，桑代克試圖讓雞學習走他為了實驗專門設計和搭建的迷宮。隨著研究的推進，桑代克開始用貓為被試做實驗，并發明了“迷籠”來觀察貓學習逃跑的能力。

他把饑腸轆轆的貓關在迷籠中，讓其探索迷籠中的環境。這時，貓會碰到各種裝置，如鈴鐺、線繩或者按鈕、面板，其中有一種裝置連接著打開箱門的門閂。如果貓發現了這一裝置，它就可以跑出來并得到食物獎勵。桑代克多次重復這個過程，觀察并記錄貓每次打開迷籠門所用的時間。

實驗中，桑代克把不同的貓放到一系列具有不同開門機關的迷籠中。桑代克發現，貓在第一次嘗試和犯錯后發現了逃跑的機關，隨后的嘗試和犯錯次數會逐漸減少，因為貓學會了哪些行為可以獲得獎賞，而哪些則是無效的。這項研究使用特別創設的環境，使被試在其中接受特定的刺激或任務，這就是“工具性條件作用”或“工具性學習”。這為后來的行為主義實驗技術提供了品質保證。

貓的迷籠

效果律

根據這些實驗的結果，桑代克提出了效果律，即當某種情境引發的反應帶來了令人滿意的結果，那么在未來這種反應再次出現的可能性會更高；當對一種情境的反應帶來了不好的結果，那么在將來再次出現這種反應的可能性就會很小。桑代克認為，一旦刺激與反應之間建立了聯結，大腦中就建立了對應的神經連接。這種學習被桑代克稱為“聯結主義”。

桑代克提出的效果律是所有行為主義心理學的基礎。效果律說明了動物是通過加強行動與結果之間的連接來學習的；積極的結果更容易被動物記住，而消極的結果則會很快被它們忘記。

正強化與負強化：無益的行為被淘汰出局

在學習過程中，有的行為被保留，有的行為被淘汰，這些通常取決于行為的結果，即這項行為的結果是會獲得獎勵還是懲罰。因此，桑代克和斯金納都認為，強化的作用會對行為的取舍產生影響。

正強化與負強化

桑代克認為，在嘗試—錯誤學習中，行為的結果是影響學習的關鍵因素：正確的行為會保留下來，錯誤的嘗試被放棄；正強化會促進行為，而負強化或懲罰會削弱行為，即桑代克提出的“效果律”。斯金納也認為，部分行為不是由刺激情景引發的，而是有機體的自發行為，行為的結果是使行為得以鞏固或再次出現的關鍵因素，即強化的作用。

斯金納把“凡是使反應概率增加，或維持某種反應水平的任何刺激”都歸為強化物。他把強化分為兩種類型：正強化和負強化。無論是正強化還是負強化，其所引發的結果都是使行為再次出現的概率增加，使行為的發生得到促進。正強化是指環境中某種刺激增加使行為反應出現的概率增加；負強化是指環境中某種刺激減少后使行為反應出現的概率增加，通常情況下，負強化表現為一種讓有機體力圖回避的厭惡刺激。

強化的控制

斯金納認為，強化方式是在行為實驗中最容易控制、最有效的變量。在精確控制的實驗情景中，實驗者可以精確地決定使用哪一種類型的強化、如何給予強化和在什么時間給予強化。

強化可以細分為不同的類型，有連續強化和間隔強化、固定比例強化和變化比例強化、固定時間強化和變化時間強化等。

通過不同的強化作用，可以影響行為的習得、反應和消退的速度。

兒童是怎樣習得攻擊行為的

除直接的獎勵和懲罰外，還可以通過簡單地觀察、模仿其他人的行為來塑造行為。

模仿

美國當代心理學家阿爾伯特·班杜拉（Albert Bandura）指出，兒童能夠通過模仿成人而學會攻擊行為。一個人要完成對他人行為的模仿需要經歷四個階段：注意、保留、復制和動機。模仿首先需要注意到某一要進行模仿的行為，然后模仿者會記住自己所觀察到的行為，并且學會這種行為，最后他會在合適的動機或原因的驅使下再現這一行為。

“波比娃娃”實驗

研究人員從當地幼兒園招募3~6歲的男孩女孩各36名，將這些兒童分為3組，每組24人（男孩12名，女孩12名）。第一組不安排成人榜樣，作為對照組；第二組安排一名攻擊充氣波比娃娃的成人，并讓兒童與這位成人接觸；第三組安排一位平靜地與娃娃玩耍的成人，并讓兒童與這位成人接觸。為了確保被試不受到同齡兒童的干擾，在實驗中所有的孩子都單獨進行測試。

實驗過程中，第二組的兒童會觀察到成人用木棍擊打娃娃、把娃娃拋到空中、用腳踢娃娃、把娃娃扔到地上用腳踩等行為。接著，每個兒童都被安排到一個單獨的房間，房間里除了波比娃娃外，還有其他一些玩具。結果發現，這一組的兒童會模仿成人對娃娃實施大量的攻擊行為，有的兒童甚至還會使用自發性的攻擊行為去擊打娃娃。這一組的兒童對槍械玩具表現出了高度的興趣。

第三組的兒童，即那些接觸到平靜成人的兒童，幾乎不表現出任何身體和口頭上的攻擊行為。兒童會模仿自己看到的行為這一事實表明：的確存在通過觀察和模仿來實現學習的過程。

兒童在不同情況下產生攻擊反應的次數

注：上表記錄了被試在不同榜樣類型影響下采取不同類型攻擊的次數。

通過波比娃娃的實驗，班杜拉得出以下結論：

1．如果成人行為向兒童傳遞暴力行為被允許的信息，那么就會削弱對兒童發生的攻擊行為的抑制。

2．當兒童以后遇到挫折時，更容易表現出攻擊行為。

3．在世界大部分國家的文化中，攻擊行為被看成是典型的男性行為，而不是女性行為，從而男性榜樣的攻擊行為對男孩的影響明顯大于女性榜樣的攻擊性行為對女孩的影響。

小阿爾伯特的恐懼：泛化的習得行為

無論天性如何，任何人都可以被訓練成任意的樣子。

——約翰·B.華生

小阿爾伯特的恐懼

約翰·B.華生和助手從當地兒童醫院挑選了一個9個月大的嬰兒阿爾伯特進行了一系列的實驗。盡管現在看來，華生的實驗方法顯得殘忍且不道德，但在當時他進行的研究確實將從前的動物研究向前推進了一大步。

小阿爾伯特是研究人員和醫護人員認為心理和生理上都很健康的嬰兒。為了確定他是否害怕某種特定的刺激，實驗者分別把老鼠、猴子、狗、白色羊絨棉以及有頭發和沒有頭發的面具呈現在他的面前。通過觀察小阿爾伯特的反應，研究者發現他對許多動物和物品都感興趣，愿意接近甚至不時觸摸它們，完全沒有表現出任何的恐懼。我們可以把這些不引起恐懼的東西看作是中性刺激。接下來，為了確定阿爾伯特是否會對巨大的聲音產生恐懼反應，實驗者在阿爾伯特身后用錘子敲一根鐵棒。結果，阿爾伯特被這種突然出現的聲音嚇得開始哭泣。

在阿爾伯特11個月大時，研究者向阿爾伯特呈現白鼠的同時還發出了令他恐懼的聲音。原本對白鼠感興趣的阿爾伯特只要伸手想要觸摸白鼠，就會聽到鐵棒被突然敲響，突如其來的響聲讓阿爾伯特十分驚恐，這一過程重復了3次。一周后，重復同樣的過程。經過7次白鼠與聲音同時呈現后，即便沒有敲打鐵棒的聲音，僅僅向阿爾伯特呈現白鼠，他也會感到恐懼。

一周后，再次向阿爾伯特單獨呈現白鼠，他仍舊對白鼠產生恐懼。隨后研究者呈現給阿爾伯特一種與白鼠相似的東西，如白兔、狗、白色毛皮大衣等，結果發現他對類似的東西也產生了恐懼。

由此可以得出結論：小阿爾伯特開始對其他刺激物產生恐懼，也就是說這種習得的行為已經泛化了，即對某種事物的恐懼是會遷移到其他事物上的。華生的研究證明了情緒是可以通過簡單的刺激-反應手段而成為條件反應的。這一發現對行為主義的開創功不可沒。然而，這項實驗也飽受爭議，有人指出其實驗方法嚴重違反了人類行為研究中的倫理準則。

無限的可塑性

華生提出，可以把兒童看作“白板”。他還說，通過行為主義原理可以把孩子塑造成各種專家，無論是藝術家還是醫生都能夠實現，且不在乎孩子的天性如何。

他甚至在1924年所寫的《行為主義》一書中寫道：“給我一打健全的嬰兒和能夠用于培養他們的特殊環境，我就能保證，把隨機選出的任何一名嬰兒訓練成任何類型的特殊人物，包括醫生、律師、藝術家和商界領袖，或乞丐、小偷，而無須考慮他的天賦、愛好、傾向、能力、職業和種族?！?/p>

迷信的鴿子：非關聯性強化

如果一個人的行為，被認知心理學家或人本主義心理學家或其他人認為是由我們高度進化的意識或智力所致，那么，這也許只是心理學家還沒找到引發這一行為并使之維持的強化物。

迷信行為與斯金納的假設

生活中不乏一些迷信行為，如忌諱從梯子下走過，忌諱踩到裂縫，隨身帶著一枚幸運硬幣或其他護身符，在擲骰子的時候采用一種特定的方式，等等?？梢钥隙ǖ卣f，每個人都會因為迷信做過某些事情。

斯金納解釋說，人們之所以會做出這樣的行為，是因為他們相信或揣測迷信行為和某些強化性的結果之間存在一定聯系，盡管實際上兩者并不相關。而這種不存在的聯系卻被人們深信不疑，其原因是某種行為（如用某種方式擲骰子）得到了偶然的強化（如擲出一個好點數）一次或多次。斯金納把這種聯系稱為非關聯性強化。

人們會認為，迷信需要人們思考、辨別、推理，甚至可以說是一種信仰，所以迷信行為是人類所獨有的。但斯金納認為，從本質上來看，迷信行為與其他任何一種行為一樣，都可以用操作性條件反射原理來解釋。

斯金納說：“如果你認為這是人類特有的行為，那么我將給你一只迷信的鴿子。”

6只迷信的鴿子

還記得斯金納箱嗎？斯金納再次利用了這個裝置，但這一次是為了研究迷信行為。為了這次研究，斯金納對原有的裝置做了一項改變：箱子里的食物被設置為每隔15秒自動落在盤子里。也就是說，無論箱子里的動物做了什么，都會在每隔15秒后獲得食物。

這次研究的被試是8只鴿子。為了確保這些鴿子在實驗中處于饑餓狀態，研究者連續幾天喂少于它們正常進食量的食物，以此增強鴿子尋找食物的動機（這增加了強化的效果）。接下來，研究者會讓每只鴿子每天在實驗箱里待幾分鐘，期間對其行為不做任何限制，只是每隔15秒食物會自動出現。幾天后，觀測者記錄下每只鴿子在箱中的行為。

最終得到結果，其中6只鴿子產生了非常明顯的反應：第一只鴿子在箱子中逆時針轉圈，在兩次強化之間轉二到三圈；第二只鴿子反復將頭伸向箱子上方的一個角落；第三只鴿子反復用頭抬起一根看不見的桿；還有兩只鴿子的頭部前伸，從右邊快速地擺動到左邊，然后又慢慢地返回，它們的身子也順勢移動，有時由于動作幅度過大還會踉蹌幾步；最后一只鴿子做出啄擊或輕觸地面的樣子，卻不觸及地面的行為。

鴿子的這些行為都是在建立條件反射后才出現的。事實上，鴿子所表現出的新行為與得到食物毫無關系。然而，它們表現得就好像通過那種行為就能得到食物似的——也就是說，它們變得迷信了。

官术网_书友最值得收藏!

超圖解心理學與生活

第10講 習得性反射—獎賞與懲罰式學習