第7章幼兒學習理論（2）

書名：幼兒學習與發展
作者名：張永紅海鷹張丹楓主編
本章字數： 4816字
更新時間： 2016-05-18 14:31:49

自然恢復（spontaneous recovery）

經過一段時間條件刺激總不出現，條件反射基本消退之后。如果隨后再次呈現條件刺激，條件反射又會重新出現，我們就說條件反射在消退之后又自然恢復了。條件反射自然恢復后不會持續很長時間，除非再次出現條件刺激。條件刺激和非條件刺激的同時出現使條件反射得到全面的恢復。

泛化（generalization）

泛化指的是和條件刺激相似的刺激引起了條件反射。狗一旦建立起條件反射，聽到節拍器每分鐘嘀嗒嘀嗒地敲70次就分泌唾液，有時當節拍器敲擊的速度變快或變慢，甚至鐘表或計時器的嘀嗒聲也能使它分泌唾液。新的刺激和條件刺激的相似性越小，泛化出現的可能性就越小。

辨別（discrimination）

辨別是和泛化互補的過程。當狗學會對條件刺激作出反應而對其他類似的刺激不作出反應時，辨別就出現了。要訓練辨別能力，實驗人員可以在條件刺激出現時呈現無條件刺激，而在其他類似的刺激出現時不呈現無條件刺激。例如，假定條件刺激是節拍器每分鐘發出70次嘀嗒聲，那么一出現這種聲音就呈現無條件刺激，而出現其他節律（如每分鐘50或90次）的嘀嗒聲就不出現無條件刺激。

高級條件反射（higher-order conditioning）

刺激物一旦變成了條件刺激，就可以起到無條件刺激的作用，這個過程就叫作高級條件反射。如果狗一聽到節拍器發出每分鐘70次的嘀嗒聲就作出分泌唾液的條件反射，那么節拍器就可以作為引起高級條件反射的無條件刺激。讓新的中性刺激（如蜂音器）響幾秒鐘，緊跟著出現節拍器的嘀嗒聲。試驗幾次后，狗一聽到蜂鳴聲就分泌唾液，此時，蜂鳴聲就變成了第二級的條件刺激物。

高級條件反射是一個十分復雜、不易理解的過程。這個概念從理論上探討是很有意思的，有助于解釋一些社會現象（如測驗失?。槭裁纯梢砸饤l件性的情緒反應，如緊張和焦慮。在年紀較小時，失敗也許只是一個中性事件，然后會逐漸地與家長、老師的批評聯系起來。批評是引起焦慮的無條件刺激。通過條件反射，失敗就能引起焦慮。與情境有關的線索也可以成為條件刺激。因此，當學習者走進即將舉行測驗的教室或當老師宣布不久就要進行考試時，學習者就會感到非常焦慮。

資料卡

情緒的條件反射

經典條件反射理論可用來解釋某些機能失調的行為。剛入幼兒園的幼兒可能都會產生與新的經歷有關的恐懼。在學年剛開始的時候，幼兒園教師可以安排一些活動，使幼兒對這些最初的恐懼減少一些敏感。教師可以安排幾次入園前的參觀活動，讓幼兒有機會見到自己的老師和同學，見到自己的教室和寫有自己名字的座位。開學頭幾天，教師還可以開展一些有意思但相對來說比較平靜的活動，如讓幼兒了解自己的老師、同學、教室和教學樓等。幼兒可以先游覽教學樓，然后回到自己的教室，在教室里畫畫，和同學們談談自己所看到的一切。教師可以把幼兒帶到辦公室見園長、園長助理、校醫和顧問等，讓他們玩名字游戲，在游戲中幼兒先作自我介紹，然后設法回憶其他同學的名字。

這些活動屬于非正規的脫敏方法。對一些幼兒來說，和幼兒園有關的線索都能引起焦慮。有意思的活動能夠引起愉快的情緒，這些愉快的情緒和焦慮是互不相容的，把有意思的活動和有關幼兒園的線索聯系起來，就可以減少后者所引起的焦慮。

（資料來源：戴爾·H.申克，《學習理論》，江蘇教育出版社，2012）

二、斯金納的操作性條件反射學習理論

斯金納（B.F.Skinner，1904-1990），美國著名的行為主義心理學家，新行為主義的代表人物斯金納早年立志成為一名作家，但遺憾的是早年他在寫作方面的努力備受打擊。然而在他有幸拜讀了巴甫洛夫寫的《條件反射》（Conditioned Reflexes）和華生寫的《行為主義》（Behaviorism）以后，他開始對心理學產生了濃厚的興趣。以巴甫洛夫經典條件反射理論和桑代克學習理論為基礎，于1937年他提出了對當代心理學產生了深遠影響的操作性條件反射原理，其相關的思想在今天的教育心理學，特別是兒童心理干預與矯正中依舊被廣泛的應用。

同大多數的行為主義心理學家一樣，斯金納的操作性條件反射理論也是建立在大量動物實驗的基礎上。為進行動物實驗，斯金納設計了符合其操作條件作用學習理論的儀器，即“斯金納箱”（Skinner box）。它是一個大約0.3米高的立方體箱子，箱子內設有一個杠桿裝置和一個食物盤，如果里面的動物按壓杠桿，就會有食物落入盤中。斯金納把一只饑餓的白鼠放入箱中，白鼠在饑餓的刺激下不停地活動，產生一系列的行為反應（R），其中偶然出現的按壓杠桿的行為會為它帶來少量食物（S），白鼠吃完食物后繼續活動。偶然按壓杠桿得到食物的反應-刺激會繼續發生，這種在行為之后出現的刺激對行為本身是一種強化。白鼠在一次次獲得食物刺激的獎勵下，逐漸學會主動地按壓杠桿來獲取食物。這就是一個操作性條件反射形成的過程。

在20世紀30年代初，斯金納發表了一系列論文，報道了他用動物做實驗所獲得的研究結果。在研究中他發現了操作性條件反射的各種成分。

斯金納認為學習是“復雜情境中各種反應的重新組合”；條件反射是指由強化引起行為的加強。條件反射存在兩種形式，一種是S型，另一種是R型。S型條件反射是巴甫洛夫的條件反射，其特征是強化（無條件）刺激和另一個（條件）刺激成對出現。這種條件反射使人們對引起有機體反應的刺激給予了重視。對刺激作出的反應就是人們熟知的反應性行為。

S型條件反射雖然能解釋條件性情緒反應，然而，人的大多數行為在刺激一出現時就出現了，而非由刺激機械地引起。反應受結果控制，不受先前刺激的控制。斯金納把這種行為稱為R型條件反射，目的是要強調反應方面。從它作用于環境產生某種效果來看，這種行為是操作性的。

我們可能認為操作性行為是在“做中學”，事實上，我們在行為的過程中有許多學習正在發生著。與反應性行為（它在條件反射形成之前不會出現）不同，操作性行為出現的概率永遠不等于零，因為必須作出反應才可能獲得強化。強化改變了反應出現的可能性或頻率。操作性行為作用于它們所在的環境，由于強化，它們出現的可能性會變大或者變小。

強化（reinforcement）起到使反應增強的作用，即提高了反應的效率，或者說使反應更有可能發生。強化物或強化刺激（reinforcing stimulus）指的是任何在反應之后出現的使反應增強的刺激或事件。強化物（獎勵）的定義以他們產生的效果為基礎，而非取決于意識、意圖和目標這類心理過程。強化物不能事先確定，而必須由它們產生的效果來定，強化物是根據具體的情境來說的，它們只適合于某個時間某種情況下的個體。

正強化（positive reinforcement）包括反應之后出現一個刺激或把一些東西加入某個情境中，使該反應今后在該情境中出現的可能性提高的各種情況。正強化物（positive reinforcer）指的是反應之后出現的，使該反應今后在該情境中出現的可能性提高的刺激物。

負強化（negative reinforcement）是在反應之后取消某個刺激或從情境中抽走某些東西，他提高了該反應在該情境中出現的可能性。負強化物（negative reinforcer）指的是反應之后被取消的，使該反應今后在該情境中出現的可能性提高的刺激物。一些刺激物常常起到負強化物的作用，如強光、噪音、批評、討厭的人、低分數等，因為移去這些事物的行為可以產生強化作用。正、負強化物都能產生同樣的效果，即當刺激出現時，提高某個反應的出現頻率。

諸如食物、水、住所之類的刺激物叫作一級強化物，因為它們是基本的生存條件。二級強化物是通過和一級強化物形成聯結而變成條件的刺激物。通過和牛奶（一級強化物）形成聯結，嬰兒最喜歡奶瓶成為二級強化物。和不止一個強化物形成聯結的二級強化物叫做一般性強化物。

懲罰（punishment）降低了今后對刺激作出反應的可能性。懲罰包括撤銷正強化物和反應之后出現負強化物兩種情況。懲罰壓制反應，但無法使反應消除，當懲罰取消了，被懲罰的反應還可能恢復。懲罰的效果是十分復雜的。

資料卡

替代懲罰的方法

一是改變能夠引起消極行為的辨別性刺激。例如，坐在教師后面的學生經常會調皮搗蛋，教師可以改變辨別性刺激，讓這個違紀的學生移到前面的位子上去。

二是讓不希望出現的行為繼續表現，直到行為者滿足為止。例如家長可以讓孩子一直發脾氣直到孩子疲勞為止。

三是用不理會的方法消除不希望出現的行為，這種方法對小的違紀行為很奏效。

四是把不相容的行為與正強化物建立條件反射。教師表揚富有成效的學習習慣，這有助于學生建立這些習慣的條件反射。

這種替代懲罰的方法的最大優點是讓學生知道怎樣做才是對的。

普雷馬克原理（Premack principle）認為，提供價值較高的活動機會能夠強化從事價值較低的活動。在這里，要根據在沒有強化的情況下作出反應的數量或花在活動上的時間來定義“價值”。如果所安排的相倚活動的情況是第二個（相倚）事件的價值高于第一個（工具性）事件的價值，那么第一個事件發生的概率預計會提高（獎勵假說）。如果第二個事件的價值低于第一個事件的價值，那么第一個事件發生的可能性應該降低（懲罰假說）。

由于強化物的價值會變化，所以這個順序不是永遠不變的。任何強化物，如果經常使用，都會導致飽和（satiation），使反應的可能性下降。應用普雷馬克原理的教師需要定期觀察學生，詢問他們喜歡做的事情，以便檢查他們的偏好。在制訂計劃時，最關鍵的一個環節就是預先確定在情境中哪個強化物可能最有效。

強化的安排指的是確定什么時候給予強化。

1.連續強化程式。指的是對每一個正確的反應都給予強化。在學習技能時，這種安排是有必要的。學生們在作出每個反應之后都得到有關他們工作正確性的反饋，連續的強化有助于確保學生不去學習各種錯誤的反應。

2.定時強化程式。使用定時強化程式，只對動物在固定時間間隔作出的第一個正確反應進行強化。例如，只有間隔3分鐘的反應才會受到強化。在定時間隔的開始，動物反應很慢或根本就沒有反應。在快接近時間間隔的末尾時，動物逐漸提高了反應的速度，顯然它是預期到強化時刻的到來，這類反應在累計記錄中形成一種模式，被稱作定時扇貝。

3.定比強化程式。通過定比強化程式，動物作出的每一個第N次反應都會受到強化，在定比強化程式中，動物在受到強化之前必須作出一定數量的反應。

4.不定時強化程式。通過不定時強化程式，動物在不定的時間間隔結束時反應會受到強化。也就是說，它不同于定時強化程式有一個固定的時間間隔，相反，在不定時強化程式中，動物也許會在接受一次強化后即刻受到強化，也可能在其他一個不確定的時間受到強化。這種程式消除了定時強化程式中的扇貝效應，并產生了一個穩定的、適度的高反應率。

5.不定比強化程式。通過定比強化程式，動物在作出一定量的反應，如5個后會受到強化；用不定比強化程式，動物平均每5個反應會受到強化，因此，動物也許會連續2次受到強化，也可能作10次或15次反應都沒有強化。

總的來說，連續強化對消退產生的抵制最小，并在訓練期間產生的反應率最低。所有的部分強化程式都比連續強化對消退的抵制更大，并在訓練期間有更高的反應率。一般而言，不定比強化程式產生的反應率最高，其后依次為定比強化程式、不定時強化程式、定時強化程式，最后是連續強化程式。

資料卡

行為塑造與矯正

通過操作性條件反射進行行為改變的基本方法是塑造（shaping），要塑造行為，教育工作者應該遵循以下步驟：

1.確定學生現在能做什么事情（起點行為）。

2.確定理想的行為。

3.識別學生所在環境中的潛在強化物。

4.把終點行為（第二步）分解成可以按順序掌握的細小步驟。

5.經過不斷的強化每一個接近終點的行為，使學生由起點行為逐漸向終點行為靠近。

塑造就是通過不斷地糾正反饋，在行動中學習。

（資料來源：戴爾·H.申克，《學習理論》，江蘇教育出版社，2012）

官术网_书友最值得收藏!

幼兒學習與發展

第7章 幼兒學習理論（2）

第7章幼兒學習理論（2）