官术网_书友最值得收藏!

2.4.3 源自心理學的概念——行為主義

行為主義是心理學的一個分支,研究個體的環境和隨即產生的行為之間的關系。這基本上是一個“黑箱”方法,與大腦功能不相關。行為主義在20世紀20年代到20世紀50年代間很受歡迎。早期的先驅是巴甫洛夫、Twitmyer和Thorndike,他們各自的研究都是獨立的。巴甫洛夫在19世紀90年代的實驗聚焦于狗的消化,如幽默版的圖2.7所示,狗會先聽到節拍器的聲音,然后立即被提供食物。經過幾次這樣的試驗,觀察到狗聽到節拍器的聲音就會開始分泌唾液。節拍器擁有了刺激唾液分泌的性質。巴甫洛夫的發現證實了之前的中性刺激(節拍器),在多次試驗后變成了刺激唾液分泌的條件刺激。Twitmyer也記錄過相似的結果。這種將生物刺激與先前的中性刺激(如聲音或光線等)配對的動物行為改變被稱為經典條件反射或巴甫洛夫條件反射。

圖2.7 巴甫洛夫的狗。行為主義最早的實驗之一是由巴甫洛夫進行的,在這個實驗中,他就條件反射理論研究了狗的消化。(c)2003 Mark Stivers www.stiverscartoons.com,授權使用

在20世紀30年代,斯金納提出了操作性條件反射,它依賴于通過其結果來改變行為,要么強化,要么懲罰,而不是通過操縱巴甫洛夫條件反射。代表性的基于老鼠的斯金納箱實驗(如圖2.8所示)展示了受試老鼠在按了某個特定控制桿后,會得到積極強化(如提供食物),在按了某個不同的控制桿或按鈕后,會得到消極懲罰(如不提供食物)或積極懲罰(如給受試老鼠輕微電擊或噴冷水)。隨著時間推移,老鼠會更頻繁地按下食物控制桿而避開產生懲罰的控制桿或者按鈕。隨著不斷將刺激作為一種操作反應的方式,刺激會成為對受試者的控制手段。操作性條件反射的5個類型如圖2.9所示。

圖2.8 斯金納箱。研究操作性條件反射和經典條件反射的實驗工具。這個箱子是用玻璃圍起來的,里面有一個按鈕或者按鍵或者控制桿,動物按下去后分別會得到特定的刺激回應(如光或聲音信號),然后投放食物或水作為強化

圖2.9 操作性條件反射。強化和懲罰是斯金納方法的控制機制

強化可以分為兩個方面:在積極強化中,回應跟隨著獎勵,如在按控制桿時提供食物;在消極強化中,回應跟隨著一種不愉快的影響,如讓受試老鼠受到噪聲的騷擾,當它按下一個控制桿或者按鈕時則可以關掉。懲罰也有兩種模式:在積極懲罰中,回應會跟隨著一些不悅的體驗;在消極懲罰中,回應會移除一些愉悅的體驗。兩種情境都不鼓勵回應。區分懲罰與消極強化常常不是那么容易。通常,懲罰以調節恐懼為特征,是主動的回應,而懲罰是抑制性的,在很長時間內,回應只在懲罰解除時出現一次。在消退中,之前強化的回應不再被強化(無論是積極強化還是消極強化),由于不再經歷期望的結果,回應會削弱。斯金納相信操作性條件反射能被用來設計有機體復雜而豐富的行為。

經典條件反射與操作性條件反射的區別在于前者支持反射行為,而后者則通過操縱刺激來控制主體的行為。行為主義直接影響了基于智能體的機器人,結論是:

1.行為主義主要與可觀察的行為相關,不同于像思考和情感這樣的內在事件。可觀察的(即外在的)行為可以被客觀而科學地衡量。內在事件(如思考)應該通過行為主義的術語來解釋,或者干脆消除。

2.人沒有自由意志,一個人的環境決定其行為。

3.在出生時,我們的大腦是一塊白板,沒有記憶也沒有經驗。

4.人類的學習與其他動物的學習幾乎沒有區別。因此,研究不僅可以在人身上進行,也可以在動物身上進行。

5.行為是對刺激的反應結果。因此,所有行為(無論多復雜)都可以被簡化為簡單的刺激反應模型。斯金納的刺激-反應(SR)理論是一個強化正向行為同時消除不理想行為的努力。

6.所有的行為都是從環境中學習到的。新的行為是通過經典條件反射或操作性條件反射學習到的。

主站蜘蛛池模板: 中江县| 辽宁省| 秦皇岛市| 平定县| 静宁县| 大姚县| 和林格尔县| 芒康县| 新竹市| 合山市| 特克斯县| 宿迁市| 徐闻县| 会同县| 和平县| 梁平县| 金川县| 鹿邑县| 兰西县| 姜堰市| 枣庄市| 阿城市| 拉孜县| 常宁市| 东乌| 和硕县| 通渭县| 建始县| 集贤县| 甘孜| 汤阴县| 广德县| 湖州市| 博白县| 顺昌县| 墨江| 六枝特区| 吉安县| 黑龙江省| 沅陵县| 蒙自县|