cq9游戏跳起来72倍视频

書名：機器意識：人工智能如何為機器人裝上大腦
作者名： (印)阿卡普拉沃·包米克
本章字數： 1462字
更新時間： 2021-07-23 16:15:27

2.4.3　源自心理學的概念——行為主義

行為主義是心理學的一個分支，研究個體的環境和隨即產生的行為之間的關系。這基本上是一個“黑箱”方法，與大腦功能不相關。行為主義在20世紀20年代到20世紀50年代間很受歡迎。早期的先驅是巴甫洛夫、Twitmyer和Thorndike，他們各自的研究都是獨立的。巴甫洛夫在19世紀90年代的實驗聚焦于狗的消化，如幽默版的圖2.7所示，狗會先聽到節拍器的聲音，然后立即被提供食物。經過幾次這樣的試驗，觀察到狗聽到節拍器的聲音就會開始分泌唾液。節拍器擁有了刺激唾液分泌的性質。巴甫洛夫的發現證實了之前的中性刺激（節拍器），在多次試驗后變成了刺激唾液分泌的條件刺激。Twitmyer也記錄過相似的結果。這種將生物刺激與先前的中性刺激（如聲音或光線等）配對的動物行為改變被稱為經典條件反射或巴甫洛夫條件反射。

在20世紀30年代，斯金納提出了操作性條件反射，它依賴于通過其結果來改變行為，要么強化，要么懲罰，而不是通過操縱巴甫洛夫條件反射。代表性的基于老鼠的斯金納箱實驗（如圖2.8所示）展示了受試老鼠在按了某個特定控制桿后，會得到積極強化（如提供食物），在按了某個不同的控制桿或按鈕后，會得到消極懲罰（如不提供食物）或積極懲罰（如給受試老鼠輕微電擊或噴冷水）。隨著時間推移，老鼠會更頻繁地按下食物控制桿而避開產生懲罰的控制桿或者按鈕。隨著不斷將刺激作為一種操作反應的方式，刺激會成為對受試者的控制手段。操作性條件反射的5個類型如圖2.9所示。

圖2.8　斯金納箱。研究操作性條件反射和經典條件反射的實驗工具。這個箱子是用玻璃圍起來的，里面有一個按鈕或者按鍵或者控制桿，動物按下去后分別會得到特定的刺激回應（如光或聲音信號），然后投放食物或水作為強化

圖2.9　操作性條件反射。強化和懲罰是斯金納方法的控制機制

強化可以分為兩個方面：在積極強化中，回應跟隨著獎勵，如在按控制桿時提供食物；在消極強化中，回應跟隨著一種不愉快的影響，如讓受試老鼠受到噪聲的騷擾，當它按下一個控制桿或者按鈕時則可以關掉。懲罰也有兩種模式：在積極懲罰中，回應會跟隨著一些不悅的體驗；在消極懲罰中，回應會移除一些愉悅的體驗。兩種情境都不鼓勵回應。區分懲罰與消極強化常常不是那么容易。通常，懲罰以調節恐懼為特征，是主動的回應，而懲罰是抑制性的，在很長時間內，回應只在懲罰解除時出現一次。在消退中，之前強化的回應不再被強化（無論是積極強化還是消極強化），由于不再經歷期望的結果，回應會削弱。斯金納相信操作性條件反射能被用來設計有機體復雜而豐富的行為。

經典條件反射與操作性條件反射的區別在于前者支持反射行為，而后者則通過操縱刺激來控制主體的行為。行為主義直接影響了基于智能體的機器人，結論是：

1.行為主義主要與可觀察的行為相關，不同于像思考和情感這樣的內在事件。可觀察的（即外在的）行為可以被客觀而科學地衡量。內在事件（如思考）應該通過行為主義的術語來解釋，或者干脆消除。

2.人沒有自由意志，一個人的環境決定其行為。

3.在出生時，我們的大腦是一塊白板，沒有記憶也沒有經驗。

4.人類的學習與其他動物的學習幾乎沒有區別。因此，研究不僅可以在人身上進行，也可以在動物身上進行。

5.行為是對刺激的反應結果。因此，所有行為（無論多復雜）都可以被簡化為簡單的刺激反應模型。斯金納的刺激-反應（SR）理論是一個強化正向行為同時消除不理想行為的努力。

6.所有的行為都是從環境中學習到的。新的行為是通過經典條件反射或操作性條件反射學習到的。

官术网_书友最值得收藏!

機器意識：人工智能如何為機器人裝上大腦

2.4.3 源自心理學的概念——行為主義

2.4.3　源自心理學的概念——行為主義