書名: 專業倫理與職業素養:計算機、大數據與人工智能作者名: 匡芳君 陳偉 周蘇主編本章字數: 590字更新時間: 2023-06-28 15:37:49
1.4.1 圖靈測試
1950年,在計算機發明后不久,圖靈提出了一套檢測機器智能的測試,也就是后來廣為人知的圖靈測試。在測試中,測試者分別與計算機和人類各交談五分鐘,隨后判斷哪個是計算機,哪個是人類。當時圖靈認為,到2000年,測試者答案的正確率可能只有70%。每一年,所有參加測試的程序中最接近人類的那一個將被授予由圖靈創辦的勒布納人工智能獎。
到目前為止,還沒有出現任何程序能夠如圖靈預測的那樣出色,但它們的表現確實越來越好了,就像象棋程序能夠擊敗象棋大師一樣,也許計算機最終一定可以像人類一般流暢交談。當那天來臨的時候,會話能力顯然就不能再代表智力了。
數十年來,研究人員一直使用圖靈測試來評估機器仿人思考的能力。如今,研究者認為應該更新換代,開發出新的評判標準,以驅動人工智能研究在現代化的方向上更進一步。新的圖靈測試會包括更加復雜的挑戰,例如,由加拿大多倫多大學的計算機科學家赫克托·萊維斯克所建議的“威諾格拉德模式挑戰”。這個挑戰要求人工智能回答關于語句理解的一些常識性問題。例如,這個紀念品無法裝在棕色手提箱內,因為它太大了。問:什么太大了?回答0表示紀念品,回答1表示手提箱。
也有學者建議在圖靈測試中增加對復雜資料的理解,包括視頻、文本、照片和播客。例如,一個計算機程序可能會被要求“觀看”一個電視節目或者視頻,然后根據內容來回答問題,像“為什么電視劇《天龍八部》中,契丹人蕭遠山的兒子叫喬峰?”