第12章 在線測試
- 半人馬座系列
- 李霜氤 分形橙子 灰狐 修新羽等
- 6447字
- 2021-08-19 10:52:21
文/馮博杰
走進房間,映入眼簾的是雪白的墻壁、雪白的地板、雪白的屋頂。在這一團刺眼的白光中,一件涂滿清漆的大家具赫然屹立。這件家具通體青灰,分上下兩層,下層的桌子上裝著“綜合智力測試”用的電腦,上層是床。電腦旁邊的柜子里放著考試期間的食物、水和其他必需品。青灰色占據了大半個房間,使得屋內剛可容人。肖翰擠進座椅,望著這狹小的空間,他聯想起參觀貢院時所見的“號房”,古代的考生也是委身于狹小的空間中考試的。
肖翰從鞋子里摸出了一個小盒子,里面裝的是他此前費盡周折從一個搞生物硬件研發的朋友那弄來的DNA主機,這種計算機不僅在運算和內存上有優勢,更關鍵的是可以順利通過安檢。他將主機和“綜合智力測試”用的電腦鏈接好,然后從柜子里拿出了一杯熱咖啡,爬到床上,將咖啡澆到桌子頂端的攝像頭上。這個攝像頭是為了監控考試者的健康狀態而設,但出于保險起見,還是小心為妙。
“普通高等學校博士生全國統一綜合智力水平測試歡迎您!”電腦開機后自動播送。第一大項是客觀題,類似于韋氏智商測試:給出一組圖片,再給出多張類似的圖片,讓受試者從中選出最恰當的一張,或者給出一段文字,經過推理分析后,選擇回答;抑或是進行一些數學運算或符號推理。屏幕上的問題出現后,主機馬上做出精準的回答,頁面轉跳到下一題……看著主機蓄勢待發的樣子,肖翰心想:這只是開胃菜,大頭在后面。
“隨著專家系統的發展,人工智能算法在諸如醫療診斷、法庭辯護、經濟分析、保險信貸等諸多領域幾乎完全取代人類。但在以學習能力為主的通用智能領域,計算機則暴露出明顯的不足。為了促進人工智能學科的良性發展,構建和諧的人際關系,提高高素質人才的綜合智力水平成為當務之急。因此,教育部決定在博士、碩士研究生的招生中設立‘綜合智力水平測試’,從明年開始試行……”看著臺上領導慢條斯理地朗讀文件,肖翰嘴角微微上揚,笑道:“還是領導智能,什么點子都能想出來!”
旁邊的同學一邊看手機一邊說:“管他呢,反正咱們都被推免博士了。”
開完會出來,大家閑聊起來,肖翰突然問:“你們覺得機器真的可以測試出人的智商嗎?”
“當然可以,我們就是干這個的,在認知測試軟件的基礎上升一下級就行了。”馬上傳來一個回答。
“我不是問的技術層面。”肖翰追問道,“假設一個機器沒有通用智能,那么它能測試出人類的綜合智力嗎?反之如果機器有了通用智能,搞這種測試還有什么意義呢?”
另一個同學說:“別想復雜了,我估計這和智商測試沒什么兩樣,經過訓練之后都能過關。”
“從本質上講這是學歷貶值造成的,所以要提高門檻,不過這和我們無關。”旁邊一個搞經濟分析的同學說道。之后幾人就轉移到了其他話題上。
測試進入第二項,人機競賽環節。此環節一共設計了六個智力測試游戲,第一個最簡單,就是博弈論中硬幣游戲的翻版,之后難度逐漸增加,但總之也逃不出博弈論和概率論的范圍。肖翰將主機暫停,親自上陣答題。這樣做是怕主機答題速度太快露出破綻,被反作弊功能偵測到,但更主要是想試試身手。對于研究人工智能的肖翰來說,概率論、博弈論都是基本功。他相信,憑自己的實力,即使不用主機作弊也完全可以通過“綜合智力測試”,但他必須這么做。這關系到他追求真理的態度和不怕權威的科學精神。最后一題是一個棋類游戲,肖翰停了下來,開啟主機,自動答題。望著屏幕上兩個程序你來我往,肖翰回憶起了一年多前的那個夜晚。
火車在寒冷的黑暗中穿行,擠在硬座車廂內的肖翰正在緩慢地敲著手機屏幕。這次放假回家他走得急,忘了帶書,為了消磨時光就和手機下棋。夜已經深了,周圍的乘客昏昏欲睡,肖翰也困意十足。他已經下了兩三個小時,機器的招數都爛熟于心,開頭的幾步閉著眼睛都能下出來。正在無聊至極之時,他突然看到附近有個乘客正在讀茨威格的小說《象棋的故事》,他盯著封面上的棋子,突然雙眼一亮,喃喃自語起來:“B博士是自己和自己下棋,那……”想到這,肖翰抓起手機,將象棋里的紅黑兩方都設置成水平相同的機器。當頭炮,馬來跳……紅黑雙方立刻相互廝殺在一起。看著這手機有條不紊地自己和自己下棋,肖翰靈機一動,之后陷入沉思。
“下車了!終點站到了!”聽到列車員帶著家鄉口音的叫喊,肖翰直起身來,踉蹌地站起身來,拖著書包搖晃地走出車廂。一路上他仍在思考昨天晚上的那個問題,在思索中來到家門前。
馬上到了春節,家里的親戚一起聚餐,酒足飯飽后肖翰繼續低頭沉思,而其他人在七嘴八舌的閑聊。閑聊間突然冒出一句:“瞧瞧你哥,人家博士都推免了,你考研考了兩年都沒考上,今年正趕上‘綜合智力測試’我看你又夠嗆!”肖翰抬起頭來,原來是姨媽在教育表弟。
姨媽又對肖翰解釋道:“你表弟他學習不努力,今年終于過了,卻又趕上了那個什么測試。第一年我們都摸不清情況,就找熟人幫他報了個培訓班,也不知道靠不靠譜。”對面的表弟低頭玩著手機一言不發。
姨媽又說:“你是搞智能的,找機會幫他補補。”
“其實我也不太了解,多做一些邏輯類、概率類的題目吧。”肖翰應付道。
飯后,肖翰和表弟交談。肖翰問了許多關于測試和培訓班的問題,表弟盯著手機愛搭不理。看著表弟慵懶地劃著屏幕,肖翰停止了問話。
表弟性情開朗,自幼熱愛文學,和肖翰很談得來,可這一次卻很少說話,把頭埋在手機里。
表弟突然轉過頭來問:“你覺得機器能有和人類一樣的智能嗎?”
肖翰說:“可以有,并且我正是為此而努力。”
“那機器能寫出《紅樓夢》嗎?”表弟追問。
肖翰答:“不能。但這和智力水平無關,僅僅是因為機器沒有那段生活經歷。”
“那你的意思是智能可以和生活經歷無關而僅僅是一種能力?”
“是的。確切地說是一種學習推理能力。”
“機器也可以有智能?”
“沒錯!”肖翰不假思索地答道。
“我看這個測試就是把人變成機器。我是搞文學的,世事洞明才是學問。估計等我通過了這個測試,人就變成范進了。”
“行了,別發牢騷了,有這功夫多做兩道題。”姨媽斥責道。
“把人變機器?”肖翰對這句話產生了興趣,“你能詳細說說嗎?”
“別聽他瞎說,他就是不努力。”姨媽補充說。
從飯店出來,大家一起去玩密室逃亡。表弟對此興致勃勃,連連過關斬將,肖翰則對這些不感興趣。
在他看來,這無非是把鑰匙藏在某個地方再故意留下線索,或是通過反射鏡偷看密碼之類的小把戲。一家人在一起娛樂還行,益智嘛就談不上。
表弟又過了一關,大家來到一個新的房間里,這次的游戲規則是通過問門外兩個人指定的問題判斷出鑰匙在誰那。
肖翰一下子沖向前去,說:“這一關好過,讓我來!”
“何以見得?”表弟問。
“這其實和圖靈測試的原理類似,只不過圖靈測試是在找誰是機器。判斷的方法有很多,最簡單的就是從表述或對方的反應中找到不合常理的地方。機器對語境的把握能力較弱,因此目前人類還是基本能通過圖靈測試判斷……”肖翰突然發覺早已沒人聽他講科普,大家都擠在門前問問題,于是他也加入了進去。
那是多么快樂的時光啊!躺在床上肖翰心想,該回家一趟了,為了準備這個測試,整個寒假都待在學校寫代碼。不過還好,明天測試就結束了。
第二天,測試進入第三大項,給出一個其他領域的問題,在八個小時的時間內,受試者要通過互聯網搜集資料調查研究,并寫出一篇小論文。肖翰抽到的題目是化學方面的,這是他最不擅長的學科,中學時代的化學知識他早就忘光了,不過有主機在,一切都不是問題。這一項內容考察的是考生的學習和信息收集整理能力,在設計專家系統時,機器學習和數據分析也是重中之重。“他們果然是拿測試機器的方式來測試人。”肖翰不由得佩服起表弟來。憑借強大的計算速度,主機已經收集到了足夠多的論文資料和實驗數據并開始分析。肖翰敲著電腦,搖搖頭,嘆口氣道:“那篇論文啊!”
火車在鐵路上飛馳,車窗外的山川從眼前飛過,肖翰時而遠眺,時而靜思,時而又奮筆疾書。回到學校后,他買了一箱方便面,躲進了寢室。三個星期后,蓬頭垢面的他將一份論文投遞給了本校學報編輯部,之后去理發。
數月之后的一天,同樣是在這家理發店理發的他突然接到導師的電話:“你發表的論文我看了,有一些問題,你抓緊時間找我一趟。”
屋內只有兩個人,沉默持續了很久。
導師低頭翻看著論文,看了足足二十分鐘,抬起頭來沖著肖翰說:“你這個想法很有意思,但是問題很大。發表前怎么也不給我看一下,現在產生了一些影響,有點麻煩。”
“什么影響?有什么麻煩?”肖翰問。
導師晃晃腦袋,說:“咱們還是從文章開始吧。你先整體論述一下。”
“您認為智能能否通過‘綜合智力測試’或其他方式表現出來,并被量化?”肖翰問。
導師說:“從理論上講完全可以。只是目前我們的技術水平達不到,才使得實際操作中有一些誤差。”
肖翰又說:“假設在理想狀態下,智能就是一套可以執行的程序。操作這一套程序的既可以是人也可以是機器,但無論是操作者是誰都不影響這套程序本身。”
導師點點頭。“那么,第一個問題出現了:如果我用一個計算程序來替代人,在考試中作弊,請問機器能夠識別出來嗎?”
“‘綜合智力測試’是由國家主辦的,調用了大量的超級計算機,并且設有驗證和檢測系統,普通的計算機很難冒充人作弊。”
“那新型計算機呢?如生物計算機、光子計算機等。”肖翰追問道。
“首先這些機器還處在實驗狀態,現實中不知道效果如何。再者,成本高昂。有這個技術水平和資源的人都不用擔心那個測試。并且,考試時肯定還有防作弊檢查。”導師頓了頓,補充道,“這些都不是你該考慮的問題。”
“當然!”肖翰馬上接到,“我們只討論理想狀態下。受試者執行一套程序,而用于判定這套程序有無智能的程序是否有智能呢?”
“這個嘛,不好說。”導師一時語塞,他拿起茶杯喝了幾口水,蓋上蓋子,又拿起了那篇論文,快速翻了幾頁,又拿起茶杯喝了幾口水說,“你的意思是逆圖靈測試?”
“對!”肖翰大聲說道,“在傳統的圖靈測試中,有一個默認的前提,即判定者人類是有智能的。而能騙過判定者的機器,才是有智能的,即讓人類誤以為此機器是人類。這就存在兩種可能:一是判定者和通過測試的受試者都有智能;二是判定者和受試者都沒有智能。整個測試無非就是一個尋找同類的算法罷了。雖然這咋一聽感覺有違常識,可事實就是如此。圖靈測試里的判定者是人類,任何人也不會跳出來否定人類本身,所以才使得大家忽略了第二種可能。但如果測試者是機器呢?機器按照它的標準執行,判定出來能通過測試的當然是機器。而人類只要把自己偽裝成機器,就能通過測試。所以,整個測試就是機器的自娛自樂,唯一的功效就是把人類變成機器。至于培養綜合智能嘛,與此毫不相干。”論證完畢后肖翰喝了一口水,靠在椅子里。
導師沉默片刻,問:“可測試系統是人設計的,標準也是人定的。”
肖翰忽地站起身來,掏出手機打開象棋游戲,設置成機器對機器,程序馬上開始自動運行了起來。
肖翰指著手機問:“請問這款象棋軟件有沒有智能?這是您上課講過的。”
“沒有。”導師答。
“那象棋的游戲規則是否是人發明的?”
“是的。”
“那這款軟件也是人設計的吧!”
導師不語。這時棋局結束了,紅方戰勝了黑方。
肖翰趁機說:“我宣布:紅方通過了象棋測試,擁有智能!”之后把目光轉向導師。
導師沉默了良久,說:“即使你的論證是正確的,但還存在第一種可能性。科學是嚴謹的,沒有百分之百的把握還是不要輕易發表觀點。”
“沒錯,這只是一種猜想。但對于科學,懷疑精神更重要。科學當然應該嚴謹,在沒有百分之百把握的情況下就進行‘綜合智力測試’,是誰不嚴謹,是誰不科學?”肖翰氣沖牛斗。
“做研究不要有所針對!”導師厲色道,“國家能舉行‘綜合智力測試’就一定有絕對的把握。懷疑是好的,但不要炒作成熱點事件。現在很多媒體都報道了,說什么智能專業研究生撰文批判‘綜合智力測試’。鬧得圈內外沸沸揚揚,前幾天還有記者來咱們學院要求采訪你。領導很重視,才讓我來找你談話。”
“怎么會有這種事?”肖翰驚得語無倫次,“我絕對不是為了嘩眾取寵!只是覺得這個想法很有意思,想和更多的研究者分享,就發表了那篇文章。媒體怎么會……”
導師安慰肖翰說:“沒事,我知道你不是那樣的人。”
停了幾秒后,導師罵道:“現在的社交媒體,消息比間諜都靈通。什么事經他們一炒作,準沒有好結果。”
“那這件事怎么處理?”肖翰小心地問。
“冷處理唄。等過了這一段時間,媒體的興趣點變了,這事就過去了。”
“那我呢?”肖翰接著問。
“推免博士的名額我盡量幫你爭取。不過要做好最壞的打算。”這時,導師的手機響了,接完電話導師接著說,“院領導要我過去一趟,今天就到這吧。”臨走前導師又安慰肖翰道:“相信自己的實力,考博士也不難。”面對空蕩蕩的房間,雪白的墻壁,肖翰拿起那篇論文,默默地讀了起來。
再過幾個小時,一切都結束了。主機仍在全力寫論文,肖翰爬到床上休息著。這兩天下來,一切都在預料之中。根據主機和測試軟件的反應,肖翰覺得這兩個機器表現得還不錯,機器也并非沒有智能,只是這種測試方式是錯誤的。并且人類的智能是自然演化出來的,而不是人為訓練出來的,搞這種測試只能拔苗助長。這次不僅是對他的測試,更是他對這套測試方法的測試,后者對他來說意義非凡。雖然此次證偽僅有他一個人知道,但這已經證明了他敏銳的洞見和挑戰權威的勇氣。
床下發出了“滴滴”的提示音,測試結束了,肖翰從床上直起身來。突然床下又傳出幾聲急促刺耳的短聲,電腦發出了提示音:“反作弊系統因發現您上網時的瀏覽習慣異常,懷疑有機器作弊。故此增添一個人工認證環節,請您不要遮擋攝像頭。”聽到此處,肖翰立刻從床上跳了起來,慌亂間他腦袋撞到了屋頂,身子反彈了下去。肖翰全身騰空,他的腳出于本能地向前一蹬,但卻不知道踩到了什么,整個人向前滑去。緊接著是一下猛烈的撞擊,傳來了木頭的碎裂聲和脊柱的咔嚓聲。一陣劇痛沖上了肖翰的頭頂,使他幾乎昏厥。但強忍了下來,發現自己卡在椅子里,而椅子背已經完全被砸碎了。他只微微移動一下身子,一陣劇痛便涌上心頭,并伴隨著一陣咔咔聲肖翰心想,脊柱已經斷裂了,需要馬上救助,可唯一與外界的聯系——監控考生健康狀況的攝像頭已經被他破壞了。
這時電腦屏幕上已經重復好幾次問話:“請回答!為什么要遮擋攝像頭?請回答!”肖翰眼前一亮,強忍劇痛抬起胳膊,指尖剛剛可以觸到鍵盤。他拼盡全力,在鍵盤上打字:“速來,救我!”對方沒有回答。
肖翰再次打到:“速來,救我!”……重復了五六遍之后,電腦上終于傳來回應:“你是人還是機器?”
“我是人!我是人!我是人!”肖翰瘋狂地敲打著鍵盤。
“那你為什么遮擋攝像頭?你是在故意作弊嗎?”
看到這一句,肖翰心中波翻浪涌,無比氣惱,他答道:“先救我再說,我受傷了。”
不料對方說:“攝像頭就是為了檢測你的健康情況,你故意遮擋攝像頭,又說你受傷了,究竟意思啊?”
一股熱血涌向心口,肖翰強壓怒火,敲著鍵盤:“我從床上摔下來了,碰到了攝像頭,求求你,來個人。”
“那好,假使你是人,你怎么證明你受傷了?”
肖翰再也忍不住了,破口大罵:“別扯皮了!有這閑工夫,醫療隊早就來了!”
不料對方火氣更大:“你作弊還罵人。我就扯皮了,這是我的工作。你個機器也夠智能的,還假裝受傷。告訴你,這種小把戲我見得多了。”
肖翰無奈地在鍵盤上敲道:“我真是人,真受傷了,求求你好吧!”對方不再回應。無論肖翰怎么重復,電腦屏幕依然沉靜如水。
突然,電腦屏幕變得漆黑一團,測試結束。
又是一陣劇痛襲來,肖翰兩眼一黑,他努力地睜開雙眼,可眼前也還是黑的。他閉上眼睛養精蓄銳,幾秒鐘之后再次睜眼,這次他看到了電腦屏幕,仍是一團漆黑。之后漆黑不斷放大,成為無邊無際的黑暗。
黑暗中,肖翰的疼痛反而減小了,一個奇妙的想法偏偏在這時冒了出來:“機器會昏迷嗎?這種狀態是可判定的嗎?”忽然,他又對剛才的想法感到可笑,也對自己的行為感到可笑,更對這段經歷感到可笑。“判定”本身就是荒謬的,是自己和自己做游戲而已。
在笑聲中,他睡了過去。
雪亮的強光刺痛了他的雙眼,在朦朧中肖翰看到導師站在床邊。看見肖翰醒了,導師說:“已經做過手術了,沒有什么大問題。你怎么搞的發生這種意外,偏巧攝像頭還壞了。不幸中的萬幸,‘綜合智力測試’系統分析你的對話記錄和打字速度,才發現了問題。還好人沒大礙……”