官术网_书友最值得收藏!

追求數量,還是追求速度

科學家一度認為人的大腦容量是固定的。但是倫敦大學醫學院惠康基金會神經影像中心(Wellcome Trust Centre for Neuroimaging)的埃莉諾·馬奎爾(Eleanor Maguire)教授通過研究發現,大腦本質上是有“彈性”的,其容量可以隨著時間而改變。

這項研究追蹤調查了79名計程車司機的學習進展,其中只有39名司機最終通過了考試。那些沒有通過考試的人為自己找了很多的借口,比如說缺乏時間和金錢等,但學習如此龐大的信息體系難度不小卻是關鍵因素之一。據倫敦城市網站顯示,整個倫敦只有25000名計程車司機,換言之,每一條街道大約只有一個司機。研究顯示,經過多年來對倫敦街道資料的學習,這些參與測驗的司機大腦中下丘腦海馬區的灰質有所增多。也就是說,為了儲存必要的數據,這些司機確實新生了很多腦細胞,從而最終使他們變得更聰明。

然而,這些記憶能力的改善是需要付出代價的。據馬奎爾教授另一研究顯示,對這些擁有更大海馬區的司機們來說,他們通過視覺信息學習新路線的能力下降了。

對計算機而言,優勢通常需要犧牲其他方面來換取。儲存大量的數據就意味著需要花費更長的時間進行處理。而儲存的數據越少,得出結果的速度就越快,但是這些結果也就越沒有根據。

拿計算機程序來說,商店里的計算機通過分析已售商品的銷售數據,可以為以后的銷售作出預測。如果計算機程序只能獲取到季度銷售數據,那么肯定會處理得很快,但是這些數據也許不夠詳盡,難以提供有效信息。商場經理可能清楚特定的產品在某個時間段內需求量大,但卻難以制訂出對每天或每小時的銷售情況產生影響的價格決策或者產品布局決策。相反地,如果計算機程序能夠記錄每分鐘的銷售數據,并通過這些數據分析歷史銷售情況,那么就有了更精細的數據資料,可以更好地預測未來的銷售。作者對這個問題的理解稍欠深刻和全面。表面看起來數據越多,粒度越細越好,但實際計算的時候不一定如此,因為粒度細的數據往往包含更多的噪音。昨天銷售了250斤糖炒板栗是有價值的數據,但是昨天下午2:50恰好有一個顧客買了兩斤半的板栗,是多種因素結合的偶然。如果你每天下午2:50都眼巴巴等著一個大主顧,那就真要為自己的智商著急了。實際上,我們在為700多家電子商務和資訊媒體提供用戶下一時刻喜歡看什么、買什么的推薦服務所積累下來的經驗顯示,很多時候利用品類的信息往往比單品的信息預測更準確。數據的粒度和噪音是兩個矛盾體,其帶來的復雜挑戰,決非作者想得那么簡單。——譯者注不過,這需要花費更多的時間。而且,由于數據龐大,程序也許不能一次就把所有的數據處理完,而只能對其中的一部分數據進行處理。

效率的力量

令人驚訝的是,在倫敦擁有執照的計程車司機能夠記住整個倫敦市的地圖(包括查令十字街方圓10公里的地方),而不需要實際的地圖和GPS導航。

如果司機不必時刻緊握方向盤并注意路面情況,也無須快速判斷行駛路線的話,查看地圖也不失為一個可行的辦法。在慢節奏的國家,司機也許會在一開始就計劃好一條線路,然后在必要時停車,隨時對線路作出調整。但問題在于,在倫敦擁擠的街道上,司機絕不會有時間慢慢地計算、再計算。因此,司機必須記下整個倫敦的地圖。計算機系統差不多一直在做這件事,即在處理大量數據的基礎上輸出結果:計算機系統將所有的數據儲存在一個存儲體系中,有時全部儲存在記憶體系中,有時分散儲存于許多不同的物理系統中。我們會在接下來的幾章對此做詳細介紹,還包括一些快速分析數據的其他途徑。

幸運的是,如果你想要腦容量更大,記住倫敦城市地圖并不是擴大你大腦海馬區的唯一方式。另外一項研究帶來的好消息是,鍛煉身體也可以使你的腦容量變大。隨著年齡的增長,大腦會隨之萎縮,通往記憶的通道也會受損。該研究選取120名老人做實驗,發現鍛煉身體使他們的海馬區擴大了2%,而海馬區與改善記憶功能密切相關。換言之,保持大腦足夠的血液流通能防止我們變遲鈍。因此,如果你想保持聰明才智,鍛煉身體吧!

然而,和人類不同,計算機不可能通過到健身房鍛煉就增強記憶儲存能力。對計算機的記憶存儲而言有三種選擇:

●擴大內存容量;

●通過調度讓需要處理的數據進出存儲系統;

●壓縮數據。

很多數據是多余的。回想一下你剛寫的那句話,或者剛做的一些大數字的乘法。計算機通過壓縮重復的字母、單詞甚至整個短語,從而節省出很多空間。

擴大計算機的記憶存取能力代價十分昂貴。一般來說,記憶存取越快就越昂貴。一項消息顯示,隨機存取存儲器(RAM)的存取速度是磁盤存儲器的10萬倍,但價格也貴了100倍。

不僅記憶存取本身價格不菲,記憶存取量增加的話,隨之而來的其他花費也不低。一臺計算機一般只能裝配一定量的記憶芯片,而且每個記憶棒也只能容納一定量的記憶芯片。電源和制冷裝置的容量也同樣需要考慮。電子線路越多,消耗的電能也就越多;消耗電能越多,產生的熱量越多。熱量需要散發,而這一過程又需要更多的電能(并產生更多的熱)。這些因素綜合起來就使看似簡單的擴大記憶容量的任務變得相當復雜了。

或者,計算機也可以僅僅使用原始記憶存儲器,對儲存的必要信息進行內外交換。比方說,計算機并不需要一次查看所有可獲取的交通事故和股票價格數據,因此計算機能在加載昨天數據的同時,替換掉前天的數據,依此類推。這個方法的問題在于,如果你要找出維持數天、數周甚至是數年之久的模式,那么進出交替所有數據就非常耗時,而且不容易總結出模式。

與機器相比,人類不需要很多能量就可以讓大腦發揮更多作用。大腦在“持續地吸吮大量的能量”,但是這些能量與計算機相比簡直微不足道。“一個成年人大腦運轉功率大約只有12瓦特,是一個標準的60瓦燈泡功率的1/5。”相比之下,“IBM公司的沃森(Watson)超級計算機雖然擊敗了《危險邊緣》(Jeopardy!)節目的冠軍,但它需要90個IBM Power 750服務器支持,每個服務器功效大概是1000瓦。”而且,每個服務器重約54千克。

因此,說到大數據,其挑戰之一是使計算機變得更智能,挑戰之二是使其變得更有效率。

計算機戰勝人腦?

2011年2月16日,IBM打造的“沃森”超級計算機在《危險邊緣》節目中擊敗了兩名冠軍選手,贏得了77147美元。事實上,為了獎勵“沃森”在人機大戰中的獲勝,它得到了100萬美元的獎勵。但是“沃森”真的和節目中的其他兩位選手一樣聰明嗎?“沃森”能獨立思考嗎?

研發、建造“沃森”大約花費了3億美元的研發投資——它擁有2億頁的存儲容量以及大約2800個處理器,毫無疑問,回答《危險邊緣》的問題,“沃森”非常在行。但很難說“沃森”的智商和電影《2001太空漫游》(2001: A Space Odyssey)中高智能計算機HAL表現出的智商是一樣的。“沃森”沒法理解節目中的另一個選手肯·詹寧斯(Ken Jennings)在節目中給出的最終答案,也無法像肯·詹寧斯一樣玩冷幽默——肯·詹寧斯的“戰敗宣言”寫道:“我,代表我自己,歡迎這位新的計算機霸主”。更重要的是,“沃森”無法聽懂人類語言,相反地,“沃森”只能以書面文本的形式處理《危險邊緣》中提出的問題。

計算機如何聽懂人類語言

為什么“沃森”無法理解人類的語言呢?因為“沃森”的設計者認為,要創建一個計算機系統使沃森能正確回答《危險邊緣》的問題已經夠復雜的了,而一旦把理解人類語言這個問題再引入進來,這種復雜度還要再加深一層。

雖然在識別人類語言這一問題上,我們已經取得了重大進展,但是離完美解決這一問題還有很長的路要走。正如查爾姆斯理工大學(Chalmers Institute of Technology)的馬庫斯·福斯伯格(Markus Forsberg)所指出的一樣:理解人類語言可不是件簡單的事情。

語言看上去至少滿足大數據的一些要求。通過分析無數的語言,計算機可以建立起識別模式,而當計算機再次碰到該語言的時候能夠識別它。但計算機在試著識別語言的時候仍面臨著很多挑戰。正如福斯伯格所說,我們不僅使用語言的真實聲音來辨別它,而且還運用了大量的語境知識來理解它。盡管單詞“two”和“too”的發音相同,但它們的意義大不相同。而這只是識別語言的眾多復雜性的開端而已。還有其他復雜性因素,例如我們說話的語速、口音、背景聲音和語言本身的連貫性——我們不會每說一個字就停一下,因此把單個的詞轉換成文本來理解并不是解決語言識別問題的可取的方法。

即使是組建文字也并非易事,看看以下由福斯伯格提出的例句便略知一二。這些例句讀音相近,意思卻有天壤之別。

●It’s not easy to wreck a nice beach;

●It’s not easy to recognize speech;

●It’s not easy to wreck an ice beach.

歸功于現代計算機的能力和速度,加之先進的模式識別方法,計算機正不斷改進。微軟研發組織的管理者表示,公司研發的最新語音識別技術比之前的版本精準度提高了30%,換言之,舊版本每4~5個字中有1個字會識別錯誤,而新版本每7~8個字才會出現1個錯誤。模式識別也會常常用于機器翻譯等任務,不過用過谷歌翻譯的用戶都明白,這些技術仍需不斷完善。

同樣地,計算機要想能夠創作具有原創價值的專著,還有一段很長的路要走。有趣的是,人們一直在做這樣的嘗試。在最近的一項實驗中,一位程序員創建了一系列的虛擬程序,來模仿猴子在鍵盤上隨意打字,目的則在于回答“猴子是否可以再創莎翁作品”這個經典問題。不過計算機正在不斷地變得更加聰明,如今甚至聰明到可以進行自我操縱的程度。

主站蜘蛛池模板: 栾川县| 灵寿县| 中阳县| 靖远县| 金坛市| 滕州市| 武穴市| 绥宁县| 获嘉县| 修武县| 循化| 建昌县| 乐清市| 江源县| 太谷县| 深泽县| 孝昌县| 娱乐| 行唐县| 仁怀市| 安仁县| 池州市| 恭城| 什邡市| 苏尼特左旗| 舟曲县| 图们市| 金昌市| 二手房| 长汀县| 彝良县| 额济纳旗| 从江县| 宜黄县| 灵武市| 会昌县| 内乡县| 柳州市| 大姚县| 奉化市| 无极县|