官术网_书友最值得收藏!

無法預測之殤

實現準確預測需要一些真實的因素。我們必須掌握足夠多的歷史數據來識別模式——與這些模式相關的事件必須始終發生。而且我們必須有區分疑似事件和真實事件的能力,即眾所周知的排除誤報。但是,僅僅是準確預測還遠遠不夠。要讓預測派上用場,我們還必須具備根據預測及早并快速采取行動的能力。

當地震真正發生的時候,相關數據會非常清晰地表現出來,例如地動山搖。而且一旦其威力夠大的話,停電、爆炸、有毒氣體溢出、火災爆發都可能出現。地震發生之后,除了受災地區發生物理、化學巨變,整個社會的互聯網溝通行為、手機通話行為和移動模式都會發生明顯的可觀察的變化。有興趣的讀者可以閱讀以下三篇論文“Earthquake shakes Twitter users: real-time event detection by social sensors”(發表在2010年WWW大會上)、“Collective Response of Human Populations to LargeScale Emergencies”(發表在2011年的PLoS ONE上)、“Predictability of population displacement after the 2010 Haiti earthquake”(發表在2012年的PNAS上)。這些例子本身就包含了大數據的精髓和理念。——譯者注當然,到那個時候,也就不再需要大量的計算機和天才科學家們來預測災禍了。

所以要起到效用,當下的數據必須預先與過去的數據進行匹配,而且要給我們留下足夠多的行動時間。如果在地震發生的前幾秒才完成匹配的話,也就沒什么作用了。我們需要足夠多的時間得出結論、調動各方資助力量并疏散群眾。而且,我們必須具備快速分析數據的能力,只有這樣,數據分析才能發揮效用。試想一下,假如我們擁有足夠多的數據,它們能讓我們提前一天預測到地震的發生,而我們卻花費了兩天時間進行數據分析,那這些數據和我們的預測結果就起不到什么作用了。

因此,從本質上來說,準確預測地震既是大數據的機遇又是挑戰。單純擁有數據還遠遠不夠。我們既要掌握足夠多的相關數據,又要具備快速分析并處理這些數據的能力,只有這樣,我們才能爭取到足夠多的行動時間。越是即將逼近的事情,越需要我們快速地實現準確預測。不過,在某種程度上,這種預測適用于收益遞減規律。就算我們能在瞬間完成對預測地震所需的海量數據的分析處理,如果沒有留下足夠的時間將群眾調離危險區域,這種分析就沒什么意義。

準確預測需要更多、更好的數據

2012年10月22日,6名工程師因為在預測地震時誤導村民,均被判處有期徒刑6年。這次地震發生在2009年的意大利拉奎拉鎮(L’Aquila),300名村民因此喪生。

大數據能幫助地質學家實現更好的預測嗎?

每年,世界各地約有7000次里氏4.0或更高級別的地震發生。地震測量有兩種,一是著名的里氏震級,二是更現代的矩震級。前者是依據地震所含的能量定級,而后者是通過地震所釋放的能量認定地震等級。

預測地震的時候,有三個關鍵問題必須找到答案:何時、何地、何種震級?在《庸醫游戲》(The Charlatan Game)中,楊百翰大學的馬修·瑪貝(Matthew A. Mabey)認為,雖然地震有預兆,“但是我們仍然無法通過它們可靠、有效地預測地震”。相反,我們能做的就是盡可能地為地震做好準備——它的發生頻率遠比我們想象的要大得多。這些準備包括在設計、修建橋梁和其他建筑的時候就把地震考慮在內,并且準備好齊全的地震應急包,一旦發生大地震,這些基礎設施和群眾都能有更充足的準備。

就像我們小學時都學過的一樣,地震是由構造板塊相互擠壓造成的——構造板塊則是偶爾會漂移的陸地板塊。這種板塊擠壓發生在地球深處,而且各個板塊的相互運動復雜難懂。因此,有用的地震數據來之不易,而要弄明白是什么地質運動導致了地震,基本上不現實。

歸根結底,準確地預測地震,即回答何時、何地、何種震級這三個問題,需要掌握促使地震發生的不同自然因素,以及揭示它們之間復雜的相互運動的更多、更好的數據。

大數據的關鍵之處正在于此:預測不同于預報。科學家能預報地震,但是他們無法預測地震。1906年舊金山發生地震,導致3000余人傷亡,而其何時會再次遭遇這樣的地震?科學家們不能斷言。科學家們只能預報某個地方、某個具體的時間段內發生某級地震的可能性。例如,他們只能說未來30年,舊金山灣有80%的可能性會發生里氏8.4級地震,但他們無法完全確定地說出何時何地會發生地震,或者發生幾級地震。這就是預測和預報之間的差異。

不過,雖然準確預測地震還有很長的路要走,但是黑暗中尚有一線光明,那就是,科學家已經越來越多地為地震受害者爭取到那么幾秒鐘的時間了。

傳統的地震探測儀需要花費3000美金甚至更多,而如今基本的地震探測只需通過連接至標配計算機的廉價的探測儀就可實現,甚至只需通過使用如今很多移動設備內置的動作感應功能就可實現,而這些功能原本是為了導航和游戲設計的。

斯坦福大學的“地震捕捉者網絡”(Quake-Catcher Network, QCN)由參與分布式地震檢測網絡的大約200個志愿者的計算機組成。有時候,這個監測網絡能提前10秒鐘提醒可能會受災的人群。也許10秒鐘看上去不長,但是卻很重要,因為這意味著你是搭乘運行的電梯還是走樓梯,是走到開闊處去還是躲到桌子下面。

“地震捕捉者網絡”就是一個會生成大量數據的廉價監測網絡的典型例子。以前,要捕捉和存儲如此多的數據耗資巨大,但是,正如我們在接下來的章節會談到的一樣,近期的技術進步使得這些數據的捕捉和存儲成本大大降低——有時候甚至比過去便宜了九成都不止。能得到更多、更好的數據不只為計算機實現更精明的決策提供了更多的可能性;也使人類變得更聰明了。

更多的數據,更聰明的大腦

如果你想變得更聰明,現在不必再為此獨自傷神了。最近的研究為你帶來了一個好消息:通過增加儲存的信息量可以擴張腦容量。

為了獲得駕照,倫敦的計程車司機必須通過一個名為“知識”(the Knowledge)的嚴厲考試,以此證明他們已經熟知倫敦市中心的25000條街道布局和20000個地標位置。這些申請者完成所有任務一般需要3~4年,那么,在這些倫敦計程車司機完成“知識”考試的培訓課程之后,真的變得更聰明了嗎?結果證明的確如此。

主站蜘蛛池模板: 五大连池市| 闵行区| 安岳县| 云林县| 门源| 和平区| 邵阳县| 顺昌县| 吉木萨尔县| 肇源县| 新宾| 林芝县| 平舆县| 萝北县| 张北县| 九龙坡区| 滨海县| 广安市| 教育| 卢氏县| 镇安县| 东兰县| 正镶白旗| 丹东市| 荃湾区| 汉川市| 绵竹市| 临城县| 琼海市| 博客| 普陀区| 宁陵县| 全州县| 阳朔县| 都江堰市| 额敏县| 承德县| 韩城市| 富顺县| 满洲里市| 泽州县|