- 大數據云圖:如何在大數據時代尋找下一個大機遇
- (美)大衛·芬雷布
- 2159字
- 2019-01-01 00:13:20
谷歌自駕車的美好未來
如果你使用網絡,就多少會用到谷歌地圖。谷歌的搜索引擎聞名于世,占據了市場主導地位,而谷歌地圖也已累積了超過20PB的數據。換言之,這些數據需要超過82000個MacBook Pro硬盤(每個硬盤容量為256GB)才能存儲下來。而所有的這些數據都已經被自駕車所運用了嗎?答案是:的確如此。根據負責谷歌自駕車項目的斯坦福大學塞巴斯蒂安·特倫(Sebastian Thrun)教授所說,谷歌將一系列地圖數據和實時激光檢測系統、多個雷達、GPS以及其他設備檢測到的信息相結合,使得系統能夠“看到”交通流量、交通信號燈和路況。
自駕車不僅承諾會使道路更加安全,也會通過更好地利用行駛車輛間的空隙使道路更加暢通。據可靠消息,在美國每年約有43000人死于車禍,而每年全球死于車禍的人數為525萬人。
谷歌自駕車雖然還不能自行思考,但是它們在模式匹配上能大有作為。通過結合地圖上的現有數據和車輛傳感器收集的實時數據,車輛可以制訂駕駛決策。通過將不同的交通信號燈的樣子與數據庫進行比對,自駕車可以決定何時啟動、何時停下。當然,如果沒有以下三大要素,這一切不過是空中樓閣。而這三大要素是大數據的普遍主題:
●車上的計算機系統可以獲取大量數據。
●車輛要充分使用傳感器接收的有關其他車輛的位置、障礙物、交通信號燈還有地形等各類實時信息。雖然當下這些傳感器的價格非常昂貴,一輛自駕車配備的所有設備的總價值在15萬美元左右,但在未來它的價格有望迅速走低。
●自駕車要能夠快速處理所有數據,并制訂下一步的實時決策。這一切都是由后座上的少量計算機設備和大量軟件實現。
想想60幾年前,成功預測了艾森豪威爾總統選舉結果UNIVAC計算機,可是有一個車庫那么大呢。
計算機如何讓欺詐無所遁形
以上的一切內容都顯示出計算機非常擅長快速地進行模式匹配,這對于道路行駛或其他方面都非常有用。比如對于檢測欺詐行為來說,快速地進行模式匹配就顯得尤為重要。
我們中的很多人都可能接到過來自信用卡公司反欺詐部門令人毛骨悚然的電話。電話中,我們被告知自己的信用卡信息很可能已經被盜,而此時此刻正有騙子在某個社區五金店以你的名字刷卡消費。引起他們的懷疑的原因可能是,這個剛剛談到的社區五金店,離你有8000公里遠。
可以同時處理大量數據的計算機可以作出更好的決定,而這些決定會影響我們的日常生活。
試想一下你最近一次用信用卡在線支付的場景。當點下“提交”按鈕時,付款頁面的操作會引發一系列的事件:進行中的交易會被計算機用一套復雜的算法來確定是你本人在操作,還是他人在盜用你的信用卡。
問題是,要確定是他人在盜用信用卡還是本人在使用信用卡很不容易。數據泄露的情況這么嚴重,加之網絡上能找到的你的個人信息如此之多,所以在很多時候,盜用者對你的了解可能和你對自己的了解差不多。
計算機系統通過一些基本的方式來識別你是不是本人:它會驗證信息。當你把電話打進銀行卡所在的銀行時,銀行會詢問你的名字、居住地以及你母親的娘家姓,然后將你所說的信息和在銀行文件上記載的信息相比對。也許,銀行還會查看你打進來的電話號碼是否就是他記錄的號碼。如果這些信息都吻合的話,你很有可能就是本人。計算機系統也會評估你的一系列數據點,看這是否能成為證實你是本人的佐證,或者至少減少你是冒名頂替者的可能性。基于這些數據點,該系統至少能夠生成一個置信度。
如果你住在洛杉磯,而你確實是從洛杉磯打進的電話,那你的置信度就會提高。然而,如果你住在洛杉磯卻從多倫多打進電話,則有可能降低置信度。
更高級的評分機制(也稱為算法)會把你的數據和盜用者的數據進行比對。如果打電話的人和盜用者的數據點有很多的相同點,這可能意味著打電話的人是盜用者。如果網站用戶不是從過去的常用地登錄(比方說俄羅斯,而他大部分時候都是從美國登錄),而且他輸錯了幾次密碼,那他有可能是一個盜用者。計算機系統會將所有這些特征與你以及盜用者的普遍行為模式進行比對,以確定置信度應上升還是下降。
如果與你平常的行為有很大的出入,或者說與盜用者的行為模式有許多匹配之處,置信度會降低。而若是與你的平常行為有很多匹配之處,置信度則會上升。然而,對計算機來說,這樣的分析存在兩方面的問題:
●它需要非常多的數據,來識別你以及盜用者的普遍行為模式;
●在計算機已經識別了你們的行為模式之后,它需要在將你的行為與這些模式進行比對的同時,還能夠處理上百萬其他用戶的指令。
因此提到數據分析應用,計算機能通過兩種方式變得更加智能:
●提升用以檢測正常行為和異常行為的算法準確度;
●加大可同時處理的數據量。
真正考驗計算機和計程車司機的就是快速作出決策。倫敦的計程車司機和自駕車司機一樣,需要了解向哪邊拐彎,而且要根據交通和其他現實條件,一次次地作出判斷。類似地,欺詐檢測系統需要在幾秒鐘之內決定是否同意你的交易操作。正如科技公司Terracotta的首席執行官羅賓·吉爾斯洛普(Robin Gilthorpe)所說,“沒有人想被‘拒絕’,特別是在電子商務領域。”如果被拒絕交易的是客戶本人,這就不僅僅意味著丟了一筆生意,還意味著多了一個對你的服務不滿意的客戶。但是拒絕欺詐性交易又是確保非欺詐性交易的關鍵。
如早期的貝寶(PayPal)分析專家邁克·格林菲爾德(Mike Greenfield)所指出的一樣,點對點支付公司貝寶率先發現,公司必須早早創建對抗欺詐的技術,沒有這些技術,貝寶公司就沒法生存下來,而人們也沒法像現在這樣簡單、快捷地進行購買支付和相互轉賬。