官术网_书友最值得收藏!

第6章 大數據,你還不知道的部分(4)

就像我們在現實中交換電子文檔時,不一定靠U盤這種物理距離最近的方式,可能會采取MSN或騰訊QQ之類的即時通訊,因為它的速度更快、更方便,而且人們不會計較這些文件繞經網絡服務器是否會被長期掃描和監測。這就是技術優勢的巨大作用。

第二,數據傳輸誘導策略。

美國通過擴大數據傳輸帶寬,可以誘導更多的數據流經本國,從它的家門口過,給它做一系列的數據截留分析工作大開方便之門。越多的數據流經美國,它能做的分析監測就越全面,那么它最終的收益就遠遠超過了風險。比如美國曾租用中國的衛星來傳送數據,以提高非洲跟美國之間的帶寬,就是一種付出較小風險獲得較大收益的表現。

第三,控制數據通道,從其他數據源快速收集信息。

這一策略包括與電信運營商的合作和對其數據源的監控。例如,聯邦政府的海外情報監聽法庭要求美國電信運營商(Verizon)每天都要向國安局提交元數據--電話記錄數據,包括通話雙方號碼、通話長度等,雖然不包括通話內容,但已經提交了大部分的個人信息。

第四,通過與民營公司和其他國家建立技術聯盟來收集和控制數據。

綜上,美國最早意識到了需要加強信息管理與網絡安全,而加強的辦法就是用政府的手去控制民營企業及其他國家的相關服務商,建立技術聯盟。

1978年美國國會通過了《外國情報監視法》(FISA),1986年又通過了《電子通信隱私法》(ECPA),1994年通過了《執法通信輔助法》(CALEA),從而建立起了全方位的保障體系,聯邦政府可以從容地對本國及外國進行監聽監視。

最重要的部分是與技術巨頭有關的,即那些控制互聯網的大型公司,在《執法通信輔助法》中規定,執法機關可以根據法院監聽令直接接入電信網絡,啟動電信運營商交換機中的監聽功能。這意味著美國法律要求電信運營商等網絡、通信服務者必須為政府預留一定的接口以備不時之需。

根據《華盛頓郵報》的披露,在“棱鏡”計劃中,一共涉及至少9家美國的IT公司,微軟是在2007年9月11日第一個加入其中的,蘋果公司則是在2012年10月最后一個加入的。另外還包括思科、IBM、谷歌、高通、英特爾、雅虎、臉書和甲骨文等。它們幾乎壟斷了全球IT產業的所有領域,包含了從硬件到軟件再到服務三個層面,自然為美國政府提供了強大的技術支持。

比如,如果你的聯網電腦使用英特爾公司提供的某款芯片,就會發送一個序列號到英特爾公司,這也意味著在這臺電腦上運行的一些信息也可以同時一并發送過去。另外,操作系統是網絡軟件運行的載體,聯網后我們會經常收到自動更新的提示,這意味著壟斷操作系統的微軟公司可以輕而易舉地掌握一臺電腦的網絡活動。同時,由于操作系統在不斷更新,微軟公司通常會最早發現其系統存在的漏洞,他們向政府安全部門提供的漏洞信息,會有助于情報機構攻擊那些還沒有修補漏洞的計算機。

再比如,人們用雅虎郵箱發郵件,用思科的網絡電話通話,用谷歌的地圖標注、搜索,用臉書發布社交狀態,用MSN即時通訊聊天,所有這些網絡活動,都會在各大公司的服務器上留下原始數據,而且還是人們主動提供的信息,自己花錢把信息送上門。

這些公司的服務器是如此之多,它們可以向美國政府開放直接訪問的后門,幫助情報部門讀取數據,甚至能夠全程參與國安局的監控計劃。這些大數據的技術巨頭,成為了政府收集信息和分析數據的絕好幫手,而這在民眾毫不知情的情況下就可以完成。

海外盟友的數據來源包括澳大利亞、英國、日本、加拿大和新西蘭等國家,比如著名的“五眼聯盟”就是由美國、英國、加拿大、澳大利亞和新西蘭五國組成,雙方互通有無,協同收集數據。聯盟成員甚至可以彼此監聽對方國內的數據,繞開本方國內的法律禁區,然后交換數據。第五,建立盡可能多的海外非盟友“數據源”。當然,只有盟友數據源是不夠的,美國還有大量的海外非盟友數據源。

比如斯諾登就透露說,為了竊取中國大陸的數據,美國采取的辦法是直接在中國境內建立數據源合作伙伴。香港中文大學在1995年成立了香港互聯網交換中心,它的前身為港中大連接美國的數據專線,擁有服務于全香港的網絡數據交換服務器。美國在這個基礎上可以方便地潛入進來,對數據進行竊取。

為數眾多的黑客也是這一數據源的提供者,國安局旗下有一個叫作TAO的機構,擁有多達六百名高級黑客,來自世界各地(包括中國)。思科公司提供的設備為這項工作提前留下了后門,盡管思科強烈否認這一質疑,但隨著曝光的深入,否認的聲音已越來越缺乏說服力。

只要能獲得海量的源源不斷的數據,美國強有力的大數據存儲和分析系統就可以派上用場。

第六,建設大型數據中心來保存數據。

為了保存這些海量數據,還需要一個龐大的數據庫和處理中心。NSA在猶他州耗資20億美元建立了一個大型的數據中心,足以保存5000億G的數據,相當于全球500年的通訊量。為了實現這一目標,NSA專門開發了一個叫作Accumulo的大數據存儲系統,并與相關的有軍方背景的民用公司合作,開發這一系統的商用版本,來持續獲取數據利益。

第七,對元數據的挖掘技術,使美國有能力構筑關聯圖譜。

元數據是最基本的數據單位,在移動互聯網快速發展的今天,我們每個人幾乎每時每刻都在產生數據。比如姓名、電話號碼、郵箱地址這些都可以稱為元數據,它可以拿來當作節點,把有過聯系的人、號碼、郵箱用線連接起來,就構成了數據和信息背后的人物關聯圖譜。這表明,元數據雖然單個看起來不怎么重要,但大量集中起來,卻非常便于構建個體之間的關聯。再比如,對電腦來說,元數據記錄了一臺計算機的工作環境,包括操作系統、瀏覽器、應用軟件版本等基本信息,那么收集這些元數據,則是黑客發起網絡攻擊的必備步驟。對元數據的收集與分析能力,說明美國的網絡監控水平已經具備了大數據時代的顯著特征。有了這種對海量元數據的存儲與分析能力之后,這些龐雜的信息經過超級計算機的快速運算,就能從中顯露出不易察覺的規律,從而為情報部門提供有效的情報信息。在大數據時代,美國對于關聯圖譜的挖掘技術進展迅猛,使得從元數據中能夠挖掘的隱私越來越多,簡直到了無孔不入的地步。換句話說,現有的技術可以做到一切:偵測到你每天發送的短信數量、電話頻率以及約會對象,并且深入地探查出你的全部生活和工作習慣,讓你成為一個徹底透明的人。

一項調查顯示,美國國安局擁有一個4.4萬億個節點、70萬億條相關聯的圖譜數據。按照全球70億人口計算,國安局有能力為每人保存將近630種信息,可以分析出每個人多達1萬種的關聯。要知道,我們只需要4個時間點和位置就可以確定一個人的身份了,而且準確性已經高達95%,那么1萬種呢?這一技術的先進程度已超出普通人的想象,相關的技術告訴我們,即使你已隱姓埋名、流落天涯,只要他們有這個意愿,就可以輕松地找到你,并能窮盡你的一切社會關系,甚至比你自己知道的還要多。

第八,強大的分析工具:可視化和實時查詢的大數據系統。

美國國安局還擁有一套大數據可視化和實時查詢系統,名字叫作BoundlessInformant。它的作用在于將監聽、收集到的全球數據進行可視化和能夠實時查詢的分類,把不同的國家、地區用不同的顏色顯示,構建出全球信息分布圖。有了這樣的大數據系統后,就具備了強大的分析能力,不管收集到多少數據,都可以輕松地整理、歸類、分析和預測。

第九,擁有全數據挖掘技術,進行“無死角”數據收集。

美國一方面在挖掘元數據,另一方面也在發展對全數據的收集技術,爭取做到數據收集無死角。像有一種叫作Narus的光纖監聽設備,可以進行內容層監控,還有一種叫作愛因斯坦3號(Einstein3)的系統,可以對數十億郵件的全文內容進行掃描。語音監聽和識別也是這一工作的組成部分,對多語種的語音視頻內容進行分析辨別。

第十,為全球互聯網的發展提供了可能性。

我們已經很難用一個特定的詞匯來形容全球互聯網的結構。但它的主要構成特點我們是清楚的,一方面它就像樹一樣,有根、主干和枝蔓,最后連接到每一個用戶;另一方面它又是平狀的,具有平等和無中心的特點,每一個節點的信息都可以在全球的網絡中自由流通。也就是說從信息流通來看,互聯網是一個扁平的世界,但在管理上,卻仍然是自上而下的結構,有骨干網絡來處理、管理所有的信息。

例如在中國,163和169骨干網承擔著中國80%以上的網絡數據流量,它們統稱為中國公用計算機互聯網(CHINANET),另外還有中國教育和科研計算機網(CERNET),全國科研機構的中國科技網(CSTNET),中國金橋信息網(CHINAGBN)。它們共同組成了由上到下的中國四大骨干網絡。從網絡監控和攻擊的角度來說,自然是從上往下更好,這有利于獲取更多的信息,也擁有更大的控制權限。

從棱鏡門事件我們可以看到,由于具備足夠的資金、技術和不受限制的權力,較大的機構是大數據的最大受益者,它們可以窺探個體的信息和收集、預測人們的關聯數據,達到控制人們需求并實現一系列組織計劃的目的。要想充分防范大數據技術的濫用,就需要發揮我們每一個人的創造性,由人去主導大數據的進程,而不是成為數據可以控制的一部分。

我們每個普通人都需要參與進來,思考大數據技術的合理開發,并加入這個神奇的新時代,成為它的主人。

主站蜘蛛池模板: 应用必备| 南岸区| 繁峙县| 融水| 广丰县| 崇左市| 手机| 广宗县| 沂源县| 舒城县| 内乡县| 饶平县| 三门峡市| 田林县| 肇庆市| 淮滨县| 黑河市| 宝坻区| 郴州市| 淄博市| 文安县| 女性| 石泉县| 南溪县| 房产| 县级市| 拜泉县| 治多县| 铅山县| 榆林市| 呈贡县| 三河市| 庆云县| 安阳市| 峨眉山市| 利津县| 宜君县| 合肥市| 永靖县| 双鸭山市| 谢通门县|