- 地理空間大數(shù)據(jù)開發(fā)利用
- 程曉波
- 13237字
- 2019-09-09 16:39:49
第一章 地理空間大數(shù)據(jù)的內(nèi)涵
第一節(jié) 有關(guān)概念和理論
一、地理空間大數(shù)據(jù)的內(nèi)涵介紹
在大數(shù)據(jù)技術(shù)對地理信息產(chǎn)業(yè)的影響下,通過地理信息采集的大數(shù)據(jù)化,實(shí)現(xiàn)了大數(shù)據(jù)技術(shù)與傳統(tǒng)的地理信息技術(shù)的有效融合,從空間數(shù)據(jù)庫到大數(shù)據(jù),從輔助型GIS到知識發(fā)掘型GIS,逐步演變?yōu)閺V泛意義上的地理空間大數(shù)據(jù)。地理空間大數(shù)據(jù)的基本內(nèi)涵如下。
(一)地理信息采集的大數(shù)據(jù)化
隨著大數(shù)據(jù)技術(shù)的不斷更新與提升,傳統(tǒng)的地理信息大數(shù)據(jù)正在通過更加安全、規(guī)范的方式得到搜集、應(yīng)用和推廣。在新舊技術(shù)的結(jié)合下,通過探測和遙感所產(chǎn)生的數(shù)據(jù)、歷史數(shù)據(jù)和“過時的”數(shù)據(jù),經(jīng)過合理的技術(shù)處理和完善,實(shí)現(xiàn)了大量數(shù)據(jù)的乘數(shù)式增長,產(chǎn)生了源源不斷的數(shù)據(jù)流,形成了有重要應(yīng)用價值的地理空間大數(shù)據(jù)池。
同時,隨著數(shù)據(jù)采集途徑的不斷增加,地理信息數(shù)據(jù)出現(xiàn)并被獲取的速度在加快,頻率在提升,數(shù)據(jù)內(nèi)容在不斷豐富。在射頻技術(shù)、傳感器技術(shù)、衛(wèi)星導(dǎo)航技術(shù)、攝影技術(shù)的基礎(chǔ)上,在社交網(wǎng)絡(luò)和平臺不斷深化應(yīng)用的推動下,產(chǎn)生了大量實(shí)時的個人數(shù)據(jù)、行業(yè)數(shù)據(jù),形成了地理空間信息的聚集化發(fā)展趨勢。
(二)從空間數(shù)據(jù)庫到地理信息大數(shù)據(jù)
空間數(shù)據(jù)庫作為專用型數(shù)據(jù)庫,特點(diǎn)在于采用二維表結(jié)構(gòu)的技術(shù),將空間元素的坐標(biāo)數(shù)據(jù)置于屬性字段中,基于空間元素的幾何特征進(jìn)行分類,針對空間數(shù)據(jù)的特性進(jìn)行有限存儲,建立面向?qū)ο蟮年P(guān)系型空間數(shù)據(jù)庫,實(shí)現(xiàn)對結(jié)構(gòu)化空間數(shù)據(jù)的有效操作和管理。
二、地理空間大數(shù)據(jù)的類型和特點(diǎn)
(一)地理空間大數(shù)據(jù)信息系統(tǒng)數(shù)據(jù)類型
地理信息系統(tǒng)(Geographic Information System或Geo-Information System, GIS)包含的數(shù)據(jù),分為基礎(chǔ)空間大數(shù)據(jù)和非空間大數(shù)據(jù)。基礎(chǔ)空間大數(shù)據(jù)是指GIS系統(tǒng)中存儲、傳輸?shù)目臻g數(shù)據(jù)、專題數(shù)據(jù);非空間數(shù)據(jù)是指數(shù)據(jù)的請求、命令等。
從地理空間信息的數(shù)據(jù)源來看,地理空間大數(shù)據(jù)可以劃分為:地圖數(shù)據(jù),專題數(shù)據(jù),相關(guān)文本、聲音、圖像、視頻等多媒體數(shù)據(jù),標(biāo)圖數(shù)據(jù),客戶請求命令,用戶的身份、口令、互聯(lián)網(wǎng)協(xié)議地址(Internet Protocol Address, IPA),服務(wù)器通知等。
(二)地理空間大數(shù)據(jù)的特點(diǎn)
和其他類型的大數(shù)據(jù)相比較,地理空間大數(shù)據(jù)比一般信息數(shù)據(jù)更為復(fù)雜。具體表現(xiàn)為:
(1)數(shù)據(jù)類型多樣。既有屬于地圖數(shù)據(jù)的幾何數(shù)據(jù)、屬性數(shù)據(jù)和空間關(guān)系數(shù)據(jù)、地圖數(shù)據(jù)元數(shù)據(jù),也有非地圖數(shù)據(jù)如文本、圖片,甚至還有命令、請求等數(shù)據(jù)。
(2)數(shù)據(jù)操作流程復(fù)雜。地圖數(shù)據(jù)的操縱不但需要一般的數(shù)據(jù)檢索、修改等功能,而且還需要一些特有的檢索方式,如定位檢索、拓?fù)潢P(guān)系檢索等。
(3)多途徑數(shù)據(jù)輸出方式。除具體數(shù)據(jù)的表現(xiàn)形式外,還可以通過報表、圖形等輸出。
(4)數(shù)據(jù)存儲空間巨大。地圖數(shù)據(jù)來源多樣,除測量、統(tǒng)計數(shù)據(jù)、文字資料之外,還有地圖、遙感圖像等圖形圖像數(shù)據(jù),這些數(shù)據(jù)需要巨大的存儲空間。
三、地理空間大數(shù)據(jù)的核心技術(shù)與應(yīng)用
對于未來地理空間大數(shù)據(jù)技術(shù)的發(fā)展,專家學(xué)者們已經(jīng)提出諸多觀點(diǎn)。美國科學(xué)院地理信息科學(xué)院院士Michael F·Goodchild在如下幾個方面陳述觀點(diǎn):①GIS應(yīng)用將會從室外走進(jìn)室內(nèi);②需要更有效的室內(nèi)定位方法。要實(shí)現(xiàn)上述目標(biāo),必須有新信息通信技術(shù)的強(qiáng)力支撐。云計算、物聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)這些新技術(shù)的興起,為地理空間大數(shù)據(jù)的發(fā)展提供了強(qiáng)有力的技術(shù)支撐;另外,地理空間大數(shù)據(jù)的發(fā)展為這些新技術(shù)提供了新的應(yīng)用背景和巨大的發(fā)展機(jī)遇。
云計算、物聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)等新型網(wǎng)絡(luò)技術(shù)環(huán)境下,實(shí)現(xiàn)地理空間大數(shù)據(jù)的共享,能夠極大地加快地理空間大數(shù)據(jù)和其他領(lǐng)域信息的共通,加快數(shù)據(jù)應(yīng)用平臺的建設(shè),拓寬大數(shù)據(jù)的應(yīng)用領(lǐng)域;同時,地理空間大數(shù)據(jù)的廣泛應(yīng)用,可以推動思維方式的轉(zhuǎn)變和認(rèn)知的提升。地理空間大數(shù)據(jù)成為普通民眾生活的一部分,其現(xiàn)實(shí)應(yīng)用正在逐步改變?nèi)藗兊纳罘绞健?/p>
(一)云計算和虛擬化技術(shù)
云計算是一種新型計算模式,在云計算環(huán)境下,通過整合分布式資源,構(gòu)建應(yīng)對多種服務(wù)要求的計算環(huán)境,滿足用戶定制化要求。云計算以資源租用、應(yīng)用托管、服務(wù)外包為核心,通過網(wǎng)絡(luò)訪問,按使用量付費(fèi)的模式,實(shí)現(xiàn)對資源的共享及高效利用。
1.云計算的特征及應(yīng)用優(yōu)勢
1)云計算的特征
云計算的典型特征表現(xiàn)為:
——使用者選擇的自主性。用戶可以根據(jù)具體的需求來做出判斷。
——網(wǎng)絡(luò)訪問的便利性。
——數(shù)據(jù)資源的聚集性。提供服務(wù)的一方,可以通過專業(yè)優(yōu)勢,匯集數(shù)據(jù)并進(jìn)行資源最優(yōu)配置。
——實(shí)現(xiàn)計量付費(fèi)服務(wù)。云系統(tǒng)利用一種計量功能來自動調(diào)控和優(yōu)化資源利用,根據(jù)不同的服務(wù)類型按照合適的度量指標(biāo)進(jìn)行計量。
——資源匹配的靈活性。云計算可以根據(jù)客戶的個體需求,實(shí)現(xiàn)資源的按需提供。
——技術(shù)的公開性。云計算的技術(shù)對于最終用戶是透明的。
——服務(wù)的可靠性和有效性。這也是云計算的基本功能,在發(fā)展中不斷改進(jìn)和優(yōu)化。
云計算的核心特征在于彈性,可以實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),在帶來安全方面優(yōu)點(diǎn)的同時也引起安全方面的顧慮。但事實(shí)證明,云設(shè)施的安全性比大多數(shù)傳統(tǒng)IT設(shè)施更高,管理也更加專業(yè)。相對于傳統(tǒng)模式,在云模式下整個企業(yè)能很容易地直接達(dá)到這種安全性。云計算的這些特征使其極大地提高了用戶體驗度,同時具有極低的成本。
2)云計算的層次結(jié)構(gòu)
云計算之所以具有上述特征,是由其層次結(jié)構(gòu)決定的。從不同角度,云計算可以分成不同類別。按照服務(wù)模式的分類如圖1-1所示。

圖1-1 云計算服務(wù)模式
按照部署模式,云計算可以分為3種模式:公共云、私有云、混合云。服務(wù)模式如圖1-2所示。

圖1-2 添加注釋的云計算服務(wù)模式
2.云計算發(fā)展的國際比較
云計算市場呈現(xiàn)全球化發(fā)展的趨勢。截至2016年,阿里云在全球一共布置了14座超大規(guī)模數(shù)據(jù)中心,騰訊云有3座海外數(shù)據(jù)中心,亞馬遜有8座數(shù)據(jù)中心。從市場份額來看,根據(jù)美國市場研究機(jī)構(gòu)Synergy Research的最新數(shù)據(jù)顯示,亞馬遜AWS是全球云服務(wù)的第一大巨頭,從2006年開始,面向全世界范圍內(nèi)的用戶提供專門的計算服務(wù)平臺和整套的云計算服務(wù),亞馬遜AWS在公共云市場上始終保持前位,2014—2016年市場占有率分別為28%、31%、40%,遠(yuǎn)高于微軟、谷歌和IBM等。2009年9月,阿里巴巴宣布成立了一家專門從事云計算業(yè)務(wù)的公司——“阿里云”;我國三大電信運(yùn)營商也紛紛投身云計算平臺搭建,有的運(yùn)營商還成立了大數(shù)據(jù)公司(事業(yè)部)。
在政府層面,各國政府高度重視云計算并積極推進(jìn)在各個領(lǐng)域的應(yīng)用。美國聯(lián)邦政府通過建立網(wǎng)站Apps.gov,作為云計算應(yīng)用的平臺,并于2011年2月發(fā)布了《聯(lián)邦云計算戰(zhàn)略》文件。英國政府在云計算方面開展了全面的部署,從2009年開始,著手建立覆蓋所有政府部門的云計算網(wǎng)絡(luò)G-Cloud。日本政府通過制定“有效利用信息技術(shù),開創(chuàng)云計算新產(chǎn)業(yè)”的國家發(fā)展戰(zhàn)略,積極推動云計算的全面發(fā)展。2017年1月,韓國科學(xué)、信息和通信技術(shù)及未來規(guī)劃部表示,政府制訂了3年計劃,計劃于2016年至2018年間在公共部門采用云計算技術(shù),以節(jié)省3700億韓元。通過在農(nóng)業(yè)和造船等各種工業(yè)領(lǐng)域使用云計算技術(shù),擴(kuò)展云計算的應(yīng)用范圍,從而帶動該市場的發(fā)展。
中國政府高度重視云計算產(chǎn)業(yè)發(fā)展。國家有關(guān)部門專門組織國家科技重大專項研究,以推動云計算技術(shù)和產(chǎn)業(yè)的健康發(fā)展。2015年1月,國務(wù)院印發(fā)《關(guān)于促進(jìn)云計算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見》(國發(fā)〔2015〕5號)文件,提出要加快發(fā)展云計算,打造信息產(chǎn)業(yè)新業(yè)態(tài),推動傳統(tǒng)產(chǎn)業(yè)升級和新興產(chǎn)業(yè)成長,培育形成新的增長點(diǎn),促進(jìn)國民經(jīng)濟(jì)提質(zhì)增效升級。2017年3月,工業(yè)和信息化部印發(fā)了《云計算發(fā)展三年行動計劃(2017—2019年)》文件,促進(jìn)云計算健康快速發(fā)展。
3.云計算與地理空間大數(shù)據(jù)
地理空間信息往往需要大量的數(shù)據(jù)存儲和高效的計算資源,但從現(xiàn)實(shí)來看,依然存在基礎(chǔ)數(shù)據(jù)量雖然龐大,但更新頻度低、并發(fā)訪問數(shù)據(jù)量大,缺乏統(tǒng)一標(biāo)準(zhǔn)等問題。因此,地理空間信息有必要應(yīng)用云計算技術(shù),由此激發(fā)地理空間信息在海量數(shù)據(jù)存儲、大規(guī)模計算、深度數(shù)據(jù)挖掘方面的優(yōu)勢。
地理空間大數(shù)據(jù)應(yīng)用的特點(diǎn)非常適合采用云計算模式:首先,地理空間大數(shù)據(jù)的來源相對集中,使用群體廣泛;其次,地理空間基礎(chǔ)數(shù)據(jù)龐大,需要合理的儲存方式,以便進(jìn)行數(shù)據(jù)挖掘和應(yīng)用;最后,地理空間大數(shù)據(jù)并發(fā)用戶規(guī)模較大,使用頻次低,需要采用云計算的相關(guān)處理技術(shù)。
根據(jù)國內(nèi)外的發(fā)展來看,基于云計算的地理空間大數(shù)據(jù)系統(tǒng)建設(shè)已初具雛形,如Google Earth、Google Moon和Google Mars, ArcGIS Online、ArcGIS10.1, SuperMap GIS 6R, MapGIS K9 SP3, GeoCloud等系統(tǒng),已經(jīng)得到廣泛應(yīng)用和推廣。
(二)物聯(lián)網(wǎng)技術(shù)
1999年,MITAuto ID Center較早將“物聯(lián)網(wǎng)”定義為:在計算機(jī)互聯(lián)網(wǎng)的基礎(chǔ)上,利用射頻識別技術(shù)(Radio Frequency Identification, RFID)、無線數(shù)據(jù)通信等技術(shù),構(gòu)造一個覆蓋世界上萬事萬物的網(wǎng)絡(luò)(Internet of Things, IoT),以實(shí)現(xiàn)物品的自動識別和信息的互聯(lián)共享。物聯(lián)網(wǎng)就是基于互聯(lián)網(wǎng)的物品與物品之間的信息交換,是物物相連的延伸和擴(kuò)展的互聯(lián)網(wǎng)。
物聯(lián)網(wǎng)涉及大量的相關(guān)技術(shù),包括無線通信技術(shù);數(shù)據(jù)采集技術(shù)及設(shè)備,如傳感器;數(shù)據(jù)處理技術(shù);智能終端技術(shù),如常見的模擬人的思維的人工智能技術(shù);數(shù)據(jù)存儲技術(shù),如云計算等。
1.物聯(lián)網(wǎng)的特征及應(yīng)用優(yōu)勢
1)物聯(lián)網(wǎng)的特征
物聯(lián)網(wǎng)具備三個特征:一是全面感知,即利用RFID、傳感器、二維碼等設(shè)備隨時隨地獲取物體的信息;二是可靠傳遞,通過各種傳感網(wǎng)絡(luò)與互聯(lián)網(wǎng)的融合,將物體當(dāng)前的信息實(shí)時準(zhǔn)確地傳遞出去;三是智能處理,利用云計算、模糊識別等各種智能計算技術(shù),對海量數(shù)據(jù)和信息進(jìn)行分析和處理,對物體實(shí)施智能化控制。
2)物聯(lián)網(wǎng)的層次結(jié)構(gòu)
物聯(lián)網(wǎng)之所以具有上述特征,是由其層次結(jié)構(gòu)決定的。如圖1-3所示,物聯(lián)網(wǎng)的三個層次是,最底層用來感知數(shù)據(jù)的感知層,傳遞和處理感知層獲取信息的網(wǎng)絡(luò)層,完成數(shù)據(jù)管理和處理的最上層,即應(yīng)用層。

圖1-3 物聯(lián)網(wǎng)的層次結(jié)構(gòu)
2.物聯(lián)網(wǎng)發(fā)展的國際比較
為尋找新的經(jīng)濟(jì)增長點(diǎn),推動科技進(jìn)步,各國政府對物聯(lián)網(wǎng)及相關(guān)技術(shù)的發(fā)展給予了高度重視。日本2004年提出“u-Japan”戰(zhàn)略,推動物聯(lián)網(wǎng)的全面發(fā)展;2015年10月成立了物聯(lián)網(wǎng)IoT推進(jìn)聯(lián)盟,推動物聯(lián)網(wǎng)技術(shù)的開發(fā)和應(yīng)用。2006年,韓國政府推出了“u-Korea”計劃,倡導(dǎo)智慧服務(wù),全面推廣物聯(lián)網(wǎng)的發(fā)展;2009年出臺了《物聯(lián)網(wǎng)基礎(chǔ)設(shè)施構(gòu)建基本規(guī)劃》,激發(fā)物聯(lián)網(wǎng)的潛在動能;2014年,韓國正式發(fā)布《物聯(lián)網(wǎng)基本規(guī)劃》,并在當(dāng)年下半年制定了物聯(lián)網(wǎng)科研戰(zhàn)略,設(shè)立了物聯(lián)網(wǎng)實(shí)證中心,啟動由九大機(jī)構(gòu)協(xié)同開展的“物聯(lián)網(wǎng)實(shí)證項目”等。2009年歐盟執(zhí)委會啟動了歐洲物聯(lián)網(wǎng)行動計劃,2015年5月,歐盟通過“單一數(shù)字市場(Digital Single Market)策略”,推廣物聯(lián)網(wǎng)發(fā)展的技術(shù)和標(biāo)準(zhǔn);在提出的“歐洲產(chǎn)業(yè)數(shù)字化(Digitising European Industry)新措施”里,將“建構(gòu)物聯(lián)網(wǎng)的單一市場、強(qiáng)力發(fā)展物聯(lián)網(wǎng)生態(tài)系統(tǒng)、深化以人為中心的物聯(lián)網(wǎng)”作為發(fā)展方向;有數(shù)據(jù)顯示,從2014年至2017年,歐盟共投資了1.92億歐元,用于物聯(lián)網(wǎng)的研究和創(chuàng)新。
在奧巴馬執(zhí)政期間,美國將新能源和物聯(lián)網(wǎng)列為振興經(jīng)濟(jì)的兩大重點(diǎn)。2016年3月,美國在線信任聯(lián)盟(The Online Trust Alliance, OTA)發(fā)布了《物聯(lián)網(wǎng)信任框架》,作為物聯(lián)網(wǎng)設(shè)備開發(fā)商、采購商和零售商的產(chǎn)品開發(fā)與風(fēng)險評估指南,并于2017年1月進(jìn)行了更新;2016年,幾家巨頭企業(yè)提出“國家物聯(lián)網(wǎng)戰(zhàn)略對話”倡議,適逢美國新“物聯(lián)網(wǎng)”商業(yè)局的成立和兩院兩黨即將簽署“物聯(lián)網(wǎng)的發(fā)展創(chuàng)新與成長行動”。2017年5月,美國總統(tǒng)特朗普簽署13800號總統(tǒng)行政令——《加強(qiáng)聯(lián)邦網(wǎng)絡(luò)和關(guān)鍵基礎(chǔ)設(shè)施的網(wǎng)絡(luò)安全》,并于當(dāng)年6月發(fā)布,征求評議文件《促進(jìn)利益相關(guān)者對僵尸網(wǎng)絡(luò)和其他自動威脅的行動》,探討應(yīng)對物聯(lián)網(wǎng)安全尤其是僵尸網(wǎng)絡(luò)分布式拒絕服務(wù)(Distributed Denial of Service, DDoS)攻擊威脅的相關(guān)建議。
中國重視物聯(lián)網(wǎng)的發(fā)展并將其作為戰(zhàn)略性新興產(chǎn)業(yè)。在《“十二五”規(guī)劃綱要》中明確提出,要推動物聯(lián)網(wǎng)關(guān)鍵技術(shù)研發(fā)和重點(diǎn)領(lǐng)域的應(yīng)用示范。“十三五”時期,我國物聯(lián)網(wǎng)發(fā)展面臨“跨界融合、集成創(chuàng)新和規(guī)模化發(fā)展”的新階段。根據(jù)Wind數(shù)據(jù)顯示,2009年至2014年,我國物聯(lián)網(wǎng)行業(yè)市場規(guī)模復(fù)合年均增長率(Compound Annual Growth Rate, CAGR)達(dá)到27.1%;前瞻產(chǎn)業(yè)研究院發(fā)布的《中國物聯(lián)網(wǎng)行業(yè)應(yīng)用領(lǐng)域市場需求與投資預(yù)測分析報告》預(yù)計,到2018年,物聯(lián)網(wǎng)行業(yè)市場規(guī)模將超過1.5萬億元,CAGR將超過30.0%。在新的國際背景下,我國物聯(lián)網(wǎng)將面臨前所未有的發(fā)展機(jī)遇。
未來物聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展有如下趨勢。
1)物聯(lián)網(wǎng)應(yīng)用市場巨大
在全球物聯(lián)網(wǎng)不斷發(fā)展的過程中,各國積極部署國際戰(zhàn)略,不斷開發(fā)相關(guān)技術(shù)和標(biāo)準(zhǔn),推廣相關(guān)應(yīng)用和服務(wù),全球物聯(lián)網(wǎng)市場規(guī)模呈現(xiàn)遞增趨勢。據(jù)有關(guān)研究顯示,在相關(guān)技術(shù)的推動下,正在涌現(xiàn)出越來越多的實(shí)用性應(yīng)用產(chǎn)品,預(yù)計到2020年,全球物聯(lián)網(wǎng)整體市場規(guī)模將達(dá)到11000億美元。
2)物聯(lián)網(wǎng)標(biāo)準(zhǔn)體系漸進(jìn)完善
物聯(lián)網(wǎng)產(chǎn)業(yè)標(biāo)準(zhǔn)體系涵蓋面廣,涉及眾多技術(shù)、眾多行業(yè)、眾多領(lǐng)域,通過行業(yè)標(biāo)準(zhǔn)帶動關(guān)鍵技術(shù)標(biāo)準(zhǔn),將逐步形成符合市場規(guī)范的標(biāo)準(zhǔn)化體系。
3)物聯(lián)網(wǎng)產(chǎn)業(yè)集群發(fā)展
物聯(lián)網(wǎng)概念提出以后,隨著全球公共治理、管理體制的不斷完善,逐步形成了統(tǒng)一的應(yīng)用服務(wù)市場,應(yīng)用解決方案更加貼近消費(fèi)者的需求;同時,在相關(guān)產(chǎn)業(yè)的發(fā)展過程中,出現(xiàn)了大量上、中、下游企業(yè)的聚集,核心技術(shù)開發(fā)層出不窮,相對成熟的物聯(lián)網(wǎng)產(chǎn)業(yè)鏈條在不斷延長。
4)物聯(lián)網(wǎng)公共技術(shù)平臺將成為發(fā)展主流
隨著行業(yè)應(yīng)用的逐漸成熟,將逐步形成統(tǒng)一的數(shù)據(jù)接口和標(biāo)準(zhǔn),從而支持不同設(shè)備和互聯(lián)協(xié)議,大量具有相似特性的技術(shù)服務(wù)平臺逐步集成化,越來越多的物聯(lián)網(wǎng)技術(shù)平臺的通用性將不斷增強(qiáng),成為未來發(fā)展的主流趨勢。
3.物聯(lián)網(wǎng)與地理空間信息
物聯(lián)網(wǎng)的建設(shè)為地理空間信息技術(shù)提供了巨大的發(fā)展機(jī)遇。當(dāng)前,物聯(lián)網(wǎng)網(wǎng)絡(luò)系統(tǒng)規(guī)模是互聯(lián)網(wǎng)的30倍,甚至更多。在未來,地理空間信息技術(shù)應(yīng)用的廣度和深度將不可估量。地理空間信息技術(shù)也為物聯(lián)網(wǎng)提供了關(guān)鍵性的技術(shù)支撐。物聯(lián)網(wǎng)感知物品信息時,需要感知其物品的位置存在等空間信息,這就可以借助地理信息系統(tǒng)的工業(yè)化標(biāo)準(zhǔn)平臺來高效地進(jìn)行處理。物聯(lián)網(wǎng)對信息的存儲和管理手段在不斷更新,從而可以提升對空間和非空間數(shù)據(jù)的分析挖掘能力,進(jìn)一步強(qiáng)化物聯(lián)網(wǎng)應(yīng)用的信息管理水平,對我國大力發(fā)展物聯(lián)網(wǎng)建設(shè)將大有裨益。地理空間信息技術(shù)可以在以下6個方面促進(jìn)物聯(lián)網(wǎng)的發(fā)展。
1)精確導(dǎo)航與定位服務(wù)
智能管理作為物聯(lián)網(wǎng)的特征之一,對所有入網(wǎng)互聯(lián)的“物”進(jìn)行跟蹤和準(zhǔn)確定位,需要精準(zhǔn)的定位技術(shù)。衛(wèi)星導(dǎo)航系統(tǒng)具有實(shí)時三維導(dǎo)航與定位能力,能夠快速、高效、準(zhǔn)確地提供精確三維坐標(biāo)、精確目標(biāo)導(dǎo)向和地理定位信息。衛(wèi)星導(dǎo)航信息廣泛應(yīng)用于軍事和民用領(lǐng)域,如:智慧城市、精準(zhǔn)農(nóng)業(yè),智慧交通和智能物流。它為地理空間信息數(shù)據(jù)提供翔實(shí)、關(guān)鍵的內(nèi)容。全球定位系統(tǒng)(Global Positioning System, GPS)是當(dāng)前全球?qū)Ш蕉ㄎ坏闹饕畔⒎?wù)系統(tǒng)。
2)準(zhǔn)時、實(shí)時數(shù)字圖像處理
準(zhǔn)時、實(shí)時數(shù)字圖像、全面感知是物聯(lián)網(wǎng)的另一個重要特征。在大面積監(jiān)測地理目標(biāo)時,對地觀測衛(wèi)星系統(tǒng)可以直觀、動態(tài)、快速響應(yīng),并可提供遙感圖像、電磁信號等衛(wèi)星遙感信息,它以更高的分辨率和更快的響應(yīng)速度來構(gòu)成地球空間信息的重要數(shù)據(jù)源。在軍事、科技、城市規(guī)劃管理與監(jiān)測、國土測繪與監(jiān)測、氣象觀測與服務(wù)、地質(zhì)勘探與考察、環(huán)境監(jiān)測與防災(zāi)減災(zāi)、海洋監(jiān)測、農(nóng)林牧副漁監(jiān)測等眾多領(lǐng)域有著廣泛應(yīng)用。
3)準(zhǔn)確氣象服務(wù)
物聯(lián)網(wǎng)的重要組成部分包括數(shù)字化網(wǎng)格城市、智能農(nóng)業(yè)、智能家庭和智能氣象服務(wù)。通過智能氣象服務(wù)終端(IMST)、智能氣象服務(wù)中心(IMSC)組成的智能氣象服務(wù)系統(tǒng),可實(shí)現(xiàn)全面信息數(shù)據(jù)的共享共通,通過智能化地分析用戶的需要,可最大限度地實(shí)現(xiàn)數(shù)據(jù)應(yīng)用,提供滿足用戶需要的或潛在需要的氣象服務(wù)。
4)遠(yuǎn)程通信服務(wù)
衛(wèi)星通信是實(shí)現(xiàn)物聯(lián)網(wǎng)可靠傳遞特性的保證之一。衛(wèi)星通信的優(yōu)勢在于覆蓋范圍廣,不受地理條件限制,可以在國際國內(nèi)通信、寬帶多媒體通信、移動通信和廣播電視等領(lǐng)域廣泛應(yīng)用;頻帶寬、容量大、性能穩(wěn)定,適用的領(lǐng)域較為寬泛,通過提供遠(yuǎn)程通信服務(wù),可實(shí)現(xiàn)衛(wèi)星通信網(wǎng)、地面電信網(wǎng)、計算機(jī)網(wǎng)絡(luò)和有線電視網(wǎng)絡(luò)的互聯(lián)互通,多方面提供信息和應(yīng)用成果。
5)資源與環(huán)境監(jiān)測
地球資源與環(huán)境監(jiān)測也是物聯(lián)網(wǎng)應(yīng)用的一個重要領(lǐng)域。通過利用地球資源衛(wèi)星,借助電荷藕合器件圖像傳感器(Charge Coupled Device, CCD傳感器)、光學(xué)或微波成像儀、紅外掃描儀及其他設(shè)備,提供資源與環(huán)境監(jiān)測的服務(wù),有效獲取環(huán)境和災(zāi)害信息,為應(yīng)對環(huán)境與資源問題、解決相關(guān)民生問題,提供全面的數(shù)據(jù)來源,科學(xué)輔助國家政策、專項政策的制定與執(zhí)行。
6)精確作戰(zhàn)信息服務(wù)
物聯(lián)網(wǎng)時代,可視化的數(shù)字戰(zhàn)場將成為競爭的核心要素,通過衛(wèi)星系統(tǒng)及其星載傳感器,搜集精準(zhǔn)、實(shí)時的數(shù)據(jù),構(gòu)建全方位、全頻譜、全時域的多維偵察監(jiān)視預(yù)警和指揮控制體系。
隨著相關(guān)網(wǎng)絡(luò)技術(shù)的發(fā)展,地理空間大數(shù)據(jù)的技術(shù)將不斷完善,輔之以物聯(lián)網(wǎng)的發(fā)展,將發(fā)揮積極有效的作用。
(三)移動互聯(lián)網(wǎng)技術(shù)
移動互聯(lián)網(wǎng)技術(shù)涉及移動通信技術(shù)和互聯(lián)網(wǎng)技術(shù)。用戶采用形式多樣的移動終端,通過移動通信網(wǎng)絡(luò)訪問互聯(lián)網(wǎng)并使用互聯(lián)網(wǎng)業(yè)務(wù),這在當(dāng)前經(jīng)濟(jì)社會中已經(jīng)全面普及。從有線的、固定的網(wǎng)絡(luò)到無線的、移動的網(wǎng)絡(luò),是互聯(lián)網(wǎng)的巨大進(jìn)步,用戶終端由固定變?yōu)榭梢苿樱沟镁W(wǎng)絡(luò)無處不在。移動互聯(lián)網(wǎng)技術(shù)市場潛力巨大,將繼續(xù)引領(lǐng)各行業(yè)的快速發(fā)展。
1.移動互聯(lián)網(wǎng)的特征及應(yīng)用優(yōu)勢
1)移動互聯(lián)網(wǎng)的特征
(1)時間空間的隨意性。
移動互聯(lián)網(wǎng)終端的可移動性為人類帶來空前的便捷性。移動互聯(lián)網(wǎng)的出現(xiàn),使得個體連接網(wǎng)絡(luò)、使用網(wǎng)絡(luò)不受時間和空間的限制。隨著智能終端的不斷更新,移動物聯(lián)網(wǎng)的用戶不斷攀升,覆蓋群體范圍不斷擴(kuò)大。到目前為止,全球移動互聯(lián)網(wǎng)用戶的數(shù)目呈現(xiàn)不斷攀升的態(tài)勢。就我國而言,根據(jù)工信部2017年3月發(fā)布的數(shù)據(jù),2017年1~2月,我國移動互聯(lián)網(wǎng)用戶總數(shù)達(dá)到11.2億戶。移動互聯(lián)網(wǎng)的出現(xiàn),正在深刻地改變?nèi)祟惈@取信息的路徑和方式。
(2)使用方式的私有性。
相對于個人計算機(jī)(Personal Computer, PC)用戶,手機(jī)更具有個人化、私密性的特點(diǎn),如每部手機(jī)都有專屬人,包括手機(jī)號碼、手機(jī)終端的應(yīng)用,基本上都是私人來使用的。智能終端的使用者,擁有各自的社會交際網(wǎng)絡(luò),也更加明顯地顯示出網(wǎng)絡(luò)之間的關(guān)聯(lián)性,并成為互聯(lián)網(wǎng)應(yīng)用開發(fā)的基礎(chǔ)和新的增長點(diǎn),個體社交網(wǎng)絡(luò)正在逐步成為互聯(lián)網(wǎng)創(chuàng)新應(yīng)用的新領(lǐng)域。
(3)服務(wù)定向性。
智能終端應(yīng)用的不斷開發(fā),使得移動互聯(lián)網(wǎng)可以借助各種定位方式,獲取使用者的地理位置信息,由此進(jìn)一步開發(fā)更加個性化、針對性的應(yīng)用服務(wù)。借助大數(shù)據(jù)技術(shù)、數(shù)據(jù)挖掘技術(shù),移動互聯(lián)網(wǎng)應(yīng)用開發(fā)商可以實(shí)現(xiàn)對數(shù)據(jù)的整理和挖掘,針對用戶的習(xí)慣性消費(fèi)偏好,開發(fā)更加精準(zhǔn)實(shí)用的產(chǎn)品,提供更加全面的個性化服務(wù),如打車服務(wù)、地圖熱圖服務(wù)等。
(4)適用時間的靈活性。
移動互聯(lián)網(wǎng)的即時性有效改善了時間分配,基于其顯著的便捷性特點(diǎn),可以改善傳統(tǒng)工作模式的低效率問題,在移動互聯(lián)網(wǎng)的模式下,個體、企業(yè)、國家可以更加實(shí)時地處理、接收各類信息,實(shí)現(xiàn)高效化運(yùn)轉(zhuǎn)。移動互聯(lián)網(wǎng)為生活、工作、學(xué)習(xí)提供了便利,也為社會和諧穩(wěn)定發(fā)展創(chuàng)造了新途徑和新空間。
(5)終端多樣化。
移動終端、移動通信設(shè)備是移動互聯(lián)網(wǎng)的基本載體。科技進(jìn)步的推陳出新,實(shí)現(xiàn)了新型移動通信設(shè)備的快速更新,使用終端趨向于輕便化、可攜帶化。產(chǎn)品的革新速度加快,微型設(shè)備等給人類社會帶來了極大的便利。
2)移動互聯(lián)網(wǎng)的層次結(jié)構(gòu)
移動互聯(lián)網(wǎng)具有3個層次,由此決定了其如上所述的主要特點(diǎn)。綜合來看,移動互聯(lián)網(wǎng)最典型的特征是應(yīng)用廣泛,服務(wù)多樣,通信模式各異。
圖1-4是世界無線研究論壇給出的移動互聯(lián)網(wǎng)參考模型,對移動互聯(lián)網(wǎng)進(jìn)行的研究表明,移動互聯(lián)網(wǎng)可以提供個性化、感知式、自調(diào)整式的應(yīng)用服務(wù)。各種應(yīng)用通過開放的應(yīng)用程序接口(Application Programming Interface, API)獲得用戶交互支持或移動中間件支持。移動中間件包括數(shù)據(jù)建模服務(wù)、移動數(shù)據(jù)管理等。互聯(lián)網(wǎng)協(xié)議簇包括IP服務(wù)協(xié)議和聯(lián)網(wǎng)協(xié)議等在內(nèi)的各種協(xié)議組合。操作系統(tǒng)實(shí)現(xiàn)不同層級之間的交互;硬件/固件是指組成終端和設(shè)備的器件單元。

圖1-4 移動互聯(lián)網(wǎng)的參考模型
移動互聯(lián)網(wǎng)支持多種無線接入方式,根據(jù)覆蓋范圍的不同,可分為個人域網(wǎng)(Wireless Personal Area Network, WPAN)接入、無線局域網(wǎng)(Wireless Local Area Networks, WLAN)接入、無線城域網(wǎng)(Wireless Metropolitan Area Network, WMAN)接入和無線廣域網(wǎng)(Wireless Wide Area Network, WWAN)接入,各種技術(shù)客觀上存在部分功能重疊的相互補(bǔ)充、相互促進(jìn),具有不同的市場定位,共同組成寬帶無線接入的網(wǎng)絡(luò)架構(gòu)。
2.移動互聯(lián)網(wǎng)的發(fā)展現(xiàn)狀
根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2016年12月,中國網(wǎng)民規(guī)模達(dá)7.31億,相當(dāng)于歐洲人口總量,互聯(lián)網(wǎng)普及率達(dá)到53.2%。其中,手機(jī)網(wǎng)民占比達(dá)95.1%。截至2016年12月,我國手機(jī)網(wǎng)民規(guī)模達(dá)6.95億,增長率連續(xù)三年超過10%。相比之下,臺式電腦、筆記本電腦的使用率均出現(xiàn)下降,2016年我國手機(jī)網(wǎng)上支付用戶規(guī)模增長迅速,達(dá)到4.69億,年增長率為31.2%。網(wǎng)民手機(jī)網(wǎng)上支付的使用比例由57.7%提升至67.5%。
移動互聯(lián)網(wǎng)的發(fā)展勢不可當(dāng)。未來智能手持終端比例將不斷加大,在智能連接發(fā)展情況方面,中國移動物聯(lián)卡用戶規(guī)模超過3400萬戶,集團(tuán)客戶有1.9萬家,預(yù)計到2017年年底將超過4000萬用戶。目前每用戶平均收入(Average Revenue Per User, ARPU)值為56元/年,平均每戶每月上網(wǎng)流量(Dataflow of Usage, DOU)為528兆/年,連接管理平臺API調(diào)用次數(shù)持續(xù)增加。搜索仍將是移動互聯(lián)網(wǎng)的主要應(yīng)用,與傳統(tǒng)互聯(lián)網(wǎng)模式相比,移動互聯(lián)網(wǎng)同樣對搜索的需求量非常大,在移動的狀態(tài)下,非常適宜去搜索相關(guān)信息。移動搜索信息的手機(jī)仍然是移動互聯(lián)網(wǎng)的主要應(yīng)用。
3.移動互聯(lián)網(wǎng)與地理空間大數(shù)據(jù)
移動互聯(lián)網(wǎng)的發(fā)展讓位置服務(wù)或定位服務(wù)(Location Based Services, LBS)和位置應(yīng)用迅速起飛,傳統(tǒng)的地理信息市場也由此迎來新一輪發(fā)展高潮。可以這么說,地理空間大數(shù)據(jù)借LBS進(jìn)入移動互聯(lián)網(wǎng)。在社會需求和信息技術(shù)的雙重驅(qū)動下,移動互聯(lián)網(wǎng)與地理空間信息的集成成為必然,移動空間信息服務(wù)將取得突飛猛進(jìn)的發(fā)展。移動地理空間信息集成服務(wù)本質(zhì)上不是單純的某一項技術(shù),而是由多學(xué)科、多技術(shù)領(lǐng)域交叉的復(fù)雜技術(shù)服務(wù)系統(tǒng)。移動互聯(lián)網(wǎng)為用戶提供的各種服務(wù)具備體驗性、溝通性、差異性、創(chuàng)造性和關(guān)聯(lián)性等特性,大大推動了地理信息服務(wù)快速融入人們的工作和生活,并且科技進(jìn)步和需求增加將強(qiáng)勁驅(qū)動LBS等地理空間信息應(yīng)用的普及,極大地提升地理空間信息的價值。在日益強(qiáng)大的智能終端硬件性能(如GPS模塊支持、3D加速)和系統(tǒng)軟件(如觸控界面)支持下,移動位置的應(yīng)用能為用戶提供更清晰、更翔實(shí)的地圖,能夠提供更完整的地圖展現(xiàn)、更友好的仿真界面及3D效果;并且,智能手機(jī)能夠?qū)⒁苿游恢梅?wù)與Web 2.0理念結(jié)合起來,大大增加了LBS等地理空間信息服務(wù)的應(yīng)用空間和實(shí)際價值。
移動互聯(lián)網(wǎng)與地理空間大數(shù)據(jù)以LBS為切入點(diǎn)相結(jié)合,會在如下幾個領(lǐng)域產(chǎn)生意義深遠(yuǎn)的影響。
1)基于地理空間大數(shù)據(jù)的導(dǎo)航和位置服務(wù)
電子地圖廠商有先天優(yōu)勢,比如擁有數(shù)據(jù)優(yōu)勢的高德和四維圖新。這二者除了做導(dǎo)航之外,還都涉及互聯(lián)網(wǎng)電子地圖和地理信息服務(wù)。據(jù)了解,四維圖新每天通過LBS和互聯(lián)網(wǎng)地圖服務(wù)使用公司地圖產(chǎn)品的點(diǎn)擊量達(dá)9100萬次,并且在移動位置服務(wù)領(lǐng)域與中國移動、中國電信等進(jìn)行深度合作。高德2007年就開始和中國移動位于遼寧的位置基地合作。免費(fèi)的“mini地圖”是高德?lián)屨际謾C(jī)客戶端的重要手段。高德還具有創(chuàng)新性的作為,他們認(rèn)為地理數(shù)據(jù)庫+GIS+在線將成為LBS的主流,于是與Esri合作開發(fā)出Emapzone。
2)基于地理空間大數(shù)據(jù)的互聯(lián)網(wǎng)應(yīng)用
自2009年Foursquare發(fā)布以來,基于地理位置的移動互聯(lián)網(wǎng)應(yīng)用不斷出現(xiàn)。如基于位置的聊天工具Yobongo,在及時溝通與反饋的基本服務(wù)基礎(chǔ)上,建立現(xiàn)實(shí)的溝通情境,進(jìn)行基于實(shí)景的互動;如圖像分享應(yīng)用Color,結(jié)合手機(jī)特性,獲取用戶的地理位置大數(shù)據(jù),幫助人們感知周圍環(huán)境,實(shí)現(xiàn)基本需求;如Facebook Places,通過跟隨社交網(wǎng)絡(luò)中其他人的足跡,發(fā)現(xiàn)新的熱點(diǎn),允許用戶分享其地理位置信息,并推廣了很多基于地理位置的服務(wù);如Wechat,通過實(shí)現(xiàn)跨平臺的位置社交網(wǎng)絡(luò)構(gòu)建,實(shí)現(xiàn)了開放的互聯(lián)網(wǎng)應(yīng)用。
3)基于地理空間大數(shù)據(jù)的公共管理應(yīng)用
在公共管理領(lǐng)域,比如城市管理、公共應(yīng)急管理等都開始嘗試?yán)靡苿拥乩砜臻g信息來提高室外辦公的工作效率。在城市管理的移動地理空間信息解決方案中,巡檢人員在城市巡檢中若遇到公共設(shè)施遭到破壞,或者發(fā)生影響行人正常出行的異常事件時,其就可通過隨身攜帶的移動終端上的GPS定位得到位置信息,并利用移動終端上的移動地理空間信息應(yīng)用程序?qū)⒐芾硇畔l(fā)送到城市管理中心的服務(wù)器上,以便管理機(jī)構(gòu)做出決策,并且通過移動終端接收來自管理中心的任務(wù)指派,從而完成整個巡檢工作。
除此之外,在不同行業(yè),也有不同的移動地理空間信息的應(yīng)用案例,比如基于移動地理空間信息的油氣巡檢系統(tǒng)、基于實(shí)景三維地理空間信息的水庫移動巡查系統(tǒng)等,不再一一贅述。
(四)大數(shù)據(jù)技術(shù)
著名社會思想家阿爾文· 托夫勒最早在1980年提出了“大數(shù)據(jù)”的概念。但是,大約從2009年開始,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。美國互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便可翻一番,而目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。
云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng),無一不是大數(shù)據(jù)來源或者承載的方式。在物聯(lián)網(wǎng)時代,成千上萬的網(wǎng)絡(luò)傳感器嵌入到現(xiàn)實(shí)世界中;云計算則為物聯(lián)網(wǎng)產(chǎn)生的海量數(shù)據(jù)提供存儲空間,并使得在線處理成為可能。過去,企業(yè)知識存儲數(shù)據(jù),簡單地存與讀,或者進(jìn)行簡單的數(shù)據(jù)分析,然而,隨著數(shù)據(jù)呈現(xiàn)爆炸式增長趨勢,企業(yè)不再滿足于這種簡單的數(shù)據(jù)處理,而是希望通過數(shù)據(jù)對企業(yè)做出更好的決策,正是這種對數(shù)據(jù)的需求催生了大數(shù)據(jù)。
維基百科將大數(shù)據(jù)定義為:大數(shù)據(jù)或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)截取、管理、處理、并整理成為人類所能解讀的信息。Amazon大數(shù)據(jù)科學(xué)家John Rauser將大數(shù)據(jù)描述為“任何超過了一臺計算機(jī)處理能力的龐大數(shù)據(jù)量”。Informatica中國區(qū)首席產(chǎn)品顧問但彬認(rèn)為:大數(shù)據(jù)=海量數(shù)據(jù)+復(fù)雜類型的數(shù)據(jù)。
1.大數(shù)據(jù)的特征及應(yīng)用優(yōu)勢
1)大數(shù)據(jù)的特征
業(yè)界對大數(shù)據(jù)特征的定義有3V和4V。其中價值(Value)既是特征,又是對大數(shù)據(jù)應(yīng)用的描述。下邊對大數(shù)據(jù)的3V特征進(jìn)行闡述。
(1)大量(Volume):是指數(shù)據(jù)量是非常龐大的,主要體現(xiàn)為數(shù)據(jù)存儲量大、計算量大。大數(shù)據(jù)中的數(shù)據(jù)不再以幾個GB或者幾個TB為單位來衡量,而是以PB、EB或ZB為計量單位。根據(jù)IDC的預(yù)測報告顯示,2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到0.7ZB,2015年全球的數(shù)據(jù)總量為8.6ZB,目前全球數(shù)據(jù)的增長速度為每年40%左右,預(yù)計到2020年全球的數(shù)據(jù)總量將達(dá)到40ZB。
(2)速度快(Velocity):一是指數(shù)據(jù)在不斷更新,變化的速度快。根據(jù)2017年思科Mobile Visual Networking Index(VNI)報告預(yù)測,全球移動數(shù)據(jù)流量在2016年至2021年間將增長7倍,用戶上傳的內(nèi)容將爆發(fā)式增長。二是指數(shù)據(jù)存儲、傳輸?shù)忍幚硭俣瓤臁鹘y(tǒng)數(shù)據(jù)倉庫系統(tǒng)、BI應(yīng)用都是批處理方式,但對于大數(shù)據(jù)應(yīng)用,必須進(jìn)行實(shí)時數(shù)據(jù)流處理。
(3)多樣性(Variety):是指數(shù)據(jù)來源廣泛、數(shù)據(jù)類型多樣、數(shù)據(jù)交易頻繁。企業(yè)所面對的傳統(tǒng)數(shù)據(jù)主要是交易數(shù)據(jù),而互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,形成了大量的數(shù)據(jù)來源;大數(shù)據(jù)中有四分之三以上的數(shù)據(jù)是以非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行存儲的,如音頻、視頻、圖片、鏈接等;與空間信息為主的數(shù)據(jù)之間具有很強(qiáng)的關(guān)聯(lián)性,包括語音、照片、位置、行程、日期、坐標(biāo)等。
2)大數(shù)據(jù)的流程結(jié)構(gòu)
大數(shù)據(jù)的存儲和應(yīng)用,對數(shù)據(jù)處理的高效性和可用性提出了更高的要求。傳統(tǒng)數(shù)據(jù)處理方法的不足表現(xiàn)在:第一,采集來源單一,且存儲、管理和分析數(shù)據(jù)量也相對較小,無法滿足相關(guān)的大數(shù)據(jù)應(yīng)用需求;第二,傳統(tǒng)的數(shù)據(jù)處理方法無法滿足大數(shù)據(jù)的要求。因此,只有符合新架構(gòu)的大數(shù)據(jù)處理技術(shù)才能解決新出現(xiàn)的數(shù)據(jù)需求。
大數(shù)據(jù)處理流程包含圖1-5所示的5個環(huán)節(jié),大數(shù)據(jù)的基本處理流程與傳統(tǒng)數(shù)據(jù)處理流程的主要區(qū)別在于:由于大數(shù)據(jù)要處理大量、非結(jié)構(gòu)化的數(shù)據(jù),所以在各個處理環(huán)節(jié)中都可以采用MapReduce等方式進(jìn)行并行處理。MapReduce是通過對海量數(shù)據(jù)進(jìn)行分割、任務(wù)分解與結(jié)果匯總,經(jīng)過映射和化簡兩個階段,先分后合,實(shí)現(xiàn)對數(shù)據(jù)的有效處理。Map即“分解”,把海量數(shù)據(jù)分割成了若干部分,分給多臺處理器并行處理;Reduce即“合并”,把各臺處理器處理后的結(jié)果進(jìn)行匯總操作以得到最終結(jié)果。在數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲、數(shù)據(jù)分析/挖掘、結(jié)果展現(xiàn)5個步驟中,大數(shù)據(jù)技術(shù)均采用了不同于以往的新方法,典型工具也在圖1-5中列出。

圖1-5 適用于各處理環(huán)節(jié)的MapReduce等大規(guī)模并行處理方式
2.大數(shù)據(jù)的發(fā)展趨勢
在2013年舉行的第一屆CCF大數(shù)據(jù)會議上,122位專家委員共同預(yù)測了如下的大數(shù)據(jù)發(fā)展趨勢。
1)大數(shù)據(jù)從“概念”走向“價值”
大數(shù)據(jù)向更多新領(lǐng)域擴(kuò)張,并會出現(xiàn)更多數(shù)據(jù)驅(qū)動的商業(yè)模式。互聯(lián)網(wǎng)金融等將會成為大數(shù)據(jù)應(yīng)用的新的商業(yè)模式,特別是基于海量數(shù)據(jù)的信用體系和風(fēng)險控制,將成為新的發(fā)展方向。資本高度關(guān)注大數(shù)據(jù)領(lǐng)域,特別是社會資本會以更加靈活的方式,如PPP模式,來注資、助力大數(shù)據(jù)的發(fā)展。
2)大數(shù)據(jù)處理架構(gòu)的多樣化模式并存
大數(shù)據(jù)處理架構(gòu)的模式多樣化,目前看來,實(shí)時流計算、分布式內(nèi)存計算、圖計算等框架并存的局面占據(jù)主流。由于硬件加工工藝及技術(shù)的提升,內(nèi)存的容量越來越大,體積越來越小,價格越來越低,使得應(yīng)用內(nèi)存來計算、解決大數(shù)據(jù)實(shí)時性的問題成為可能,從而提高了實(shí)時處理效率及數(shù)據(jù)性能。
3)大數(shù)據(jù)更加安全與注重隱私
由于大數(shù)據(jù)更具開放性,因此需要關(guān)注存儲數(shù)據(jù)的物理安全性,避免成為網(wǎng)絡(luò)攻擊的目標(biāo)。數(shù)據(jù)獲得的便利性使得黑客也比較容易獲得大數(shù)據(jù)的分析技術(shù),這樣大數(shù)據(jù)更容易成為不易被追蹤且難以防范的犯罪手段。因此,大數(shù)據(jù)的安全問題將越來越被重視。特別是,隨著個人隱私數(shù)據(jù)越來越被動地被搜集,有償性隱私保護(hù)服務(wù)會成為未來的發(fā)展趨勢,由此將會推進(jìn)大數(shù)據(jù)個人數(shù)據(jù)保護(hù)和隱私問題立法的相關(guān)工作。
4)大數(shù)據(jù)分析與可視化成為熱點(diǎn)
人們能夠及時地了解和獲得決策信息,與對大數(shù)據(jù)的實(shí)時查詢和分析是分不開的。內(nèi)存計算模式的大量運(yùn)用及大數(shù)據(jù)的實(shí)時處理將成為大數(shù)據(jù)分析的重要抓手。大數(shù)據(jù)即將成為新一代技術(shù)革命的發(fā)動機(jī),在大數(shù)據(jù)的深度數(shù)據(jù)挖掘和AI技術(shù)的深度學(xué)習(xí)基礎(chǔ)上,融合其他之前的各種處理方法,將會產(chǎn)生革命性的大數(shù)據(jù)分析方法。
5)大數(shù)據(jù)作為戰(zhàn)略性產(chǎn)業(yè)
大數(shù)據(jù)作為各個國家的戰(zhàn)略新興產(chǎn)業(yè),在分析提高國家經(jīng)濟(jì)決策和社會服務(wù)能力、保障國家安全等方面發(fā)揮著重要的作用。同時,大規(guī)模的企業(yè)已成為大數(shù)據(jù)使用最活躍的群體,中小企業(yè)也越來越重視大數(shù)據(jù)給企業(yè)帶來的重大影響。在政府層面,一些擁有大數(shù)據(jù)的政府部門利用自己積累的數(shù)據(jù),采用大數(shù)據(jù)技術(shù)分析,科學(xué)有效地指導(dǎo)行業(yè)、企業(yè)的發(fā)展,解決地方政府治理等問題,成果顯著突出。
6)數(shù)據(jù)商品化與數(shù)據(jù)共享聯(lián)盟化
數(shù)據(jù)的私有化和獨(dú)占性將日益成為關(guān)注的焦點(diǎn),數(shù)據(jù)產(chǎn)權(quán)界定問題日益突出。在數(shù)據(jù)權(quán)屬確定的情況下,數(shù)據(jù)商品化將成為必然選擇。數(shù)據(jù)共享聯(lián)盟將逐漸壯大成為產(chǎn)業(yè)的核心一環(huán),數(shù)據(jù)共享將擴(kuò)展到企業(yè)層面,逐步實(shí)現(xiàn)共享聯(lián)盟化。
7)基于大數(shù)據(jù)的預(yù)測應(yīng)用
通過對海量歷史數(shù)據(jù)分析,幫助捕捉現(xiàn)在和預(yù)測未來,進(jìn)而通過大數(shù)據(jù)進(jìn)行決策支持,是基于大數(shù)據(jù)的預(yù)測應(yīng)用模式。可以看到,大數(shù)據(jù)分析下的美國總統(tǒng)選舉,通過數(shù)據(jù)分析成功預(yù)測了2016年美國總統(tǒng)選舉的結(jié)果。不得不說,基于大數(shù)據(jù)的推薦系統(tǒng)更加了解用戶,更精確,更個性化,成為最具效果的大數(shù)據(jù)商業(yè)應(yīng)用。在積累了多年用戶和數(shù)據(jù)基礎(chǔ)后,基于社交網(wǎng)絡(luò)的廣告營銷模式初現(xiàn)端倪,從而實(shí)現(xiàn)了更精準(zhǔn)的廣告投放,滿足人們的各種需求。
8)深度學(xué)習(xí)成為支撐
在大數(shù)據(jù)時代,深度學(xué)習(xí)將依靠高性能計算的支持,成為大數(shù)據(jù)智能處理的核心技術(shù)之一。智能機(jī)器會依賴對捕捉到的數(shù)據(jù)進(jìn)行分析,做出相應(yīng)的判斷和決策。基于海量知識的智能、群體智能與眾包計算將會成為支撐技術(shù)。
9)數(shù)據(jù)科學(xué)的興起
通過建立基準(zhǔn)測試框架,對各種大數(shù)據(jù)分析系統(tǒng)的應(yīng)用進(jìn)行比較及測驗,是當(dāng)前數(shù)據(jù)發(fā)展的需要。大數(shù)據(jù)的使用及發(fā)展使得數(shù)學(xué)應(yīng)用研究獲得前所未有的發(fā)展,并極大地促進(jìn)了數(shù)學(xué)學(xué)科的變革,幾乎所有的數(shù)學(xué)學(xué)科正在迅速轉(zhuǎn)變成數(shù)據(jù)科學(xué),并作為一門與大數(shù)據(jù)相關(guān)的新興學(xué)科出現(xiàn)。
10)大數(shù)據(jù)生態(tài)環(huán)境逐步完善
物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)再加上傳統(tǒng)互聯(lián)網(wǎng),每天都在產(chǎn)生海量數(shù)據(jù),大數(shù)據(jù)通過與云計算、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等熱點(diǎn)新興計算產(chǎn)生交融,將這些數(shù)據(jù)挑選、處理,實(shí)現(xiàn)有效的應(yīng)用。
3.大數(shù)據(jù)與地理空間信息
隨著地理空間技術(shù)的大量出現(xiàn),數(shù)據(jù)產(chǎn)品交叉的存儲能力及地理空間數(shù)據(jù)量呈乘數(shù)式增長趨勢。常規(guī)來源與非常規(guī)的地理空間大數(shù)據(jù)來源,將會構(gòu)建巨大的數(shù)據(jù)流和數(shù)據(jù)池。分析與挖掘地理空間信息大數(shù)據(jù),將會對社會各方面產(chǎn)生深遠(yuǎn)的影響,以下分別從4個方面闡述大數(shù)據(jù)背景下地理空間信息的應(yīng)用領(lǐng)域。
1)生態(tài)環(huán)境領(lǐng)域
在生態(tài)環(huán)境領(lǐng)域,通過對大量國內(nèi)外各種主要衛(wèi)星遙感影像進(jìn)行信息提取和反演,已形成一系列生態(tài)遙感產(chǎn)品,能夠展現(xiàn)各類生態(tài)系統(tǒng)的空間分布,提供生產(chǎn)生態(tài)系統(tǒng)評價所需參數(shù),提供區(qū)域生態(tài)環(huán)境綜合評價服務(wù),并且提供氣象/氣候、土地資源等數(shù)據(jù)產(chǎn)品,服務(wù)于各行各業(yè)。
2)地震應(yīng)急領(lǐng)域
在地震應(yīng)急領(lǐng)域,地理空間信息從提高基礎(chǔ)業(yè)務(wù)的數(shù)據(jù)精度入手,并運(yùn)用自主研發(fā)的公里格網(wǎng)數(shù)據(jù)分布處理與自動更新技術(shù),將以行政區(qū)劃為單位的數(shù)據(jù)轉(zhuǎn)變?yōu)橐怨锔窬W(wǎng)為單位,提高數(shù)據(jù)精度,有效避免數(shù)據(jù)分配計算過程中的誤差,將災(zāi)區(qū)地理信息和其他相關(guān)數(shù)據(jù)進(jìn)行深入分析,服務(wù)于震后信息推送、災(zāi)情評估及應(yīng)急輔助決策等。
3)公共安全領(lǐng)域
在公共安全領(lǐng)域,地理空間信息基于統(tǒng)一的地理空間框架對各類公安警務(wù)資源進(jìn)行有效整合和信息融合,為各級公安機(jī)關(guān)結(jié)合本地實(shí)際情況提供直觀的可視化空間和警務(wù)處置解決方案,為各級公安部門應(yīng)急工作提供了強(qiáng)有力的技術(shù)保障,便于各級公安機(jī)關(guān)在指揮調(diào)度、交通管理、人口管理、案件時空分析等各個方面進(jìn)一步開展空間大數(shù)據(jù)的應(yīng)用。
4)通信領(lǐng)域
在通信領(lǐng)域,各種通信信息與空間位置相關(guān)聯(lián),數(shù)字空間通過利用地理空間大數(shù)據(jù)的相關(guān)技術(shù),通過對各種數(shù)據(jù)進(jìn)行直觀分析,從中發(fā)現(xiàn)隱含的規(guī)律和趨勢,為快速決策提供服務(wù)。