官术网_书友最值得收藏!

第2部分 構建城市大腦,完善城市數字基礎設施

3章 構建城市的感覺神經系統

3.1 構建物理世界的數字孿生城市

在城市信息化浪潮與數據科學崛起的共同推動下,智慧城市開始在全球范圍內成為未來城市發展的新理念與新實踐,大數據、數據活化、數據挖掘等數據管理、應用與分析技術在智慧城市建設中具有核心作用。在智慧城市技術體系的總體框架中城市感知負責對城市環境中各方面的數據進行感知和收集,處理和自動控制采集的信息,并通過物聯網、傳感網、新一代互聯網等新型網絡技術對感知數據進行傳遞、路由和分發,將數據定向匯聚到合適的位置。通過將海量的城市數據進行分類和聚集,采用數據關聯、數據演進和數據養護等技術實現對數據的活化處理,為服務層提供活化數據支持。而對于數據的使用,則需要進一步封裝底層數據和活化服務,為智慧城市上層應用的開發提供復用和靈活部署的能力,如云平臺、可視化與仿真、公共數據引擎等平臺與服務等。智慧城市體系架構的最頂層則是不同規模和不同發展類型的城市,這些城市基于各自的發展階段,掌握的各類數據資源及所需的核心業務不同,應選擇和開發適合自身特點的智慧應用。此類應用一般行業特性較強,而應用服務層的共性技術主要包括安全與標準兩個方面。

在信息技術革命的推動下,以計算機、網絡通信等信息通信技術為動力的信息化浪潮席卷全球。經過20多年的信息化與數字化建設,現代城市的運行方式與城市居民的生活環境已經發生了根本性的改變。城市的經濟、文化、交通、娛樂等方面都已經和信息化的數字空間緊密融合,網絡空間(Cyberspace)成為城市居民生活的組成部分。完善的信息基礎設施,以及豐富的數字化應用成為現代數字化城市的基本特征之一,豐碩的城市信息化建設成果在為人類生活帶來極大便利的同時也為現代城市形態的進一步演進奠定了技術與數據的基礎。

進入 21 世紀,以大數據及數據活化為代表的數據科學與技術開始受到人們的廣泛關注,以數據為中心的研究方法與技術理念在信息、生物、能源、醫藥、社會學等不同的學科領域都得到了廣泛應用與認可,并促成了大量科研成果的誕生。以信息技術為支撐的數據分析與研究方法正深刻地改變著傳統科學探索的工作方式,成為人類科技發展與知識獲取的一種新興模式。在城市信息化浪潮與數據科學崛起的共同推動下,智慧城市在全球范圍內成為下一代城市化發展的新理念和新實踐。在智慧城市理念及實踐要求日趨成熟,大數據等核心技術廣泛應用的新時代環境下,基于大數據技術構建物理世界的數字孿生城市對智慧城市的發展有著極其重要的意義。我們在智慧城市建設領域有多年的潛心研究和落地實踐,尤其是在城市態勢感知領域中秉承以前沿技術研究為引導,用戶實際需求為驅動的基本原則,在全國落地了 200 多個實戰案例。這些案例涵蓋了網絡空間態勢感知、物聯網態勢感知、工業互聯網態勢感知和工業控制態勢感知等眾多態勢感知子領域,積累了大量的實踐經驗,為基于大數據技術構建物理世界的數字孿生城市等前沿技術研究提供了實踐經驗和依據。

數字孿生是通過對物理世界的人、物、事件等所有要素數字化在網絡空間再造一個與之對應的“虛擬世界”。從而形成物理維度上的實體世界和信息維度上的數字世界同生共存且虛實交融的格局,實現對物理世界的變化的可感與可知。猶如人類的感覺神經系統,數字孿生城市可通過對城市數據的動態監測、分析、整合和利用,實現對物理世界城市生活環境的透徹感知、城市資源的全面調控、城市中各個部分協調配合和城市方方面面的便捷運作,從而構建人和城市之間和諧的新型城市形態。在數字孿生城市的構建過程中數據和核心技術是最基礎的必備條件,而現實所需的業務應用,以及對城市未來應用的期望和探索則是數字孿生城市不斷發展演進的核心驅動力。

3.1.1 數字孿生城市所需的數據類型

在數字孿生城市的構建過程中,城市的信息基礎設施在提供信息服務功能的同時也積累了海量的城市動態數據。這些數據種類繁多,難以盡述,在這里我們對較為常用的城市數據類型進行簡要的介紹。

(1) 地圖與興趣點數據。

街道與建筑是城市的基本構架,地圖數據是對城市構架進行描述的基本方式,而興趣點數據則是介紹城市各功能單元的基本信息。因此城市地圖和興趣點數據是構建物理世界的數字孿生城市的最基本元素,也是在與其他類型城市數據進行融合時的空間錨點數據。

(2) GPS數據。

安裝有GPS接收芯片的移動設備可以收集城市中人、車等流動物體活動信息,如目前應用比較廣泛的浮動車技術就是在出租車、公交車等公共交通工具上安裝GPS設備,將其作為傳感器對于城市的交通情況進行采樣。安裝有GPS接收芯片的智能手機也可以作為個人行為軌跡的收集設備,但是由于隱私、安全等諸多問題,手機GPS數據很難大規模收集應用,目前只能依靠志愿者進行小范圍收集和研究。

(3) 客流數據。

城市中市民采用不同交通工具日常出行的數據稱為“客流數據”,出租車的客流數據可以使用浮動車GPS數據配合出租車計費表的乘客狀態獲得;公交車與地鐵的客流數據則可以使用市政交通一卡通的刷卡記錄進行收集。客流數據包括的城市活動信息非常豐富,可以用于城區功能分析、人口流動監測、城市交通系統評估、多交通工具人類行為研究、城市交通經濟學研究等領域。

(4) 手機數據。

手機是人們日常生活必不可少的通信工具,所能提供的數據類型很多,包括通信錄、通話記錄、GPS定位信息、與基站間的信令記錄、上網記錄和APP使用記錄等。這些數據可以反映城市中居民活動的興趣偏好、活動范圍、規模頻率和社交關系等內容,因此具有巨大的應用潛力。

(5) LBS(Location Based Service,位置服務)數據。

LBS位置服務是移動互聯網時代一種新興的網絡服務方式,通過LBS應用所收集到的數據具有明確的地理位置坐標并兼具傳統Web服務的語義特性。LBS數據是對興趣點數據的一種深度的描述和補充,與地圖和興趣點等簡單的城市地理數據相比,它包括大量的語義信息,可以幫助人們更加深刻地理解城市運行動態。

(6) 視頻監控數據。

視頻監控技術已經被廣泛地應用在交通管理、社區安保、室內安防、娛樂通信等城市生活的各個方面,視頻監控設備所采集的海量視頻數據記錄了城市中居民生活的分分秒秒,在數字空間中形成了對物理城市的虛擬“映像”。充分利用這些視頻數據可以從某種程度再現城市生活的歷史,它們具有巨大的理論研究與應用價值。

(7) 環境與氣象數據。

氣象數據很早便受到城市科學研究的充分關注,近些年隨著人們對于環境與健康問題的日漸重視,以空氣質量為代表的城市環境數據也開始成為人們關注的焦點。城市的環境與氣象數據的一個重要的特點是其地理與時間采樣密度低,如何實現細粒度和高精度的環境與天氣數據收集和分析是該應用類數據面對的一個重要挑戰。

(8) 社會活動數據。

城市社會活動數據包括城市中的人口戶籍、金融物價、醫療衛生、能源消耗等各種社會動態數據,是深入理解和分析城市社會化行為的必備元素。由于城市社會活動數據行業性較強,容易受到行業條塊分割的影響,因此往往彼此分割孤立。打破行業條塊分割,實現多源異構城市數據的融合是深度利用城市社會活動數據所面臨的首要任務。

3.1.2 數字孿生城市的數據特性

數字孿生城市的數據特性如下。

(1) 大數據特性。

大數據具有規模性(Volume)、多樣性(Varity)、高速性(Velocity)和價值性(Value),即4V特性。

城市是人類活動最為密集的區域,海量的人類活動與社會運行數據不可避免地在城市中爆發。以北京為例,每天有超過千萬的市民出行,交通卡每天產生5 000萬條刷卡記錄;有900萬的車輛在運營,每天僅出租車GPS數據就會產生8 000萬條左右;同時有近萬個交通固定檢測器在采集車輛的瞬時車速;有近億萬條的手機通信數據;還有千億字節級的交通影視影像數據。城市數據種類繁多;規模龐大;對數據的輸入和處理速度要求高;城市數據包括的信息與知識極為豐富,對于推動人類認識的擴展與科學技術的進步有巨大的價值。綜上可以看出城市數據完全符合大數據所具有的 4V 特性,可謂是大數據概念范疇中的一個極具代表性的典型樣本。

(2) 時空多維特性。

以地圖為基礎的空間結構是城市數據的一種基本組織方式,而城市快節奏的生活方式也使得城市數據對于時間維度的變化非常敏感,因此時空多維特性成為城市數據的另一個重要特點。在空間上,根據城市地理規模的不同,城市數據具有不同尺度的空間跨度;在時間上,根據產生的時間不同,城市數據具有與事件相關的變化和分布。在進行城市數據分析和應用時,一方面需要考慮時間和空間兩個維度的數據演化特性,另一方面還需要充分利用時間和空間不同維度之間的數據關聯關系,這對城市數據的利用技術提出了很高的要求。

(3) 多尺度與多粒度。

研究和利用城市數據除了要考慮時間和空間等多個維度之外,還需要考慮數據尺度和數據粒度對于數據特性的影響。在規模的尺度上,城市可以分為小型城市、中型城市、大型城市、超大型城市等;在地理尺度上,對于城市數據的描述可以小到幾個街區或大到數千平方公里;在時間尺度上,城市數據的覆蓋時間可以短到一些事件的監控,長到上百年的城市變遷;在地理采樣粒度上,可以像遙感測繪數據一樣精確到數米,也可以像氣象環境數據一樣以區縣、地區,甚至省市為單位;在時間粒度上,根據數據采樣設備的時鐘、存儲與傳輸能力,以及計算速度等因素產生不同的時間粒度。在時空多維度的條件下,高效處理多尺度與多粒度的海量數據是有效利用城市數據所必須解決的核心技術問題之一。

(4) 多元與異構。

如前所述,城市數據具有非常多的類型與來源,即數據的多元性。這些不同來源的城市數據無論是從結構上、組織方式上,以及維度尺度與粒度上都會存在巨大差異,即數據的異構性。智慧城市的應用需求要求我們必須將這些多元異構數據進行有機融合,通過挖掘活化數據之間的相關性與相互作用方式來獲取新知識,如何在一個統一的構架上分析異構性極強的多元數據是構建物理世界的數字孿生城市面臨的一項共同挑戰。

從上述構建數字城市所需的數據類型和其特性的內容可以看出現有工作對于處理城市數據的應用類型還非常有限,城市作為人類生活活動最為密集的場所,所產生的數據類型和數量都是難以盡數的。僅就現有的智慧城市研究與建設工作來看,我們對于城市數據的開發還遠遠不足,城市這座數據寶庫中積累了無盡的數據資源等待我們進行深入的開發。

3.1.3 構建數字孿生城市所需的核心技術

構建數字孿生城市所需的核心技術如下。

(1) 數據感知技術。

構建物理世界數字孿生城市的技術從頂層設計到具體的技術細節均以海量的城市數據作為核心支撐,因此城市數據的感知與獲取技術就成為數字城市建設的整體技術基礎。傳統的城市傳感器技術在為不同的行業應用提供服務的同時也直接或間接地收集到了大量的城市動態感知數據,這些數據使得現有的數字城市建設工作成為可能。然而傳統的城市傳感技術所采集的數據繁雜不一,難以統一和利用。我們在眾多項目實踐過程中總結出了一整套多源異構數據采集、接入和整合的方法論,并形成技術研究成果用于指導項目建設。該技術成果在構建數字孿生城市過程中,有效整合并利用傳統傳感技術產生的數據起到了至關重要的作用。

隨著移動互聯網的興起,人們可以隨時隨地記錄和分享自己的所見所聞,使得“以人為傳感器”對城市進行感知的群體感知技術開始日漸興起。例如,使用微博數據對 2012年北京市“7·21”暴雨的積水點進行檢測,其結果與實際積水地點基本相符。目前,群體感知技術在智慧城市應用中還只是傳統數據獲取方式的一種補充。相信在不久的將來,該技術將會逐步走向前臺,成為智慧城市應用的一項主要數據來源。

(2) 數據管理技術。

海量城市數據的存儲、管理與檢索是一項非常具有挑戰性的工作,已有的一些研究工作說明分布式數據庫、Hadoop等現有的數據管理方式尚無法完全滿足智慧城市應用對于海量數據查詢與管理的實時性和靈活性要求。造成該問題的根本原因在于用于智慧城市應用的海量城市數據并非專門為建設智慧城市而收集(多為城市信息化和數據化過程中的信息基礎設施收集),數據管理系統的設計者更多考慮的是其初始的數據應用需求,而沒有對智慧城市應用做任何數據管理優化;同時城市計算等智慧城市技術在數據利用方面又有異常廣闊的想象空間,即便是智慧城市研究的專家也無法列舉所有可能的應用模式。這就導致了數據管理系統的設計者在開發系統時無法獲知系統應用者的具體應用需求,從而引起數據管理系統與應用系統之間的不匹配,影響系統的整體性能,如何解決這一問題目前尚無成熟的技術方案和支撐理論。

(3) 數據挖掘技術。

數據挖掘技術是大數據時代進行數據利用和知識發現的另一項核心關鍵技術,構建以數據為中心的智慧城市也必然需要數據挖掘技術的大力支持。該領域中一個主要的挑戰在于如何在海量多源的城市數據中尋找合適具體應用的數據子集。例如,城市動態檢測研究往往需要所使用的城市數據子集盡可能多地涵蓋城市動態特性的各個方面,而具體的附加行業應用則要求數據信息更加準確可用。這些互斥性的數據需求給城市數據的收集、管理和挖掘都帶來了巨大挑戰,解決好數據子集的選擇問題與子集間不同數據的融合問題是在智慧城市領域進行數據挖掘研究的關鍵所在。

(4) 數據活化(data vitalization)技術。

數據活化概念是由北京航空航天大學熊璋教授所提出的一種全新的數據管理與應用模式,即賦予數據生命。該技術的核心在于將真實物理世界中的數據內在聯系映射到數據存儲與管理的數字空間中,使存儲空間中相互隔離的數據變為一個有機的整體。恢復數據在物理世界中的關聯性,并突破信息空間在數據利用時的局限性。數據活化體系結構采用“活化細胞”(Vitalized Cell)對數據進行組織。該細胞作為數據組織和管理的最基本單元,一方面具有存儲數據的能力;另一方面也具有映射物理空間中數據聯系與相互作用的計算能力。活化細胞在存儲數據的同時會根據實際應用的不同,不斷地學習用戶應用行為并對細胞中的數據進行重組織,使數據可以更好地適應多樣化的用戶需求;同時當物理世界中數據描述對象發生變化時,活化細胞還可以通過自主演化的方式來改變數據的存儲結構和內容,從而實現存儲數據的代謝與演化過程。

數據活化技術非常適合追蹤物理世界中的對象實體在數據空間中的映射演進過程,是處理海量城市數據及構建智慧城市的有力工具。熊教授等學者使用數據活化的思想設計了一種海量城市數據聯網的數據組織工具(Internet of Data,IOD),該工具可以對現有物聯網數據進行活化組織,非常適合城市中海量物聯網與傳感器數據的管理。使用數據活化技術對監控視頻數據進行結構化描述,可以用于解決城市視頻監控數據的高維度和非結構化問題。除此之外,數據活化技術也受到了工業界的密切關注。美國Bardess Group Ltd公司基于數據活化技術開發了一種Data Revitalization的數據管理解決方案,該方案的數據管理架構共由5層組成,并且具有更新、學習和演進的能力。使用該架構可以有效提高企業數據資產的整體管理質量,如圖3-1所示。

圖3-1 Data Revitalization解決方案架構

數據活化技術已經在智慧城市、視頻數據分析、企業數據資產管理等數據密集性應用領域初步展示了其技術優勢,使用該技術對城市數據的組織與管理方式進行重構,從數據的底層結構開始實現數據的智慧化將會是未來智慧城市技術研究的一個重要的發展方向。

(5) 數據可視化技術。

智慧城市技術是一種與普通民眾生活緊密結合的應用技術,友好親切的服務呈現方式是其中必不可少的環節。數據可視化技術能夠將紛繁復雜的城市數據以一種簡潔有序的方式呈獻給用戶,可以很好地填補技術到用戶之間的理解鴻溝。在城市數據應用的推動下,數據可視化必然會成為未來智慧城市技術體系中至關重要的一環。

(6) 統計物理學理論。

物理學是研究物質世界最基本的結構、最普遍的相互作用、最一般的運動規律及所使用實驗手段和思維方法的自然科學。基礎物理理論對于工業應用技術的影響是往往是變革性的,17世紀牛頓經典力學引發的工業革命,以及20世紀量子力學引發的新技術革命都是非常好的證明。進入21世紀之后,人類活動行為的基礎理論研究成為統計物理學的一個新興研究熱點,復雜網絡理論及人類活動時空動力學等研究成果不斷涌現,這些成果必然會引發城市技術發展的巨大變革。在這樣的大趨勢下,誰能夠更好地利用統計物理學的相關研究成果,誰就能夠在日趨激烈的智慧城市技術競爭中占得先機。

3.1.4 構建數字城市在交通、能源、居民生活等多方面的應用

1.數據驅動的智能交通

城市交通系統是城市中信息化程度較高的部分,浮動車、一卡通、微波線圈、攝像頭等交通傳感與信息化設備可以有意或無意地將城市中交通參與者的交通行為記錄下來,從而為數據驅動的科學研究提供研究樣本;同時由于城市交通領域自身的數據富集優勢,又使得以數據為中心的智慧城市技術能夠率先在智能交通領域中發揮重要作用,我們稱這類技術為“數據驅動的智能交通技術”。以數據驅動的智能交通技術研究中所采用的城市數據主要包括地圖與興趣點數據、GPS數據、客流數據、道路微波測量數據等。通過多種手段對采集到的數據進行分析和理解,實現感知城市的交通運行狀況,為市民提供交通引導、導航、推薦等智能服務。

數據驅動的智能交通技術可以被細分為支撐層面和應用層面兩個層次的研究。

支撐層面的研究集中在全城交通的感知與分析方面,其目的是感知城市的總體交通狀況、分析全市交通的統計行為特征,并建立分析模型為具體的智能交通應用提供數據分析與交通狀態評估支撐。例如,基于城市交通監控數據的實時路況報告作為一種成熟的技術已經得到非常廣泛的應用,對于城市中具有特殊特性路段的檢測和查詢索引、平均通勤時間評估、交通異常與事故的檢測等研究可以極大地提高城市道路交通的管理效率;另外通過對GPS數據的深入挖掘和分析,可以進一步理解城市中交通運行的具體模式,提供交通流量的評估、預測和管理等應用服務。

應用層面的研究則集中在城市交通管理與運行的各項服務應用中,基于GPS的路徑導航服務是最為典型的應用之一,豐富詳盡的地圖數據配合實時的路況分析結果可以為用戶提供非常優質的行駛路徑導航服務。包括人類的行為信息和車輛的GPS數據提供給司機可以進一步優化導航路徑的選擇。微軟亞洲研究院開發的T-Driver車輛導航系統就采用了這樣的設計理念,該系統統計了北京市城區出租車的GPS行駛數據,然后將不同地標之間駕駛技術最嫻熟的出租車司機的駕駛路徑用圖的方式組織起來形成了一張包括出租車司機駕駛知識的地標圖。用該地標圖來進行路徑導航,可以有效地提高車輛在擁堵時段的行駛效率。該研究的主要特色在于將數據統計中獲得的人類智慧應用到傳統的信息化交通服務中,將車輛導航應用由傳統的“以計算為中心”變為“以數據為中心”。所采用的核心技術也由傳統的規劃技術變為以數據為驅動的統計技術,其意義非常深刻。

另一類被廣泛研究的應用是出租車與乘客之間的推薦服務。該類研究最重要的任務是理解出租車與乘客的行為模式,以及兩者之間的交互關系。法國電信研究院研究小組通過對 5 350 輛出租車駕駛行為的研究,分析比較了不同出租車尋客策略的有效性,對如何通過優化出租車的載客策略來提高出租車司機收入進行了深入研究。北京航空航天大學的徐老師等通過對北京 1 200 輛出租車的乘客數據分析,研究了優化的乘客打車策略,并基于該研究開發了名為“TaxiWaiter”的打車輔助系統。T-Finder系統則同時考慮了出租車與乘客兩個方面的需求,通過對街道打車概率的統計和分析來推薦出租車尋客路線和乘客打車路線。

路徑導航(行車路線推薦)、出租車尋客路線推薦和乘客打車地點推薦都屬于由資源約束的分配推薦問題,其本質是一個帶約束的多方博弈,現有的技術提供的均是局部優化的解決方案。博弈論的相關知識告訴我們分布式的局部最優并不能保證帶來最終的全局最優解,如果所有的出租車均按照推薦的行駛路線到乘客較多的地點爭奪乘客,那么一方面會導致這些地點成為較難尋找顧客的地點;另一方面還會導致其他地點的乘客由于缺乏出租車而打不到車。解決該問題的一個途徑是采用集中調度的手段實現全局的車輛負載均衡,這種方案雖有較好的理論性能,但是實現起來非常困難;另一個途徑是在推薦算法的設計上引人博弈懲罰機制,以多輪博弈的方式實現分布式的全局最優,相關的理論與應用研究還需要進一步深入探討。

出租車行駛的異常軌跡檢測也是智慧城市建設非常關心的問題,如何區分出租車司機為躲避擁堵而進行的適當繞行和惡意的“宰客”繞行是該類問題要解決的核心問題。法國國立電信學院設計提出的iBAT/iBOAT算法可以有效地對繞行出租車進行在線識別或軌跡識別,其分析結果顯示偏愛繞路的司機所對應的月收入并不比不繞路司機的平均值高。一些司機想通過惡意繞行來增加收入往往只是一種心理安慰行為,這對于設計合理的出租車收費政策和避免司機惡意繞行有非常重要的價值。

以數據為驅動的智能交通技術還可以在優化城市公共交通系統方面發揮巨大的作用,B-Planner 系統使用出租車 GPS 數據所提供的城市通勤需求信息重新設計了杭州市夜間公交車的行車路線,滿足了不同時段人們對公交線路的不同需求;T-Share出租車拼車系統通過綜合考慮打車人的位置、目的地,以及出租車的行駛路徑等因素,對出租車的拼車路線進行了合理規劃,在充分利用出租車自由靈活特性的同時提高了搭載乘客的通勤效率;Flex則使用GPS數據設計了一種靈活性介于公交車和出租車之間的小型綠色公交系統。隨著軌道交通系統在各個城市的發展,乘坐地鐵出行成為城市居民越來越多的選擇,針對地鐵軌道交通的智慧城市交通數據研究也得到越來越多的重視。北京航空航天大學使用北京地鐵系統的客流數據,對北京市軌道交通的負載流量進行了預測分析,其研究成果對于保障軌道交用運營安全和提高軌道交通運營效率有非常重要的意義;Capra 等人對倫敦地鐵系統(tube)的客流擁堵模式進行了系統的分析,并以此為依據提出了避免地鐵擁堵的技術方案。除此之外,綜合利用多種交通工具的客流數據還可以實現對用戶全出行路徑的系統規劃與出行時間估計。以此為基礎開發的城市交通公共服務系統對于優化城市的整體出行效率、改善市民的出行交通體驗等都有非常大的幫助。

從上述工作可以看出,智慧城市建設技術在數據驅動的智能交通領域取得了豐碩的成果。值得注意的是現有的系統與成果大多是依靠浮動車GPS、一卡通、微波探測線圈等結構化較好的數據源。對于包括豐富語義信息,但結構化程度低、信息維度高的城市交通視頻監控數據現有研究使用的還非常少。有關監控視頻的應用研究依然停留在視頻處理、語義提取、事件理解等階段,在智慧城市技術體系中扮演著數據準備的角色,尚不足以完全支撐以知識發現為目標的集成應用。這一方面是因為高維視頻語義分析理解難度大,相關技術尚不成熟;另一方面也是因為視頻數據的體量過大,很難按照城市的規模進行協同組織與處理。解決城市交通監控視頻上述兩個方面的挑戰將是以數據為中心的智慧城市研究在智能交通領域所要面臨的一項重要任務。

構建物理世界的數字孿生城市也能為不同的城市行業應用提供巨大的幫助,海量的城市數據的收集過程本身就是為了支持與之相對應的行業應用。例如,浮動車GPS數據是為了監測道路的擁堵狀況;手機數據是為了提供手機通信服務;一卡通客流數據是為了提供方便的公共交通服務等。除了這些數據本身所對應的專門應用之外,城市數據還可以用于提供與最初數據收集過程無關的行業應用,我們稱之為“附加行業應用”。附加行業應用的一個重要特點是人們無法獲得充分的目標行業數據,而只能采用相關的外圍城市數據建立行業信息與外圍數據之間的關聯模型,再利用模型和綜合數據反推行業應用所需的信息。如何從包括城市綜合特性的外圍城市數據中提取某一特定附加行業應用所需要的信息是附加行業應用所面臨的主要挑戰,一些具有代表性的研究工作包括能源消耗、空氣質量、住房價格和地圖測繪等。

(1) 能源消耗。

能源是維系城市運轉的動力所在,隨著全球能源的日益枯竭,降低城市能源消耗和構建綠色城市成為智慧城市建設的核心目標之一。然而城市作為一個復雜的能量代謝系統,即便是弄清楚城市對某一種特定形式能源的消耗量也是非常困難的。為解決這一問題,微軟亞洲研究院的鄭等人利用出租車 GPS 數據和城市加油站的興趣點數據對北京市機動車輛的每日汽油消耗量進行了估算。該研究所要解決的挑戰一方面在于出租車并不能完全代表城市中全部車輛的行為,每一個加油站中正在加油的車輛中只有一小部分是出租車,也并非每個加油站每時每刻都有出租車在加油;另一方面GPS數據只包括出租車的行駛軌跡與運營狀態信息,沒有明確的車輛行駛意圖信息。一輛出租車在加油站附近出現并不能說明其正在加油,需要有專門的算法對出租車的加油行為進行檢測和判斷。針對上述兩個方面的問題,鄭等人設計實現了從GPS軌跡數據中發現加油事件的檢測方法,提出了一種能夠在稀疏張量中分析汽車在加油站中加油所消耗時間的評估算法,并實現了能夠通過加油時間推斷加油站車輛到達頻率的排隊計算方法。該研究可以為普通用戶提供加油站的推薦服務,也可以為石油公司的加油站建設規劃提供意見;同時還可以讓政府了解和掌握整個城市的能源消耗情況,從而制定更為合理的能源管理政策。

除了以上研究工作之外,還有通過分析城市人口、車輛GPS數據,以及興趣點等數據來規劃電動汽車充電站的建設,或通過分析車內總線傳感器的數據來設計更加節能環保的汽車駕駛方式等研究。

(2) 空氣質量。

大氣污染問題是我國主要大型城市所面臨的一個巨大的環境問題,尤其是近幾年,北京的空氣質量問題受到了從政府到公眾的一致關注,PM2.5、霧霾、空氣指數等不斷成為新聞媒體所熱議的關鍵詞。為解決我國城市近兩年持續出現的空氣污染問題,國務院于2013年09月10日印發了《大氣污染防治行動計劃》,提出要從10個方面采用綜合手段防治大氣污染。然而空氣污染也具有非常復雜的成因,人們對于大氣污染的認識依然存在許多空白。例如,大氣中的首要污染物究竟是由什么原因造成的?在交通、工廠、氣候、天氣、人口及植被中,究竟哪一個才是對空氣質量影響最大的因素?現有的空氣監控系統能否滿足大氣污染治理的實際需要?只有回答了這些問題才能夠真正實現對大氣污染的有效防治。

基于城市計算技術的U-Air系統在該領域取得了初步的研究進展,該系統對北京市22個空氣監測站的PM2.5數據讀數進行了分析研究,發現即便是在相同的天氣條件下距離非常接近的兩個空氣監測站的PM2.5數據依然會有數倍的差距。這意味著如果采用線性差值的方法,目前較為稀疏的監測站分布并不能完全反映整個北京市的空氣質量情況。市民在得知空氣質量較好的情況下,很可能會外出進入一個空氣質量非常差的市區,從而引發健康問題。為了解決這一問題,U-Air 系統利用機器學習技術使用城市的氣象數據、交通數據、城市結構數據等訓練獲得了城市空氣質量的時空模型,并使用該模型實現了以 1 km2為單位的細粒度城市空氣質量報告;此外,該模型還能夠很好地度量不同城市動態因素對空氣質量的影響情況,該研究成果為進一步的空氣質量預報和空氣污染治理等大氣污染防治工作奠定了初步的基礎。

(3) 城市經濟學。

城市經濟學是經濟學的一個重要分支,其研究對象是城市中各要素在社會經濟系統中的相互關系和運行方式。通過構建物理世界的數字孿生城市采用全新的視角來分析城市經濟學問題,與傳統的經濟學分析模型不同,數據挖掘、機器學習等人工智能技術在這里扮演了核心角色。英國科研人員設計開發的 Geo-Spotting 系統使用機器學習的方法,利用Foursquare 應用提供的 LBS 數據對紐約城區的店鋪地理位置與營業收益的關系進行了分析,并以此為依據幫助商戶進行店鋪選址;此外,一些關于城市商業區分布的城市功能區域識別工作也可以列入城市經濟學的范疇中。

(4) 地圖測繪。

城市交通數據在地圖測繪方面也能夠發揮非常大的作用,對于城市中一些新修建且未進行地圖測繪的街道可以使用車輛的行駛軌跡數據測量,這樣的測繪方式可以極大地提升城市地圖的測繪效率并有效地降低測繪成本。該功能應用的范圍非常廣泛,如使用城市交通的GPS數據繪制地圖、檢測雙向道路路鏈的地圖生成算法,以及檢測城市中立交橋交叉點繪制地圖的方法等。

綜上所述,附加行業應用的相關技術專注于智慧城市建設某一領域的特殊需求,核心任務是建立已知城市數據同城市未知特性之間的關系模型。該類研究所面臨的關鍵挑戰在于如何降低現有數據同無關特性之間的耦合程度,以及挖掘數據同目標應用之間的相關聯系。在該類應用中數據所包括的城市動態信息越單一,越有助于問題的求解。

2.城市人類行為統計力學應用

人類行為統計力學是統計物理學的一個重要分支,主要研究內容是使用統計的手段揭示人類行為的內在規律,采用的研究手段以復雜網絡、復雜系統等物理學工具為主并綜合融入信息科學、社會學等多學科研究工具。該領域的研究早期由物理學家發起,近幾年越來越多地受到信息科學等其他領域科研人員的關注。城市環境下的人類行為統計力學研究我們稱之為“城市人類活動統計力學”,該類研究與智能交通、城市計算等信息學科研究的不同之處在于其更加關注揭示數據背后所蘊含的自然規律,應用色彩并不濃重。

(1) 城市交通網絡分析。

與城市交通網絡分析相關的統計力學研究來源于復雜網絡的相關研究,1998年Watts和Strogatz在《Nature》雜志上發表文章提出了小世界(Small World)網絡模型,描述了從完全規則的網絡到完全隨機網絡的網絡轉變。小世界網絡既具有與規則網絡類似的聚類特性,又具有與隨機網絡類似的較小直徑。隨后,1999年Barabdsi和Albert在《Science》雜志上發表文章指出許多實際的復雜網絡的連接度分布都具有冪律形式。由于冪律分布沒有明顯的特征長度,因此該類網絡又被稱為“無標度(Scale Free)網絡”。在兩篇經典網絡研究論文的推動之下,復雜網絡理論開始在各個學科顯現出巨大的能量,并逐漸成為交叉學科研究的熱點之一。

在城市研究領域,道路交通網絡,特別是軌道交通網絡成為復雜網絡理論應用的主要領域。如國外某研究機構對美國波士頓市的交通網絡、印度的鐵路網絡,以及波士頓和維也納的軌道交通網絡進行了研究,發現上述網絡均滿足小世界特性;另有韓國某研究機構用公共交通數據和私人交通數據對韓國的高速公路網絡進行了研究,研究結果顯示公共高速公路網絡為無標度網絡。但與私人交通網絡合并后,網絡不再具備無標度網絡特點,而是符合重力模型。該機構還對韓國首爾的地鐵網絡進行了研究,研究顯示首爾地鐵邊的權重分布為冪律分布。對于客流數據通過生成樹模型構造出的圖,其強度為對數正態分布,度分布為冪律分布;新加坡某研究機構則對新加坡公共交通網絡進行了分析,結果顯示就網絡拓撲特性而言,軌道交通網絡更接近于隨機網絡。但在考慮客流網絡后,網絡整體呈現出無標度網絡特性;加拿大某研究機構則對加拿大多倫多市的地鐵網絡的未來發展規劃進行了評估,結果顯示多倫多地鐵網絡在之后25年將更加優化。由于我國城市軌道交通發展的相對較晚,因此國內城市交通網絡的研究目前主要集中于公交網絡。涉及地鐵網絡的只有對北京和上海地鐵網絡的研究,但這些研究大多局限于利用仿真模擬方法討論網絡抗毀性方面的特性等。

(2) 城市居民行為建模。

城市居民的行為建模是人類時空動力學研究的一個子集,人類行為的時空動力學研究開始于2005年Barabasi教授在《Nature》雜志上發表的一篇有關人類行為時空特性的論文。該文認為人類行為在時間上分布并不符合對泊松過程,并提出了一種基于優先級的排隊論模型,該模型顯示人類活動的時間分布更加接近于冪律分布。隨后,Brockmann 等人在《Nature》雜志上發表了關于人類行為空間標度律的研究,該研究顯示人類長程旅行中表現出來的空間行為既不同于隨機游走過程,又不同于 Levy 飛行過程的獨特性質。人類行為的時空動力學很快成為統計物理學和復雜性科學研究的熱點領域,城市作為人類活動最為密集的區域之一,在該研究領域中必然不會缺席。在眾多城市數據中,最先被用來分析人類行為時空的是手機數據。例如,某機構用志愿者3~6個月的短消息通信記錄進行人類活動的時間分析,發現其行為符合冪指數在1.2~1.7之間的冪律分布;利用2006年新年期間600萬用戶的3 000萬條短信數據進行統計分析,發送時間間隔和回復時間間隔均符合截尾冪律分布;對來自3家公司14萬用戶的150萬條短信記錄進行分析,發現其符合雙模分布,即前段為冪律分布;后段為指數分布。

在人類行為時空研究方面也有豐富的技術成果,如通過分析10萬名手機用戶在6個月內的通話地點記錄,發現這些用戶的移動距離服從帶有指數尾的冪律分布。或使用同樣的手機通話地點數據對人類空間活動模式的可預測性進行了分析,分析結果顯示樣本數據中的用戶活動在空間上具有93%的可預測性,而且不同個體的可預測性差異并不大。瑞典某研究機構對瑞典4個城市中50輛出租車6個月的GPS軌跡數據及出租車乘客的出行行為進行了統計分析,研究認為出租車乘客的乘車距離服從雙段的冪律分布;北航的徐老師等人使用北京市近兩萬輛出租車3個月內的GPS軌跡數據,對出租車乘客的乘車距離特征進行了更加精確的統計測算,結果發現出租車乘客的乘車距離與時間長度均服從指數分布,而非冪律分布;Bazzani教授的研究小組使用意大利羅馬、博洛尼亞、西尼加利亞和佛羅倫薩等城市的私家車GPS數據對私家車主駕車出行的行為特征進行了統計分析,統計結果顯示這些城市的車輛行駛里程都近似服從指數分布。

倫敦某研究機構使用倫敦地鐵中200萬名乘客在一周時間內的IC卡刷卡數據,對于乘客的乘車距離進行了統計,研究發現地鐵乘客的乘車距離更加近似于負二項式分布,而非通常認為的冪律分布或類似出租車乘客/私家車主出行距離的指數分布;另一研究機構則對230 名志愿者填寫的日常出行日志數據進行了研究,該研究的一大亮點在于對個體行為的空間特性進行了分析。研究結果顯示在混合交通情況下,交通費用通常與出行距離具有線性關系,而出行時間與距離則具有“對數+線性”關系。出行距離分布近似為帶有指數截斷的冪函數律,而在單一交通工具出行時間和距離是線性關系。

2012年Albert-Laszlo Barabasi教授在《Nature》雜志上發表的一篇文章中提出了一種關于城市間市民出行活動范圍的“輻射”模型,該模型相比交通領域中傳統的引力模型更加準確且沒有參數。該文很快引起了學術界對城市交通出行行為的關注,人們對于城市的人類活動行為的研究重點也開始從出行距離的標度律研究擴展到了城市與城區之間的人口移動流量研究。北京航空航天大學徐老師等人基于多個城市的出租車與出行數據分析提出了一種新的群體移動模型,能夠模擬和預測城市內不同區域間的人口移動的流量。基于這一模型的理論分析進一步表明造成出租車出行距離呈指數分布的根本原因在于城市內人口密度呈指數衰減。針對城市內出行模式與城市間出行模式的不同特性,北京師范大學的王教授等人提出了一種Conduction-like Stochastic Process模型來進一步準確刻畫城市內人口流動的通勤特性。

綜合上述研究可以看出,利用來源豐富的城市多源數據和強大的統計物理工具我們可以深刻地理解城市道路、交通結構,以及人類活動行為的本質特性。相對于基于機器學習、數據挖掘等計算機技術的城市計算等研究,該類研究領域的研究結論具有很強的可解釋性。在應用方面,我們可以看出相關的技術研究成果可以很好地為智慧城市中的交通規劃建設、定制推薦、傳染病防控等應用服務。

3.1.5 多源城市數據的緊耦合,數字世界與物理世界的交互

構建和諧宜居的智慧城市系統,實現人與環境、人與城市和諧發展的智慧城市愿景,依然存在諸多挑戰,這些挑戰需要多學科和多領域的研究人員相互配合、凝聚智慧并共同面對。在這里,我們對未來在以數據為中心的智慧城市領域可能有所突破的研究方向和有待突破的研究問題進行展望。

(1) 多源城市數據的緊耦合。

城市是一個復雜且龐大的復雜動態系統,任何一方面的動態特性都會在不同的數據空間中有所體現。現有的智慧城市建設工作往往只能利用城市數據空間中的一兩種數據,即使是多源數據融合的研究工作也往往是某一類數據為核心,加之地圖和興趣點等城市 GIS錨定數據作為支撐。例如,出租車GPS數據+地圖和興趣點數據等。多源數據的耦合度并不高,利用模式也相對單一。如何充分挖掘城市核心數據的關聯性,實現多源數據之間的緊耦合將是未來智慧城市中數據應用技術發展的必然趨勢。

(2) 信息世界與物理世界的交互。

構建物理世界數字孿生城市的根本目的是為了服務城市與市民,即將信息空間的智慧應用到真實的物理世界中;同時,應用了智慧城市新技術的物理世界也會發生變化并在信息空間中有所反饋,研究人員還需要根據這些反饋進一步改進技術。這種信息世界與物理世界的交互過程將不斷地迭代進行,并且逐步實現自主演化,最終構成一個具有自我改進能力的反饋系統。目前業界還沒有太多相關的技術及應用,但相信不久的將來物理世界與信息世界的交互研究將會成為智慧城市研究的一個重要方向。

(3) 城市深層次數據的利用。

城市的運行過程涵蓋了交通、經濟、社會、物流等多層次、多方面的社會活動,現有研究工作所采用的地圖數據、交通數據、通信數據、環境數據等都只是反映了城市活動的物理與信息接觸行為,并且均是以地理位置坐標進行錨定標注的。對于一些深層次的城市邏輯行為,如資金流動、政策導向、社會心理、流行時尚等現有研究工作都少有涉及,開發利用城市深層次數據、挖掘城市運行的內在邏輯關系將會是智慧城市技術發展的未來方向之一。

(4) 城市行為動力學理論體系。

城市行為動力學是理解城市內在行為與市民活動規律的基礎理論,在整個智慧城市研究的理論體系中扮演著非常重要的角色。目前的城市行為動力學理論研究還只是依附于人類行為時空動力學的一個統計物理學分支,尚沒有形成完整的理論體系,具體內涵與外延邊界也尚不清晰。因此未來完善和發展系統的城市行為動力學理論,構建完整獨立的理論體系將是智慧城市基礎理論研究的核心任務。

綜上所述,構建物理世界的數字孿生城市是未來現代化城市的發展方向,以數據為中心的智慧城市技術是支撐智慧城市建設的技術基礎。隨著城市信息基礎設施建設的日漸成熟,人們對城市智慧化的需求也越來越迫切,智慧城市建設正在得到來自不同學科科研人員的密切關注。無論是在信息科學領域、城市科學領域,還是環境、能源、物理學等學科領域,以數據為中心的智慧城市都在逐步成為人們感興趣的熱點領域。尤其是在數據科學崛起的大背景之下,以數據為中心構建物理世界的數字孿生城市將會成為數據信息技術從虛擬數字空間走向真實物理世界的第1個階梯,未來的前景與影響力不可估量。

主站蜘蛛池模板: 临沭县| 南安市| 云南省| 威信县| 小金县| 望江县| 伽师县| 高安市| 昭平县| 洛扎县| 府谷县| 山阴县| 含山县| 页游| 晋州市| 台中县| 嘉鱼县| 溧水县| 磴口县| 龙陵县| 枝江市| 扬州市| 新营市| 镇康县| 龙门县| 东山县| 成都市| 深圳市| 阳东县| 沙雅县| 巴林右旗| 荆门市| 抚远县| 木兰县| 崇义县| 龙口市| 山东省| 宁津县| 固阳县| 延寿县| 墨玉县|