- 政治學評論(2023年第1輯)
- 佟德志主編
- 4750字
- 2025-04-28 20:30:17
三 時空分析
在使用移動終端和社交媒介時產生的具有時間和位置屬性的大數據被稱為時空大數據(spatial-temporal big data)。隨著傳感器、物聯網和社交媒介的普及化,時空大數據逐漸增多,對時空大數據分析也越來越重要。早在2011年,麥肯錫環球研究院就認為醫療保健、零售、公共領域、制造業和個人位置這五大類數據組成了當前主要的大數據流。[114]目前,常見的時空大數據包括移動運營商或手機應用程序自動記錄的個人移動軌跡數據、GPS設備記錄的移動軌跡數據、各種監控設備記錄的位置移動數據以及社交媒體用戶發布的位置信息等。在概念上,對時空大數據的定義尚未統一,通常從特征入手,認為時空大數據是指基于統一時間和空間范圍,與人和物體位置及其變化有關的數據。按照面向對象的差異,時空大數據也可以劃分為遙感大數據和具有位置坐標、時間標簽的大數據。[115]
時空大數據有特殊價值。時空大數據能夠反映特定區域內,在時間變化之下,人口和物體分布狀況和流動趨勢,能夠探索現實空間內各個實體的數量、質量、結構和關系,隨時間變化發生演變的規律、模式和趨勢。具體來說,時空大數據在空間和時間上具有動態演化特性,這些基于時空大數據要素的時空變化是可被度量的,時空大數據具有尺度特性,根據比例尺大小、采樣粒度以及數據單元劃分的詳細程度,可以建立時空大數據的多尺度表達與分析模型,時空大數據具備多維動態可視化特性,實時獲取對象在不同階段的行為特征,通過參照并映射到三維地理空間中,可以實現動態可視化渲染效果,從而更好地覺察、理解和預測對象的發展。[116]因此,對時空數據的挖掘和計算成為一項研究熱點。學界致力于開發各種模型來提取時空大數據當中隱藏的個體行為、群體行為、社會空間差異和變化規律。目前,時空大數據的計算技術體系包括兩個方向:一個是面向大規模、多介質的信息,使計算機可以處理更大范圍的信息;另一個則是深入結合人工智能,使計算機系統可以更加智能地處理信息。時空大數據的智能化處理主要依托深度學習,即通過歷史數據結果,生成復雜多元公式,然后依托公式或算法擬合所有數據,并套用公式得到實際場景的結果。[117]
在運用范圍的擴展中,政治學研究領域也認識到了時空大數據的重要性。時空大數據的運用場景逐漸多元化。時空大數據常用于氣候變化研究、公共安全監測、資源保護、交通監測、公共衛生監測和城市治理等多元化的領域。時空大數據的計算方法和軟件平臺也在不斷發展,致力于從中挖掘有價值的知識模式。可度量的和不可度量的空間關系以及時間關系都需要在數據挖掘中加以考慮,然而這些時空關系往往是隱含在時空數據中的,這就需要在數據挖掘系統中結合時空推理來處理這些復雜的時空關系。在此背景下,時空大數據也進入了政治學的研究領域。國內外的一些學者嘗試利用時空大數據來對政治現象的變化及其趨勢展開探究,揭示政治現象變化與時空分布和演進的內在關聯,從時空大數據中挖掘出新的規律,檢驗或建構政治學的基本概念、假設和理論。
目前,以時空大數據為基礎的研究方法十分多元,尚未形成統一的劃分標準,時空大數據在政治學研究中的運用也處于起步階段。盡管豐富和可共享的空間數據能夠將空間概念引入政治學分析框架,然而,受數據獲取能力和分析能力的限制,政治學研究中空間分析的應用還非常缺乏。[118]根據目前的研究動態,國內外政治學界在利用時空大數據研究政治問題時存在著靜態和動態兩種思維模式取向。在靜態意義上,學者們大多以單位時間和空間為二維橫截面,探討特定時間和空間范圍內政治要素的分布情況,從中歸納出政治要素的時空分布規律,將其總結為一般性的政治學規律。而在動態意義上,學者們大多關注時間和空間變化基礎上的政治要素變化情況,在時空演變和政治要素變化之間建構關聯。因此,基于時空大數據的政治學研究可以大致劃分為時空分布分析和時空演進分析。
(一)時空分布分析
時空分布分析是從靜態角度通過聚類或分類挖掘時空大數據要素的時空分布特征及其規律。通常來說,時空分布分析的目的是挖掘要素與特定時空的關聯模式,將這種模式作為要素的時空分布規律。在大數據政治學中使用時空分布分析,能夠從靜態維度來呈現特定時間和空間范圍內政治要素的分布情況,包括政治主體和政治客體的時間和空間分布狀態,從要素分布的差異或共性角度來反映政治現象的時空分布規律。
目前,多種軟件、平臺和方法能夠實現時空大數據的分布分析。MapReduce、Storm、Spark、Flink等軟件平臺能夠實現時空大數據的存儲和有效計算。在可視化方面,比較典型的是基哈伯網站 (Git Hub) 上共享的海杜普地理信息系統工具 (GIS Tools for Hadoop),用戶可以利用其對上億條空間數據記錄進行過濾和聚合操作,在報告中嵌入大數據地圖進行研究。國內的“百度地圖”等平臺也能夠較好地展現時空大數據。目前,常用的時空數據挖掘任務主要表現為時空模式發現、時空聚類、時空異常檢測、時空預測和分類以及時空推理,[119]致力于在特定時空范圍內探討要素的分布規律。
從時空大數據中探索要素的時空分布,能夠發現政治主體的行為時空分布情況,將這種分布情況與其政治屬性進行聯合分析,為傳統的政治學議題提供更加新穎的數據來源和分析視角,對這些問題的基本結論也能夠有所推進。有學者將美國手機用戶的位移情況與選舉數據進行結合分析,從家庭聚會頻率分布情況來探討美國政治極化發展趨勢。通過融合超過1000萬美國手機用戶的流動數據與選區選舉數據庫,揭示了美國政黨分歧已經影響到家庭的關系,研究發現,有黨派分歧的家庭在2016年大選前感恩節晚餐的聚會時間要比無黨派分歧的家庭少30—50分鐘,且選舉廣告會加劇這個差別,不同黨派家庭成員之間原本可以通過家庭聚會獲得更多溝通機會,但研究發現這種時機正逐年減少,[120]這種現象也反映了美國政治極化使家庭內部的黨派分歧正在加劇。
利用公眾居住和活動時空分布特征來研究族群關系和種族主義,也是時空大數據在政治學研究中一種比較新穎的方式。在此議題中,學者們通常會利用居民出行活動的時空特征,判斷居住分異和社會隔離是否發生以及發生程度。例如,使用地理位置及其數字標記識別不同種族、收入人群的日常活動空間,發現存在社會隔離的空間邊界,并將其與特定政治現象聯系起來。[121]
例如,有學者將美國居民的居住位置與種族隔離情況進行了聯合分析,根據美國50個主要城市40萬人在推特上顯示的住址數據來研究美國的種族主義,研究發現,各種族和收入人群的移動距離和訪問過的鄰居數量在大都市地區都差不多,但是黑人、拉美裔人與富人、白人中產階級的接觸要遠遠少于白種人,貧窮的白人社區與富有的白人社區也是相互孤立的,該項研究從人們流動性的角度揭示了美國雖是多元文化國家,但人們在地域上還是被種族和社會階層所分隔,因此導致黑人和貧困階層缺乏與主流社會的交往,從而不能共享時空便利條件。[122]另外,在美國種族主義這一問題上,也有學者根據居民住址和附近銀行設施的便利性程度,探究了不同種族居民的公共服務供給程度的差異。小馬里奧(Small Mario)等人基于600多萬個位置查詢數據,計算了步行、開車或乘坐公共交通工具到最近銀行所需的時間,結果表明,種族比階級的影響更為顯著,貧困和少數族裔聚居區域內獲取銀行服務便捷性相對更差。[123]
時空大數據也被用于評估特定治理單元內公共風險的分布情況。在公共衛生治理領域,可以基于騰訊用戶密度數據評估人群聚集風險的等級和空間分布,同時結合事故發生的概率、事故后果的嚴重性和風險規避因子,政府可以確定不同區域的人群控制措施,以降低人群聚集風險,防止危險事件的發生。[124]也有學者結合基于主體的模型和易感—暴露—感染—去除模型,提出了一個基于個體的流行病模型,并對新冠肺炎在廣州市11個公共場所的城內傳播過程進行了探索,結果顯示,利用現有大數據和重力模型估算的動態市內出行流量的精度是可以接受的,時空模擬方法很好地再現了新冠疫情的過程,發現了四種時空傳輸模式,這些模式高度依賴城市的空間結構和位置,基于位置的精確干預措施應根據不同的區域實施進行快速和準確的風險評估,并在流行病暴發前實施干預措施。[125]
利用時空大數據也能夠從公共政策影響和效果的時空分布上,對公共政策績效進行評估。公共政策在不同時空場域內的效果受多方面因素制約,績效也有差異。通過搜集相關的時空大數據,能夠對政策效果時空分布差異進行宏觀分析,對公共政策進行更加精準地追蹤、總結和反饋。在生態環境領域,政策的效果差異顯著。一些學者根據1980—2018年京津冀地區農村居民點用地的轉變程度、轉變趨勢、轉變形態和轉變強度等特征,分析認為京津地區的轉型程度和轉型強度呈現長期活躍的增長趨勢,而環京津地區則呈現逐漸放緩的趨勢。[126]在環境治理領域,也有學者根據2004—2016年中國30個省份的環保數據來探究城市環境治理效率的時空區域差異,發現環境治理效率高低的省份在時間上表現出空間集聚性,政府環境治理行為的空間依賴性是城市環境治理效率區域差異的最大來源。[127]此外,何通根據中國綠色建平指數指標體系構建了貴州省減貧成效評價指標體系,通過經濟發展的空間聚集能力對脫貧攻堅的成效進行了時空分布分析,研究發現貧困片區的綠色減貧水平呈現出較強的空間正相關性,即貧困片區各縣域減貧發展的空間集聚能力較強,存在顯著的全局空間集聚效應。[128]
(二)時空演進分析
時空演進分析側重于以時間和空間變換為基本視角,探究時空轉變影響之下,要素的演變和發展趨勢,是一種基于時空大數據的動態分析過程。時空緊耦合和動態演化是時空大數據的本質屬性。[129]因此,基于時空大數據的演進分析已經得到了重視,常用于環境保護、城市規劃、交通治理和城市治理等實踐和研究領域,在政治學研究中的運用尚處于探索階段。根據目前已有的學術動態,政治學研究中基于時空大數據來探索時空演進模式,集中于以下幾個議題。
首先,基于時空大數據的演進分析常通過人們的位置移動軌跡數據來研究政治風險的時空演變趨勢。難民問題是當代世界面臨的重大政治問題,對特定區域造成了嚴重的影響,難民本身具有高度的流動性,利用難民的位置和軌跡移動數據,能夠對其展開有效的分析和研判。利用機器學習方法和公開可用的位置數據以及歷史難民流動統計數據來分析難民移動的時空變化特征,從而分析集體難民流動的時空演變模式,能夠預測難民入境人數增加或減少,并分析潛在風險,制定相應的舉措。[130]此外,韓增林等人根據“國家恐怖主義與反恐研究聯盟”的全球恐怖主義數據庫公布的數據,利用核密度估計法(Kernel Density Estimation)來研究“一帶一路”沿線國家安全態勢的時空演變,結果顯示,從1970—2017年“一帶一路”沿線國家安全態勢日益嚴峻,階段性特征顯著,共經歷了“興起—活躍—回落”三大階段,在空間上,國家安全態勢標準差橢圓向北偏西方向移動,轉移路徑為西亞北非地區—南亞地區—西亞北非地區。[131]
其次,基于時空大數據的演進分析也常常根據社交媒介上的時空大數據來研究公共輿情的時空演變,為引導和干預輿情提供依據。突發公共事件引發的網絡輿情信息具有空間、時間和內容等多個相關因素,其中,時間與地理標記可以用來研究用戶活動模式,如流動性、聚集性或隨機性等。[132]在突發事件影響下,輿情時空模式展現出非線性演化和聚類特征。[133]而社交平臺上的用戶位置和軌跡數據為追蹤、分析和預測輿情提供了可能。能夠基于機器學習和地理可視化方法來識別事件,并實時跟蹤重要事件輿情時空演變及其影響,[134]具有顯著的優勢。王卷樂等人以新浪微博為數據源,從數量、空間、時間、內容等方面分析了2020年1月9日至3月10日在湖北省、京津冀、長三角、珠三角、成渝等城市群及沿邊口岸等重點區域疫情引發的輿情時空演進,結果表明,疫情輿情在區域內部的時空聚集更為顯著,京津冀以首都北京為中心,長三角以上海為中心,輔以南京、杭州等熱點,珠三角以廣州和深圳為兩核,湖北省以武漢為中心,為加強重點區域的輿情關注和因地制宜制定干預措施提供了合理依據。[135]