- 圖數據實戰:用圖思維和圖技術解決復雜問題
- (美)丹妮絲·柯斯勒·戈斯內爾等
- 1553字
- 2024-05-23 17:09:31
1.2 什么是圖思維
無須明確的定義,在本章開頭的白板場景里,我們已經見識到了所謂的“圖思維”。
當我們闡述數據可能看起來像一張圖這種認識時,我們就是在重新創造圖思維的能力。它是如此的直截了當:當你意識到理解數據中關系的價值時,圖思維包含了你的經驗和認識。
圖思維將問題域理解為相互連接的圖,并使用圖技術來描述領域動態以解決領域問題。
能夠看到數據中的圖與識別領域中的復雜網絡是一樣的。在復雜網絡中,你會發現需要解決的最復雜的問題。大多數極具價值的商業問題和機會都是復雜問題。
這也是為什么數據技術創新的下一階段會從關注效率轉移到關注提取價值上,尤其是通過應用圖技術。
1.2.1 復雜問題和復雜系統
我們在沒有明確定義復雜問題之前已經使用了很多次這個術語。復雜問題指的是復雜系統中的網絡。
復雜問題
復雜問題指的是可以在復雜系統中被觀測和度量的單個問題。
復雜系統
復雜系統是指一個由多個獨立組件構成的系統,這些組件通過多種方式相互連接,使得整個系統的行為不是單一組件行為的簡單聚合(也稱為“突現行為”,emergent behavior)。
復雜系統描述真實世界構造的各獨立組件之間的關系、影響、依賴和交互。簡單來說,一個復雜系統可以描述多個組件之間交互所產生的任何事物。復雜系統的例子可以是人的認知、供應鏈、交通或通信系統、社會組織、全球氣候甚至整個宇宙。
大部分高價值業務問題都是復雜問題,需要圖思維。本書將教會你四種主要的模式——鄰接點、層次、路徑和推薦——用圖技術來解決世界上各種業務中的復雜問題。
1.2.2 業務中的復雜問題
數據已經不再僅僅是業務的副產品。數據正日益成為我們經濟中的戰略資產。在此之前,我們需要用最便利的方式、最低的成本來管理數據,從而支撐業務運營。而現在,它變成了一種能夠產生回報的投資。這需要我們重新思考處理和對待數據的方式。
例如,在NoSQL時代后期,我們見證了微軟收購領英和GitHub。這些收購為解決復雜問題的數據價值給出了明確的衡量標準。具體來說,微軟斥資260億美元收購了營收僅為10億美元的領英。而GitHub的收購價格定在了78億美元,而其營收僅為3億美元。
領英和GitHub都擁有其各自的網絡圖。它們的網絡分別是關于職場和開發者的圖。這使得對一個領域的復雜系統建模的數據價值放大了26倍。這兩起收購開始彰顯領域圖數據的戰略價值。擁有一個領域圖會在公司估值上產生巨大的回報。
我們不想用這些統計數字來歪曲我們的意圖。看到快速增長的初創公司的高倍收入并不是什么新鮮事。我們把領英和GitHub特別提出來作為例子是因為這兩家公司發現并變現了數據價值。由于數據資產,這些公司的收入數倍于類似規模和增長的初創公司的估值。
通過應用圖思維,這些公司可以展示、訪問和理解其領域內最復雜的問題。簡而言之,這些公司為一些最大規模、最困難的復雜系統構建了解決方案。
那些在重新思考數據戰略方面處于領先地位的公司,同時也在為建模其領域最復雜的問題而創造技術。具體來說,谷歌、亞馬遜、聯邦快遞、Verizon、Netflix和Facebook的共通點是什么?除了成為當今最具價值的公司以外,它們中的每一個都擁有其領域最大、最復雜的復雜問題的建模數據。每家公司都擁有構建領域圖的數據。
仔細想一下。谷歌擁有全部人類知識的圖。亞馬遜和聯邦快遞有著全球供應鏈和運輸經濟的圖。Verizon的數據構建了當今世界上最大的電信圖。Facebook擁有全球社交網絡的圖。Netflix有娛樂產業的圖,建模方式如圖1-2所示,實現方式參見第12章。

圖1-2:一種用圖建模Netflix數據的方式,及本書中實現的最后一個示例——大規模協同過濾
展望未來,那些對數據架構進行投資,以建模其領域的復雜系統的公司將有望加入這些巨頭的行列。對復雜系統建模技術的投資和從數據中提取價值同等重要。
如果你想從數據中獲取價值,那么首先要看的是它的互連性。你要尋找的是數據所描述的復雜系統。在此基礎上,你的下一個決策將圍繞存儲、管理和提取這種互連性的正確技術進行。