官术网_书友最值得收藏!

1.3 圖數據的應用場景

我們提到圖,更多的是帶有一種數學上的理論色彩,在實際的數據場景中,我們通常將圖稱為網絡(Network),與之對應的,圖的兩個要素(頂點和邊)也被稱為節點(Node)和關系(Link),比如我們熟知的社交網絡、物流網絡等概念名詞。為了達成統一并與神經網絡(Neural Networks)中的“網絡”概念區分開來(盡管神經網絡也是一種網絡),本書將網絡數據稱為圖數據。

圖數據是一類比較復雜的數據類型,存在非常多的類別。這里我們介紹其中最重要的4類:同構圖(Homogeneous Graph)、異構圖(Heterogeneous Graph)、屬性圖(Property Graph)和非顯式圖(Graph Constructed from Non-relational Data)。

(1)同構圖:同構圖是指圖中的節點類型和關系類型都僅有一種。同構圖是實際圖數據的一種最簡化的情況,如由超鏈接關系所構成的萬維網,這類圖數據的信息全部包含在鄰接矩陣里。

(2)異構圖:與同構圖相反,異構圖是指圖中的節點類型或關系類型多于一種。在現實場景中,我們通常研究的圖數據對象是多類型的,對象之間的交互關系也是多樣化的。因此,異構圖能夠更好地貼近現實。

(3)屬性圖:相較于異構圖,屬性圖給圖數據增加了額外的屬性信息,如圖1-9所示。對于一個屬性圖而言,節點和關系都有標簽(Label)和屬性(Property),這里的標簽是指節點或關系的類型,如某節點的類型為“用戶”,屬性是節點或關系的附加描述信息,如“用戶”節點可以有“姓名”“注冊時間”“注冊地址”等屬性。屬性圖是一種最常見的工業級圖數據的表示方式,能夠廣泛適用于多種業務場景下的數據表達。

圖1-9 屬性圖

(4)非顯式圖:非顯式圖是指數據之間沒有顯式地定義出關系,需要依據某種規則或計算方式將數據的關系表達出來,進而將數據當成一種圖數據進行研究。比如計算機3D視覺中的點云數據,如果我們將節點之間的空間距離轉化成關系的話,點云數據就成了圖數據。

在我們研究多元化對象系統的時候,圖是一種非常重要的視角。在現實世界中,圖數據有著十分廣泛的應用場景。下面我們舉幾個例子進行說明,如圖1-10所示。

圖1-10 圖數據應用示例[1][19]

社交網絡:社交網絡是十分常見的一類圖數據,代表著各種個人或組織之間的社會關系。如圖1-10的a圖展示了在線社交網絡中的用戶關注網絡:以用戶為節點,用戶之間的關注關系作為邊。這是一個典型的同構圖,一般用來研究用戶的重要性排名以及相關的用戶推薦等問題。隨著移動互聯網技術的不斷深入,更多元化的媒體對象被補充進社交網絡中,比如短文本、視頻等,如此構成的異構圖可以完成更加多樣化的任務。

電子購物:電子購物是互聯網中的一類核心業務,在這類場景中,業務數據通常可以用一個用戶–商品的二部圖來描述,在如圖1-10的b圖所展示的例子中,節點分為兩類:用戶和商品,存在的關系有瀏覽、收藏、購買等。用戶與商品之間可以存在多重關系,如既存在收藏關系也存在購買關系。這類復雜的數據場景可以用屬性圖輕松描述。電子購物催生了一項大家熟知的技術應用—推薦系統。用戶與商品之間的交互關系,反映了用戶的購物偏好。例如,經典的啤酒與尿布的故事:愛買啤酒的人通常也更愛買尿布。

化學分子:以原子為節點,原子之間的化學鍵作為邊,我們可以將分子視為一種圖數據進行研究,分子的基本構成以及內在聯系決定了分子的各項理化性質,通常我們用其指導新材料、新藥物的研究任務,如圖1-10的c圖所示。

交通網絡:交通網絡具有多種形式,比如地鐵網絡中將各個站點作為節點,站點之間的連通性作為邊構成一張圖,如圖1-10的d圖所示。通常在交通網絡中我們比較關注的是路徑規劃相關的問題:比如最短路徑問題,再如我們將車流量作為網絡中節點的屬性,去預測未來交通流量的變化情況。

場景圖:場景圖是圖像語義的一種描述方式,它將圖像中的物體當作節點,物體之間的相互關系當作邊構成一張圖。場景圖可以將關系復雜的圖像簡化成一個關系明確的語義圖。場景圖具有十分強大的應用場景,如圖像合成、圖像語義檢索、視覺推理等。圖1-10的e圖所示為由場景圖合成相關語義圖像的示例,在該場景圖中,描述了5個對象:兩個男人、一個小孩、飛盤、庭院以及他們之間的關系,可以看到場景圖具有很強的語義表示能力。

電路設計圖:我們可以將電子器件如諧振器作為節點,器件之間的布線作為邊將電路設計抽象成一種圖數據。在參考文獻Zhang G,He H,Katabi D.Circuit-GNN:Graph Neural Networks for Distributed Circuit Design[C]//International Conference on Machine Learning.2019:7364-7373.中,對電路設計進行了這樣的抽象,如圖1-10的f圖所示,然后基于圖神經網絡技術對電路的電磁特性進行仿真擬合,相較于嚴格的電磁學公式仿真,可以在可接受的誤差范圍內極大地加速高頻電路的設計工作。

圖數據的應用場景遠不止這些,還有諸如描述神經網絡計算過程的計算圖、傳感器陣列網絡、由各類智能傳感器構成的物聯網。事實上,如果要找一種最具代表性的數據描述語言與現實數據對應,那么圖應該是最具競爭力的候選者。總的來說,圖數據的應用跨度大、應用場景多,研究圖數據具有廣泛且重要的現實意義。

主站蜘蛛池模板: 江川县| 清丰县| 鄢陵县| 资中县| 大名县| 丹棱县| 中西区| 东光县| 丹阳市| 贵港市| 中方县| 沙洋县| 仙桃市| 长泰县| 家居| 永宁县| 阿坝县| 桐梓县| 汉寿县| 丹阳市| 营口市| 石河子市| 汉中市| 六安市| 威宁| 平果县| 凯里市| 本溪| 开平市| 武义县| 博乐市| 慈利县| 陇西县| 阜阳市| 灵石县| 鹤壁市| 五台县| 太仓市| 大田县| 沈丘县| 浪卡子县|