- 面向汽車的新一代信息技術
- 崔勝民
- 538字
- 2021-07-08 11:32:12
1.2.3 語義分割
1. 語義分割的定義
語義分割是將標簽或類別與圖像的每個像素關聯的一種深度學習算法,用來識別構成可區分類別的像素集合。例如,自動駕駛汽車需要識別車輛、行人、交通信號、人行道和其他道路特征等。
語義分割的一個簡單例子就是將圖像劃分成兩類。如圖1-27所示,一副圖像顯示一個人在海邊,與之相配的版本顯示分割為兩個不同類別的圖像像素:人和背景。

圖1-27 語義分割
語義分割并不局限于兩個類別,可以更改對圖像內容進行分類的類別數。例如,圖1-27中的圖像也可分割為四個類別:人、天空、水和背景。
2. 語義分割與目標檢測的區別
語義分割可以作為對象檢測的一種有用替代方法,因為它允許感興趣對象在像素級別上跨越圖像中的多個區域。這種技術可以清楚地檢測到形態不規則的對象。相比之下,目標檢測要求目標必須位于有邊界的方框內,如圖1-28所示。

圖1-28 自動駕駛的車輛檢測
3. 語義分割在自動駕駛中的應用
因為語義分割會給圖像中的像素加上標簽,所以精確性高于其他形式的目標檢測。這使得語義分割適用于各種需要準確圖像映射的行業應用,比如自動駕駛,通過區分道路、行人、人行道、電線桿和其他汽車等,讓汽車識別可行駛的路徑。圖1-29所示為自動駕駛場景的語義分割。

圖1-29 自動駕駛場景的語義分割
圖1-30所示為激光雷達點云的語義分割。

圖1-30 激光雷達點云的語義分割