- 深度學習高手筆記(卷2):經典應用
- 劉巖(@大師兄)
- 577字
- 2024-09-05 16:45:32
1.1.2 候選區域提取
R-CNN輸入CNN的并不是原始圖像,而是通過選擇性搜索得到的候選區域,選擇性搜索的核心思想是層次分組算法(hierarchical grouping algorithm)[11],其核心內容為:
[11] 參見Pedro F Felzenszwalb、Daniel P Huttenlocher的論文“Efficient Graph-Based Image Segmentation”。
● 將圖像分成若干個小區域;
● 計算相似度,合并相似度較高的區域,直到小區域全部合并完畢;
● 輸出所有存在過的區域,即候選區域。
選擇性搜索偽代碼區域的合并規則為:
● 優先合并顏色相近的;
● 其次合并紋理相近的;
● 再次合并在上述合并后總面積小的;
● 最后優先合并在上述合并后總面積在其邊界框(bounding box,bbox)中所占比例大的。
圖1.3所示是通過選擇性搜索得到的候選區域,選擇性搜索的核心內容如算法1所示。

圖1.3 選擇性搜索效果示意
算法1 選擇性搜索
輸入:(彩色)圖像
輸出:目標假設位置的集合L
1: 獲取所有的區域
2: 初始化相似度集合
3: for 每一個鄰居對do
4: 計算相似度
5:
6: end for
7: while S ≠ ? do
8: 計算最高相似度
9: 合并對應區域
10: 去除相似內容除了ri: S = S \ s(ri, r*)
11: 去除相似內容除了sj: S = S \ s(r*, rj)
12: 計算rt與其鄰居之間的相似性集合St
13:
14:
15: end while
16: 從R的所有區域中提取對象位置框L