官术网_书友最值得收藏!

2.1 計算機視覺是什么

計算機視覺是指用計算機實現人的視覺功能——對客觀世界的三維場景的感知、識別和理解。

這意味著計算機視覺技術的研究目標是使計算機具有通過二維圖像認知三維環境信息的能力。因此,不僅需要使機器能感知三維環境中物體的幾何信息(形狀、位置、姿態、運動等),還能對它們進行描述、存儲、識別與理解??梢哉J為,計算機視覺與人類或動物的視覺是不同的,它借助幾何、物理和學習技術來構筑模型,用統計的方法處理數據。

人工智能的完整閉環包括感知、認知、推理再反饋到感知的過程,視覺在我們的感知系統中占據大部分的感知過程。因此,研究視覺是研究計算機感知的重要一步。

1. 學科的誕生

計算機視覺真正的誕生時間是在1966年,MIT(麻省理工學院)人工智能實驗室成立了計算機視覺學科,標志著計算機視覺成為一門人工智能領域中可研究的學科,同時,歷史的發展也證明了計算機視覺是人工智能領域中增長最快的一個學科。

2. 視覺理論

20世紀80年代初,MIT人工智能實驗室的David Marr出版了《視覺》(全名《Vision:A Computational Investigation into the Human Representation and Processing of Visual Information》)一書,提出了一個觀點:視覺是分層的。

他認為視覺是個信息處理任務,應該從3個層次來研究和理解,即計算理論、算法、實現算法的機制或硬件。

(1)計算理論:這個層次研究的是對什么信息進行計算和為什么要進行這些計算。

(2)算法:這個層次研究的是如何進行所要求的計算,即設計特定的算法。

(3)實現算法的機制或硬件:這個層次研究的是完成某一特定算法的計算機構。

視覺理論使人們對視覺信息的研究有了明確的內容和較完整的基本體系,目前仍被看作研究的主流。

3. 關鍵任務

計算機視覺的關鍵任務主要如下。

? 物體識別:識別圖像物體屬于的類別。

? 物體檢測:用框去標出物體的位置,并給出物體的類別。

? 分類+定位:分類問題就是給輸入圖像分配標簽;找到圖像中某一目標物體在圖像中的位置,即定位。

? 圖像分割:將數字圖像細分為多個圖像子區域(像素的集合,也被稱為超像素)的過程。

主站蜘蛛池模板: 肃北| 卢氏县| 厦门市| 正宁县| 景宁| 临泉县| 龙口市| 安陆市| 孝义市| 汉中市| 潼南县| 微山县| 新营市| 玉林市| 镇江市| 巴楚县| 荆门市| 富顺县| 河曲县| 汕尾市| 奎屯市| 蓝山县| 怀安县| 平潭县| 洛阳市| 铜川市| 临洮县| 万源市| 囊谦县| 齐齐哈尔市| 延庆县| 西丰县| 新营市| 奈曼旗| 铜山县| 宜良县| 阿尔山市| 垦利县| 务川| 时尚| 江川县|