齊凡又喝下一口賢者飲料,給自己充能。
對圖像的數字化處理,首先自然就是將彩色圖轉化為灰度圖。簡單來說,就是將一張彩色照片弄成黑白的。
之后那黑白圖像上的一個個像素點的灰度值,便是計算機看到的東西。
齊凡忽的想起李月。她可真白!
賢者狀態下的齊凡是很純潔的,比4個9的黃金還要純。他想起李月完全是因為好奇該如何用數字形容她的白。
灰度值的范圍是0~255。0代表純黑,255代表純白。
李月該有多白。150?200?還是250?
齊凡覺得一定是250。她白得就跟250一樣。
人類通過一個個像素點的灰度值就能識別出物體,其實計算機也是這么干的。
這其實是很淺顯易懂的道理。只要這個世界上沒有修仙和魔法,那做同一件事情多半就是用同一種方法,只不過是過程有些不同罷了。
就如,人類對著一副圖像看一樣就什么都明白了,人類自己甚至都感受不到這個過程。
你看到圖像上有一只貓,你不會下意識去思考“我為什么會認為它就是一只貓”。也就是說,人類根本不明白自己識別的過程。
因而在于如何教計算機識別圖像的問題上,人類絞盡腦汁,這類問題就是機器學習誕生的初衷。
齊凡通過閱讀許陽他們的代碼,知道他們并未采用簡單的線性回歸來處理數字識別。他想想也是,畢竟線性這東西就如一個直男,腦子永遠就是一根筋的,只能走直線,走不了曲線,自然也就處理不了復雜些的問題。
比如:異或問題。這是一個最典型的非線性問題。
所謂異或,就是:同為0,異為1。兩個數字1異或之后結果是0。
用白話來解釋線性和異或的話,線性可以看成是按套路辦事,非線性則可看成不按套路出牌。異或就是不按套路出牌的一種典型情況。
如果計算模型是線性的,那無論如何它也無法處理非線性的問題。哪怕是把現有CPU的運算能力翻一萬倍,那也是無濟于事的。
這就好比一個男人還沒結婚的時候,他的錢都是他的。結婚之后,計算機按往常理解,就是把夫妻雙方的錢加起來除以2。
不加干預的話,計算機是無法自己開竅其實不是除以2,而是很可能向某一方匯聚,最后男方那邊剩余是0。
面對這種問題,線性方法是處理不了問題的。這個時候可以用SVM支持向量機的升維。
就好比婚后的一對男女同住在一塊,男的保不住錢。那怎么辦?可以人為制造一個維度將男女分開,一個在天南一個在地北。這樣兩人的地域就不在一個維度了。通過新增一個地域維度,從而實現地域維度上的分離,這樣男人的錢就能保住了。
當然,計算機的世界里沒有微信轉賬,這種可以溝通不同地域維度的東西。
齊凡也不知道自己看書看著看著,怎么腦子里會有這么多奇奇怪怪的想法。他自己也知道這個例子用來形容SVM不是很恰當,但他覺得這個例子很有意思。
他覺得直男是想不出這種例子的。
賢者飲料的牛X莫過于此--讓不是直男的齊凡,在進入賢者狀態后,思維無限自由發散,卻能在面對欲望的時候,表現得比直男直一萬倍。
齊凡自己都沒有察覺到這一點。否則的話,他多半會去做一件事--看些小成本電影。
他肯定會好奇,自己能否在深切感知電影主角們悸動的同時,自身又能做到心如止水。
齊凡收回思緒,回到數字圖像處理的問題上。
SVM的作用主要是拿來分類,而數字識別就是一個典型的分類問題。因為一個數字只有0~9這幾種可能。
而分類問題體現在數學上,其實就是對坐標系的分割。
每一張包含了手寫數字的圖像,通過提取特征后,都可以在坐標系找到屬于它的位置。而SVM要干的事情,就是仔細劃分這些不同位置的坐標點。
屬于“0”的坐標點要和“1”的坐標點清清楚楚地分開。其余數字依次同理。
這個坐標系很復雜,有N個維度。假如一張圖片的像素點是100*100的,將它整個扔給計算機的話,那就有1萬個輸入維度。人類所能理解的圖形極限是三維,所以1萬維是完全不可能畫得出來的。
畫不出來還是小事,可以自行腦補嘛。計算和特征提取才是大事。
維度越大,所需的計算量也就越大,算得也就越慢。如果一個程序識別一個手寫數字要花10秒,那一定會被罵成“人工智障”,這就是“人工智障三人組”最初名號的由來。齊凡是從計算機學院其他學長口中得知的。當然,現在已經不這樣了。
所以,進行計算前,勢必要將圖像參數簡化一下。
同時,圖像還涉及到清晰度和對比度的問題。
因而,齊凡被圖像的“池化”“銳化”等概念虐了一通后,總算將它們掌握了。
最后就到了最關鍵的一步--圖像最真實的特征。
圖像的特征自然是來自于像素點。可其實不僅僅體現在像素點的灰度值上,還體現在像素點的排列上。
如果直接將像素點的坐標和值作為輸入參數,那就會帶來一個問題。
假如一個一模一樣的數字“1”,出現在一張紙的不同位置。這對以上方法來說,就是不同的輸入參數,因為其坐標位置變化了。可按實際情況,這個數字并沒有任何改變,只是位置發生了變化而已。
位置的變化不應該帶來輸入參數的變化,因為人類識別數字也并不需要參數數字整體的位置。
齊凡帶著疑問在書上找到了答案--變化特征。
通過提取相鄰像素點灰度值的變化作為特征,這樣就能摒棄數字坐標位置不同而引入的干擾。
這就是方向梯度直方圖(Histogram of Oriented Gradient)的核心概念。
【計算機經驗+10。】
到此為此,圖像特征提取部分已被齊凡搞定。
剩下的,就是找尋許陽他們所用的模型到底是哪里出了問題,以至于會出現40%多識別錯誤率。
-----------------
心情愉悅的齊凡,收起東西從圖書館回到宿舍。
齊凡一進宿舍,王哲就火急火燎地開口,“怎么發你微信過了半天才回,今天微積分課吳院長點名,你又不是在。他現在每回都會特意關注你,你要是再不去,他可真就要發飆了。”
齊凡最近的行為在同學們看來簡直就是作死,連最近看不慣他的賈震都開始對他同情了。
“齊凡,十年寒窗不容易,你這么個作法,早晚要被開除學籍的。何必呢。”只要不挑戰賈震的學霸權威,他也不是什么十足的壞人。
“多謝你們關心。可我早就和你們說過了呀。是因為王教授叫我去幫忙。”
從對面兩人的神情來看,顯然不信。齊凡也只有無奈。
“算了,等后天吧。后天的微積分課正好有些內容我還需要鞏固下,到時你們看,吳院長會不會管我。”齊凡自信王教授肯定已經都打好招呼了。