官术网_书友最值得收藏!

第16章 她白得就跟250一樣

齊凡又喝下一口賢者飲料,給自己充能。

對圖像的數字化處理,首先自然就是將彩色圖轉化為灰度圖。簡單來說,就是將一張彩色照片弄成黑白的。

之后那黑白圖像上的一個個像素點的灰度值,便是計算機看到的東西。

齊凡忽的想起李月。她可真白!

賢者狀態下的齊凡是很純潔的,比4個9的黃金還要純。他想起李月完全是因為好奇該如何用數字形容她的白。

灰度值的范圍是0~255。0代表純黑,255代表純白。

李月該有多白。150?200?還是250?

齊凡覺得一定是250。她白得就跟250一樣。

人類通過一個個像素點的灰度值就能識別出物體,其實計算機也是這么干的。

這其實是很淺顯易懂的道理。只要這個世界上沒有修仙和魔法,那做同一件事情多半就是用同一種方法,只不過是過程有些不同罷了。

就如,人類對著一副圖像看一樣就什么都明白了,人類自己甚至都感受不到這個過程。

你看到圖像上有一只貓,你不會下意識去思考“我為什么會認為它就是一只貓”。也就是說,人類根本不明白自己識別的過程。

因而在于如何教計算機識別圖像的問題上,人類絞盡腦汁,這類問題就是機器學習誕生的初衷。

齊凡通過閱讀許陽他們的代碼,知道他們并未采用簡單的線性回歸來處理數字識別。他想想也是,畢竟線性這東西就如一個直男,腦子永遠就是一根筋的,只能走直線,走不了曲線,自然也就處理不了復雜些的問題。

比如:異或問題。這是一個最典型的非線性問題。

所謂異或,就是:同為0,異為1。兩個數字1異或之后結果是0。

用白話來解釋線性和異或的話,線性可以看成是按套路辦事,非線性則可看成不按套路出牌。異或就是不按套路出牌的一種典型情況。

如果計算模型是線性的,那無論如何它也無法處理非線性的問題。哪怕是把現有CPU的運算能力翻一萬倍,那也是無濟于事的。

這就好比一個男人還沒結婚的時候,他的錢都是他的。結婚之后,計算機按往常理解,就是把夫妻雙方的錢加起來除以2。

不加干預的話,計算機是無法自己開竅其實不是除以2,而是很可能向某一方匯聚,最后男方那邊剩余是0。

面對這種問題,線性方法是處理不了問題的。這個時候可以用SVM支持向量機的升維。

就好比婚后的一對男女同住在一塊,男的保不住錢。那怎么辦?可以人為制造一個維度將男女分開,一個在天南一個在地北。這樣兩人的地域就不在一個維度了。通過新增一個地域維度,從而實現地域維度上的分離,這樣男人的錢就能保住了。

當然,計算機的世界里沒有微信轉賬,這種可以溝通不同地域維度的東西。

齊凡也不知道自己看書看著看著,怎么腦子里會有這么多奇奇怪怪的想法。他自己也知道這個例子用來形容SVM不是很恰當,但他覺得這個例子很有意思。

他覺得直男是想不出這種例子的。

賢者飲料的牛X莫過于此--讓不是直男的齊凡,在進入賢者狀態后,思維無限自由發散,卻能在面對欲望的時候,表現得比直男直一萬倍。

齊凡自己都沒有察覺到這一點。否則的話,他多半會去做一件事--看些小成本電影。

他肯定會好奇,自己能否在深切感知電影主角們悸動的同時,自身又能做到心如止水。

齊凡收回思緒,回到數字圖像處理的問題上。

SVM的作用主要是拿來分類,而數字識別就是一個典型的分類問題。因為一個數字只有0~9這幾種可能。

而分類問題體現在數學上,其實就是對坐標系的分割。

每一張包含了手寫數字的圖像,通過提取特征后,都可以在坐標系找到屬于它的位置。而SVM要干的事情,就是仔細劃分這些不同位置的坐標點。

屬于“0”的坐標點要和“1”的坐標點清清楚楚地分開。其余數字依次同理。

這個坐標系很復雜,有N個維度。假如一張圖片的像素點是100*100的,將它整個扔給計算機的話,那就有1萬個輸入維度。人類所能理解的圖形極限是三維,所以1萬維是完全不可能畫得出來的。

畫不出來還是小事,可以自行腦補嘛。計算和特征提取才是大事。

維度越大,所需的計算量也就越大,算得也就越慢。如果一個程序識別一個手寫數字要花10秒,那一定會被罵成“人工智障”,這就是“人工智障三人組”最初名號的由來。齊凡是從計算機學院其他學長口中得知的。當然,現在已經不這樣了。

所以,進行計算前,勢必要將圖像參數簡化一下。

同時,圖像還涉及到清晰度和對比度的問題。

因而,齊凡被圖像的“池化”“銳化”等概念虐了一通后,總算將它們掌握了。

最后就到了最關鍵的一步--圖像最真實的特征。

圖像的特征自然是來自于像素點。可其實不僅僅體現在像素點的灰度值上,還體現在像素點的排列上。

如果直接將像素點的坐標和值作為輸入參數,那就會帶來一個問題。

假如一個一模一樣的數字“1”,出現在一張紙的不同位置。這對以上方法來說,就是不同的輸入參數,因為其坐標位置變化了。可按實際情況,這個數字并沒有任何改變,只是位置發生了變化而已。

位置的變化不應該帶來輸入參數的變化,因為人類識別數字也并不需要參數數字整體的位置。

齊凡帶著疑問在書上找到了答案--變化特征。

通過提取相鄰像素點灰度值的變化作為特征,這樣就能摒棄數字坐標位置不同而引入的干擾。

這就是方向梯度直方圖(Histogram of Oriented Gradient)的核心概念。

【計算機經驗+10。】

到此為此,圖像特征提取部分已被齊凡搞定。

剩下的,就是找尋許陽他們所用的模型到底是哪里出了問題,以至于會出現40%多識別錯誤率。

-----------------

心情愉悅的齊凡,收起東西從圖書館回到宿舍。

齊凡一進宿舍,王哲就火急火燎地開口,“怎么發你微信過了半天才回,今天微積分課吳院長點名,你又不是在。他現在每回都會特意關注你,你要是再不去,他可真就要發飆了。”

齊凡最近的行為在同學們看來簡直就是作死,連最近看不慣他的賈震都開始對他同情了。

“齊凡,十年寒窗不容易,你這么個作法,早晚要被開除學籍的。何必呢。”只要不挑戰賈震的學霸權威,他也不是什么十足的壞人。

“多謝你們關心。可我早就和你們說過了呀。是因為王教授叫我去幫忙。”

從對面兩人的神情來看,顯然不信。齊凡也只有無奈。

“算了,等后天吧。后天的微積分課正好有些內容我還需要鞏固下,到時你們看,吳院長會不會管我。”齊凡自信王教授肯定已經都打好招呼了。

主站蜘蛛池模板: 页游| 辽宁省| 三门峡市| 莒南县| 泗阳县| 秦皇岛市| 崇明县| 益阳市| 洪江市| 崇信县| 阿拉尔市| 天峨县| 三穗县| 宜兴市| 石景山区| 胶南市| 宝应县| 孟村| 子洲县| 武清区| 扎囊县| 拉孜县| 竹山县| 新宾| 涟源市| 车致| 驻马店市| 同心县| 上杭县| 静乐县| 咸丰县| 轮台县| 沙雅县| 淮南市| 酒泉市| 阜新市| 光山县| 泗阳县| 郸城县| 自贡市| 镇宁|