官术网_书友最值得收藏!

1.2 人工智能的雙重驅動力

■ 謝憶楠(曠視科技品牌與市場副總裁)

在美國,很多人工智能項目都以大學為主導,用于科研,不需要考慮賺錢的問題。而中國的人工智能項目存在于各種產業公司內,壓力大,而且公司做完算法后還要賺錢。在美國很少能看到擁有四五百人的中型人工智能企業,公司規模達到一百人左右的時候,要么就維持一個小而美的研究,要么就等待被并購,進入一個大體系里。

下面我結合中美之間的差異性講講視覺識別的商業化。

 

老公睡著了,老婆就能讓手機解鎖嗎

 

iPhone X的人臉解鎖功能引起了熱議,網上流傳著兩個段子,第一個是老公睡著之后,手機被老婆解鎖了;第二個是老婆卸妝后,發現手機打不開了。

這里有一項測試,如圖1-2所示,讓機器識別一些網紅臉,看看算法能夠給出什么樣的結果。

圖1-2

通過測試結果可以看出,即便受試者化了濃妝,機器也可以識別出來,甚至連男扮女裝都能識別出來。如果讓人類去做這種識別,成功率會是多少?人臉識別對于機器來說就是一道算術題,化妝是障眼法,沒有改變原有的面部結構,所以在1:1的場景里,機器比人的判斷力高一些。人類做出的判斷由自己的數據庫決定,比如面對一個非常熟悉的人,他變換發型之后仍能被我們認出。人類依靠的數據庫由我們的生活圈決定,生活圈越大,認識的人就越多,生活圈越小,認識的人就越少。

這里還有另一項測試,如圖1-3所示,我們找了一些電影中經過特效變化的面孔給機器識別,機器同樣能夠判斷出這些面孔分別對應哪位演員。

圖1-3

因此人臉識別程序已經能夠識別電影特效級別的面孔。什么樣的面孔不能被識別呢?毀容之后的面孔不能被識別,面部關鍵部分或結構有變化,機器可能就識別不了了。

所以剛剛說的老婆卸妝之后手機打不開的問題,現在機器已經解決了。至于老公睡覺時手機被老婆解鎖這件事,也是無法實現的。

人臉解鎖體驗更好,安全問題仍然存在

 

大家都很關心人工智能的商業落地,目前人臉解鎖技術已經真正實現了落地。判斷兩張圖片是不是同一個人很簡單,但是不同的場景下會有不同的命題,這些命題能不能解決,決定了這項技術能不能在相關行業里應用,這是人臉識別商業化的關鍵。

人臉解鎖的體驗略勝于指紋、虹膜。這里可以做一個對比。

(1)首次注冊時,人臉和虹膜的速度快,拍一張照片即可,相比之下指紋比較慢,需要多次采集。

(2)指紋解鎖需要手指配合,虹膜解鎖需要對準眼部,這兩種解鎖方式都慢于人臉解鎖,而且人臉解鎖是非接觸式的。面對同一種手機解鎖方式,人們拿起手機一秒內成功了,這是正常速度,也是極限,如果解鎖需要兩秒甚至更長時間,大家就可能放棄這種方式了,這就是商業化對技術的要求。

(3)指紋解鎖和虹膜解鎖的抗干擾能力比較弱,比如手上沾上一些水或者油漬就不能被識別了,帶上隱形眼鏡虹膜解鎖就不好用了,而人臉解鎖的抗干擾能力更強一些。

人臉識別也需要與“黑產”(黑色產業)進行斗爭。黑客們總會有新方法攻擊你的手機,之前就有某款手機的人臉識別功能會被照片破解的新聞。目前在“黑產”市場,破解手機人臉識別功能的價格大概是800元一次,批量破解50元一次。研究人臉識別的廠商需要了解黑客的攻擊方式,強化自身的技術,從而進行防衛。

 

一臺門禁機反映出的問題

 

在人臉識別技術走向商業化的過程中,“技術-場景”雙輪驅動才是關鍵,技術單獨發展并不十分有效。現在為什么強調算法?因為大家在找投資的時候,要向投資人解釋這項技術為什么值錢。天使輪、A輪、B輪投資的投資人可能都要有這樣一個標準。

曠視是一家研究人臉識別的公司,曾給公司內部做了一款可以刷臉的門禁機,后來這款機器被做成了商業產品。投放到市場之后曠視發現,制約人臉識別技術落地的并非是機器識別的準確率與速度,而是不同小區的環境。小區大門朝東的,早晨人臉逆光面對機器,識別不了;小區門口路燈昏暗的,到了夜晚機器就識別不了。于是我們需要改算調優,對逆光改算法,對亮度改算法,不斷解決這些問題。所以當人臉識別技術真正走向商業化落地的時候,要解決的問題遠比你向投資人介紹的算法復雜得多。

在一個真正的商業化場景里,門禁機的機身可能是一個非常小的集成商做的,算法是科學家做的。集成商不懂算法,科學家不會去解決使用中遇到的零散問題。所以想要實現人臉識別的商業化落地,公司必須有能夠與算法專家和集成商對接的人才,這類人才需要特別強大,甚至需要專門培養。現在比拼算法專家數量不是一件難事,真正具有挑戰性的是面對商業化落地,產品如何實現集成。

 

人工智能走向商業化,不只是一個算法問題

 

警匪片里通常只有一兩個壞人,而現實生活中警方要面對多少壞人?一個大型城市的固定人口加上流動人口,總數大概是1000萬~2000萬人,從中抓一個罪犯,需要多少數據?這就是商業化人工智能和算法級人工智能的具體差別。

曠視的人臉識別程序現在已經能夠幫助警方識別嫌疑人,這里有兩個典型的例子:兩個嫌疑人,其中一個潛逃了五年,覺得沒人會認出他,結果被機器識別出來了;另一個逃了七年,以前很瘦,這七年間變胖了,還是被機器識別出來了。處理一個打架斗毆事件,如果單純依靠警方排查尋找嫌疑人,需要多少人力和時間?但是通過人臉識別,三秒鐘就找到了嫌疑人,五分鐘后巡警就能完成抓捕。警察要抓嫌犯,不是說從幾萬人里把這個人認出來就萬事大吉了,而是要明確在哪兒能抓住他,他會在什么時間、什么地點出現,警方需要的是一份情報信息。一秒鐘識別,一秒鐘定位,告訴警方這個人在哪兒,這是算法的真正落地。

真正的商業化并不是解決一個算法問題,而是解決場景和需求問題,找最合適的發力點。

此外,人工智能走向商業化,除了把算法做好之外,還要解決如何跟硬件結合的問題,如何通過警用攝像頭實現算法功能的問題。現在國內的警用攝像頭有5000萬個左右,其中80%的攝像頭只能看到人的身體,看不清人臉。因此,在像素級受限的情況下能不能識別,也是人臉識別商業化過程中需要面對的問題。

 

技術和場景是人工智能的雙重驅動力

 

人工智能的核心驅動力到底是什么?

目前大家關注的范圍主要包括產業環境、技術、數據、場景、人才、商業模式、行業這幾個方面,大家喜歡看團隊里有多少博士,商業模式有多完美,行業滲透能力強不強,大數據上有沒有優勢。

其實真正的驅動力就兩個:一個是技術,另一個是場景,如圖1-4所示。

圖1-4

公司的技術到底能不能適應這個行業,對這個場景的了解有多深,這些問題的答案就涉及人工智能真正商業化的一些問題。

如圖1-5所示,技術、商業、數據的化學反應可以將場景細分。為什么現在人工智能領域出現很多細分公司?因為數據在每一個行業里是一定量,不同的知識解決不同行業的問題,場景需要技術落地,而技術會細分場景,不會有某項技術可以適應全部場景。想把所有場景劃分出來,谷歌級別的公司也很難做到。

圖1-5

在中國的人工智能領域,投入多少成本能將技術做出來是一個未知數,技術研發成功之后能夠得到多少回報也是一個未知數,這是一個尷尬的場景。

人工智能公司在一級市場估值非常高,但是公司敢拿這份財報去二級市場上市嗎?我相信大部分公司都不敢,因為一定會倒掛。所以場景細分之后我們發現只有在公司可以做很多東西的情況下,才能真正賺錢。如果只做一個軟件開發工具包(Software Development Kit, SDK)級別的生意,那么公司在每一個行業里的議價能力都會非常弱。

曠視的小區門禁系統現在能解決在逆光下識別人臉的問題,解決的關鍵在于曠視已經在100多個小區安裝了人臉識別門禁機,這么多場景下的數據可以幫助優化算法。但如果沒有這些數據,曠視怎么解決這些問題?場景得到細分,技術也能得到相應的優化,所以場景一定要不斷擴大。這就是雙輪驅動的具體用意。

曠視最早選了一個非常小的技術點作為開始,做了一個用人臉控制東西的小游戲,包裝了一個“運動頸椎”的概念,后來做了一些娛樂級的刷臉實踐。網絡上比較好玩的測年齡、顏值、夫妻相的App,包括女生用的美圖秀秀,底層坐標技術都是曠視的,而其他廠商會用這些技術開發很多創意。

三年前,阿里巴巴表示要跟曠視合作,解決幾個金融上的問題:一是支付問題,二是遠程開戶。“刷臉”能夠解決這兩個商業場景中的剛需——遠程合規問題。互聯網金融公司沒有線下營業網點,需要通過一種技術解決合規性問題。

從驅動力的角度來看這件事,技術是人臉識別技術,場景則是要解決遠程開戶的合規性,與此同時還需要證明遠程開戶是符合客戶本人意愿的操作,這就涉及活體驗證。場景對技術提出了要求:把人臉識別技術集中到柜臺和手機App里,而且要保證識別速度快。所以必須不斷地找場景,通過滿足場景提出的要求,讓技術一直持續有效地領先下去。

曠視經常會接到來自全國各地、各行各業的電話,希望曠視幫助它們設計具有代表性和針對性的算法程序。德青源曾找過曠視,他們有一個國家級養殖中心,里面有10萬個雞圈,德青源想通過在雞圈里放置攝像頭的方式來統計雞的數量。經過思考,曠視認為這個場景對于自身的技術來說落地難度非常大。通過這件事曠視也收獲了一次歷練,明確了基于金融級別的人臉識別到底該做什么樣的事情。

做人臉識別要有針對性地解決不同場景中的問題,如果不明白這個場景對技術的要求,就無法實現技術的快速進步。而且人臉識別不能只識別中國人,還要能識別外國人。VIVO曾在印度發布了一款帶有人臉識別功能的手機,大部分印度男性都會留很濃密的胡須,而且他們的膚色偏棕黑,識別中國人和識別印度人對技術的要求肯定不一樣,曠視用了三個月時間解決了印度人臉識別的問題。

 

“AI+醫療”

 

人工智能在醫療領域的發展前景有待觀察。現在“AI+醫療”能解決什么問題?機器可以根據一張掃描片判斷病人患了何種病,這種判斷基于醫生們積累的經驗,也就意味著機器要錄入很多標準化的東西。病人拿一張片子去給十家醫院的大夫看,可能會得到五個以上的結果。以前我的膝蓋受傷了,到醫院拍了一個磁共振成像(Magnetic Resonance Imaging, MRI,簡稱“核磁共振”),去了三家醫院,得到了三個結果。把同樣一張片子給機器,機器會選擇哪個結果?醫學需要考慮很多綜合性因素,因為每個人的生理狀態都不一樣,故而同一種疾病的病因可能是不一樣的,所以有“會診”這種形式,請很多老專家推斷可能的病因。從這點來看,醫學本身不具備這種大規模的標準化數據錄入的可能。

 

人臉識別技術的新發展

 

最近幾年人臉識別技術實現了哪些突破?首先,人臉檢測最初需要在一張臉上測五個點,那時同一張人臉一旦更換發型或者配飾,機器就識別不了了。現在在一張人臉上要識別三萬多個點,不管被識別人怎樣化妝,不管處于何種商業場景中,不管面對什么樣的自然環境,機器都可以完成識別。

其次,很多人覺得人臉識別不太靠譜,這是因為人類本身非常擅長人臉識別,用自己的視覺系統去質疑這項技術,不相信機器能夠超越人類完成海量的人臉識別工作。為什么大家很少質疑指紋?因為我們都不會識別指紋,所以會認為機器能做得更好。其實機器和人看到的世界是兩個世界,指紋識別的準確率和人臉識別的準確率幾乎一樣。

另外,現在的人工智能已經可以實現多角度識別,甚至“陰陽臉”(臉部光照不均)都可以識別。

在技術的發展過程中,一定要找到商業場景中可能會出現的一切場景。人臉識別技術并不是科學家坐在辦公室里就可以想出來的,科學家如果想讓人工智能實現商業化,需要讓自己變得“糙”一點,要想到普通人經常遇到的場景。

 

謝憶楠 曠視科技(Face++)品牌與市場副總裁。擁有13年市場與品牌傳播經驗,曾在中央電視臺、易觀國際、奇虎360等多家媒體與互聯網企業負責市場品牌項目。

主站蜘蛛池模板: 通化市| 青田县| 新乡市| 德清县| 滨海县| 三台县| 青川县| 临漳县| 得荣县| 青浦区| 诏安县| 文昌市| 平阴县| 久治县| 喜德县| 锦州市| 阆中市| 灵寿县| 电白县| 吉林市| 西昌市| 吐鲁番市| 天等县| 屏南县| 仲巴县| 望江县| 红桥区| 邵阳县| 图们市| 深圳市| 米林县| 襄汾县| 缙云县| 南木林县| 嵩明县| 安龙县| 图片| 宁津县| 六枝特区| 浦城县| 睢宁县|