官术网_书友最值得收藏!

算法“馬甲”,誤解、失控與智能

算法是科技的核心要素之一,而科技決定著人類的未來,很有必要深入探討一下。

算法被如今一些人誤解,是因為時髦的“大數據”興起后,讓人產生了豐富的聯想。當然,前提是一些人過度將特定領域的“算法”與日?!按髷祿边B在了一起,這本身就導致了很深的誤解,直接原因還要追溯到對“大數據”認識的兩大誤區。

誤區之一:有人認為如今和未來的大數據將會越來越多,這是不完全正確的。上一節已經談到,世間萬物,不論是人工的還是自然的,從古至今,它們都在不停釋放“巨量”的數據,只是過去的人們沒有辦法能夠感知到更多而已。如今通過互聯網、物聯網等感知到的被人們稱為“大數據”的數據(主要指人類信息交換、信息存儲、信息處理三方面能力大幅提升后,人與人、人與物之間所制造的數據),相對于萬物在同一時刻所釋放的所有數據來說,只是微不足道的“微數據”而已。

誤區之二:混淆大數據的“深”與“廣”。這需要深入討論,因為它與人們對“算法”的認知與誤解有很大的關系。

物聯網從理論上來說,可以將世界上的任何物品,甚至一顆沙粒都鏈接進入網絡,范圍非常廣泛。但是,就具體被鏈接的物品來說,收集的信息大多都是淺層次的。例如,西伯利亞雪地里某處石油管道是否正常、過油量及是否存在損壞的數據;青藏高原無人區某處火車鐵軌下凍土層是否存在融化危險的適時數據;商場所有商品數量變化及其補貨需求、是否存在霉變等及時數據;個體和群體日常生活中的消費趨向、資金動向、行動習慣、體質指標等變動數據。這些數據收集的目的很明確,大多與及時的實用性有關:油管、鐵軌監測以便預防風險,商品數據有利于現場管理與銷售,個體、群體數據便于準確區分消費階層,主要為商家、政府或醫療等機構提供管理監測、定向促銷或較粗淺的健康、心理和行為研究等服務。

大數據中的“大”,主要是指事物的“范圍”。這些大數據,對生命運行、生物機制、智能模式與意識的理解等深層次研究和相關“算法”的開創等沒有太大關系,當然,對人類未來,諸如生命、機理、智能等的控制也沒有太大的關系。

現實中,一些未來學家將如今時髦的“大數據”與人類存亡的“算法”聯系了起來,他們認為,從長遠來看,諸如亞馬遜、Facebook、Google等科技巨頭與政府機構從人們身上收集來的數據,積累到足夠龐大的量以后,就能開發出比人們自身更了解自己的算法,并因而能夠操縱人們的決定及行為,甚至能直接入侵人性、意識,重組人類社會甚至控制生命本身,進而成為主宰人類的少數派等。這聽起來確實很恐怖。下面結合上述人們對如今大數據與算法的誤解,進行簡易分析。

諸如Google、Facebook、亞馬遜及政府機構等的“大數據”僅僅是對人們工作、學習、生活、休閑、消費、健康及喜好等因素及其這些因素之間或與其他物體之間的互動所產生的及時數據的跟蹤和收集。本書把這些數據稱為萬物(主要局限于人與人、人與物之間)的外在“表數據”。

讓人容易忽視的是:在這些行為、喜好與互動之下,人們復雜的思想數據,數以億計的腦細胞間的交流數據與生化反應的數據,以及它們之間或與人體健康、心情等聯動的綜合數據,那些微小、復雜到深入基因、細胞,以此牽引器官、肢體的運行數據,互動激發與再互動、再引發的數以億計的數據,綜合表現為思緒、情感、邏輯、判斷、選擇等數據,以及其之間在宏觀與微觀層面聯動出的億萬關系和微妙反應等數據,由此所產生的數以億計的浩如星河般的天文數據。本書把這類數據稱為萬物的內在“宏數據”。

也就是說,存在這樣的情況:你揮一揮手這個簡單的動作,如果深入到器官、組織、細胞,分子、粒子等層面,它們之間所發生的各種生化反應、能量消長、雜沓運動、神經協同、信息傳輸的聯絡、沖突等個體、集成與交互的數據總和,可能比第二次世界大戰發生的所有人類沖突、聯系都還要多,還要復雜。然而,對于這一動作,日常概念下的“大數據”,只能收集“幾個不起眼動作”的數據而已,要想深入機體、器官、組織內部觀察那數以億的真正“大數據”,恐怕未來數十年、數百年都難以實現,更不用說收集了。

由上分析,我們做個類比。這里把Google、Facebook等用以開發眾多“算法”的“大數據”(上文命名的表數據)比喻成一粒芝麻的話,那么,操控人們生命、意識與行為等的“宏數據”則可能大如太陽系了。在實踐中,用一粒芝麻的數據去推斷芝麻的根莖、植株的性能都是“不可實現”的學術與研究,更不用說用一粒芝麻的數據所研發出的“算法”去推導、掌控整個地球或太陽的性能與運行。看來,那些認為Google、Facebook等未來將會掌控人們意識、行為和生命的觀點,是不是類似在說,你只要掌握了一粒芝麻的數據,就可以研究出理解、控制整個太陽系的“算法”了呢?我們拋開那些讓人迷離的、浮華的語言和聯想,沉浸下去,努力去靠近實質,你是不是會突然發現,這是多么天真而偉大的“天方夜譚”啊!

“表數據”需要將世間萬物鏈接進互聯網,需要縱橫天地、遨游四海的“宏大”場面和氣勢,然而,“宏數據”則只需要潛入到某個具體的點,深深地發掘下去,數年、數十年、上百年,越深越好,“場面”非常簡單,只需幾個高級科學家、數十平方米的實驗室和精密儀器,幾只老鼠、果蠅或手指大小的大腦無數切片而已。例如,與氣勢磅礴的曼哈頓原子彈計劃、阿波羅登月計劃齊名的“人類基因組計劃”,舉全人類智慧,花費了近20年(從提出計劃到結束)的時間才初步完成,其研究對象僅僅是微小細胞中的染色體。這個連肉眼都不能看見的物質和“場面”,與如今物聯網、大數據的巨大陣勢相比,到底有多么微小,而又有多么偉大呢?

所以,只有那些專注于“宏數據”的組織、機構所研究的“算法”才可能涉及對生命、機理、智能等控制的主題。當然,諸如Google、Facebook這些科技大公司也可以去設立研究“宏數據”的科技部門或機構。但是,我們必須看到:一方面,果真如此的話,它們花費了數十年收集到的這些對商業具有無限價值的表層“大數據”(借用這些數據研發的算法,大多都是商用算法))基本都用不上了。另一方面,由于遠遠背離了這些科技大公司運營戰略、股東利益與商業價值,肯定會遭受股東會、董事會很大程度的阻擊。

更為重要的是,在如今科技高速迭代發展的情況下,再了不起的公司也經不起折騰,如曾經一統天下的柯達、諾基亞,說倒就倒下了,即便是IBM這樣偉大的世界性公司,也僅僅因為曾經忽視了計算機家庭化的趨勢,數年之內也差點兒倒在血泊之中。所以,才有李彥宏道出“百度離破產只有30天”這句憂患而很實在的經營“箴言”。當然,諸如像Google收購“Deep mind ”、IBM的沃森研發與“百度大腦”的開發等事項,都與潛在的“巨大商用”與擴大影響力等有著重要的關系。

實際上,大腦內的一些腦細胞集群所產生的微觀“宏數據”,都可能超過如今全世界所有物聯網所收集到的“大數據”的總和,更不用說整個大腦了。即便是數十年、數百年之后,人類技術非常發達,或許你都難以窮盡一顆大腦內的所有微觀的“宏數據”,更不用說數以億計的萬物了。所以,如今的物聯網,僅僅是收集了萬物外在的、淺層的“表數據”而已(當然,不排除未來往深度方面發展)。相對于萬物內在的超級巨大的“宏數據”來說,差別至少在指數級別之上。

從萬物內在的微觀上來看,既然如此巨大的“宏數據”我們都不能感知,那如此?。ㄏ鄬Φ男?,絕對數量構成了如今的“大數據”概念)而且大多很表面的“表數據”又能做什么呢?了解、跟蹤一下人們的行蹤、健康、生活,以此促銷,研發實用性機器人,提升人們包括健康、心情和行為等在內的整體生活,這確實還可行,且其經濟、實用價值與商業運營空間非常大。

若以此表面的數據,就認為“能夠開發出比人們自身更了解自己的算法,進而操縱人們的決定、行為。隨著數據量的積累,足夠大到可能破譯大腦深層機制和人類自身的身體,就會因而獲得建構新生命的能力。因此,那些能夠破譯生物算法的巨頭,終將成為生命與人類命運的主宰”等觀點和看法,是不是有些“想入非非”(不深入分析,確實能夠能讓人深度迷惑的)了呢?

于是,有人會問,那“阿爾法狗”、無人駕駛、人臉識別等人工智能又是怎么回事呢?確實,諸如“阿爾法狗”需要用到上億的過往頂級棋手的“棋局”數據,無人駕駛也需要數以萬計的實戰場景數據,人臉識別也需要數以千萬的人臉圖譜數據,正是這些數據的輸入與訓練,才讓“機器”通過深度學習、“左右互搏”的增強學習或對抗性學習以達到實用要求。這些棋譜、場景與人臉特征,即使內容再多,也只是屬于表層的大數據,即前述的“表數據”。收集這些數據,是諸如Google、Facebook、百度等互聯網公司的“特長”,這也是它們能在發展人工智能方面具備優勢的原因。

另外,任何一家大公司所獲取的數據總是有一定局限性的,即便是圍繞人的各類領域都不可能窮盡,更不用說其他領域了。例如,人們上廁所的習慣、對污水處理的關注、聊天與特別癖好等,未必就是Google、Facebook、百度等公司的長項了。

最為關鍵的是,這些人工智能技術及其日常概念下的“大數據”,都與上述“宏數據”及其涉及入侵、控制人類等的“算法”存在本質的區別,它們之間有著幾乎不可跨越的“鴻溝”。

談到這里,我們有必要回過頭來,對“算法”概念與內涵進行解讀。

一般在計算機領域經常用到或聽到算法的概念,其是指一系列解決問題的清晰指令,代表著用系統的方法描述解決問題的策略機制。當算法突破其狹義概念向廣義方向延伸后,就像很多其他被廣義了的事物一樣,其內涵便被賦予了無限遐想的空間。例如,“山寨”這一詞匯,最早就是指占山為王,無人管轄的意思,后來卻演變成“盜版、克隆、仿制”等行為的代名詞。整個意思跨界般地擴容了,甚至連詞性也跟著變了。當然,日常生活中,這樣的事例還有很多。

于是,算法的“馬甲”出現了:諸如小學學的“加法、乘法與除法”的計算法可以稱為算法;不同文字組合形成一句話的造句方式也可以稱為算法;甚至,有人將人類個體及其各類生物都看成算法,還說,每個動物都是各類有機算法的集合,是經過數百萬年的進化與自然選擇的結果。這些將“算法”的概念與內涵往外延伸的思想,確實沒有什么錯誤和問題,但是,如果無限性地延伸的話,那將增添“濃厚的文學演繹與想象色彩”,那肯定就不是事物本身的了。

古人說,“失之毫厘,謬以千里”,何況文學演繹與想象出來的“超級比喻性”的東西呢?得出嚴重背離事物本身發展趨勢,甚至是“南轅北轍”的結論,也就是很自然的事了。有一個著名的管理學段子,便能說明這一夸張的推演:

丟失一顆釘子,壞了一只蹄鐵;壞了一只蹄鐵,折了一匹戰馬;折了一匹戰馬,傷了一位騎士;傷了一位騎士,輸了一場戰斗;輸了一場戰斗,亡了一個帝國。

我們知道,一場戰爭的勝負,最終取決于雙方的綜合實力與智謀的較量,更不用說一個帝國的興亡了。所以,上述推演根本就是“想象”中的虛幻故事。然而,即便是涉及它所隱含的“注重細節”的教義,就其“奇跡性”的本身來說,現實中還是有人相信“這是真的”,并被廣泛傳頌。更有甚者,干脆將上述推論的中間環節省去,直接得出“一顆釘子,毀掉一個帝國”的結論,居然還是有人相信!顯然,這已經是堪比天大的“謊言”了。

既然算法并不像一些人所描述、想象的那樣,可以無限度地延伸,那又將怎樣去看待“算法及其聯動的人工智能將會戰勝人類”這類話題呢?

諸如算法、人工智能戰勝人類的論斷本身就是一個偽命題,或者說它們在某些方面比人厲害,根本算不了什么,用不著“大驚小怪”。在現實生活中,比人類厲害,或者說戰勝人類的東西太多了。

例如,你與石頭相撞,腿折了,說明石頭在硬度上戰勝了你;你走近一棵大樹旁,抬頭仰視樹梢,說明樹木在高度上戰勝了你;你到田間去抓黃鱔,它一下鉆進了水塘,你卻不能,這說明黃鱔在“潛水”方面戰勝了你;你到野外,看到幾個屎殼郎正在牛屎里攀爬,厭惡至極,這說明屎殼郎在化解糞便的能力方面戰勝了你……當然,從古至今,人們發明了無數的東西,從木棒、石器到弓箭、刀劍,從火藥、槍炮到導彈、核彈;從馬車、蒸汽機到汽車輪船、火車飛機,再到火箭、衛星與航天器;從筆墨紙硯到電話、收音機、計算機、手機、互聯網等,這些東西無不在其一定的性能或功能上強過人類,甚至遠遠超過和戰勝了人類。我們都不把這些放在心上,那為何還要害怕阿爾法狗這樣的“人工智能”呢?

阿爾法狗下棋那么厲害,然而它連把棋子擺上棋盤這樣一個簡單的、低級的動作都不能完成,它與石頭比你硬、樹比你高,或者說原子彈比你厲害有什么區別呢?或許你會說,它的“智慧”能戰勝世界頂級棋手(這根本就不是什么智慧,參見“從比喻到文化,再到恐怖崇拜”章節詳解),或者說,它們有被創造出“意識”的期許。不過我們嚴肅地告訴你,時至今日,那些哪怕有一丁點兒意識趨向的“強人工智能”“超強人工智能”都是想象中的或科幻電影中的故事。而且,我們還發現:

很多科研機構,數十年甚至上百年對機器、生物、大腦與意識等的深入研究,雖然號稱成效巨大,但是,時至今日,甚至連大腦冰山一角的幾片雪花或許都還尚未觸及(見“不可觸碰的星河”章節詳解)。正如對“谷歌大腦”“百度大腦”有著較大貢獻的世界頂級人工智能專家吳恩達先生所說的那樣:“雖然媒體經常渲染人工智能,但我認為離真實的人工智能還差得很遠。畢竟,我們對大腦的運作原理一無所知,而盲目地讓計算機復制大腦的工作狀態并不能為人們帶來好用的AI系統……當然,如果你聽到有人說要制造一個人工大腦的話,我的建議是趕緊躲遠點”《吳恩達在Quora上獲得上萬贊同的最高票回答,卻和人工智能無關》,來源于ZOL新聞中心,2017年1月17日,http://news.zol.com.cn/624/6244967.html。。

諸如阿爾法狗、無人駕駛、人臉識別等被一些人認為“遠遠戰勝了人類”的人工智能,實際上,相對人類來說,僅僅就是一種單一維度的“超高性能”的低級能力而已(參見“幾何級別的差異”章節詳解),更不說人類的“意識”和思想了。什么是意識?人類還根本摸不到北(見“不可觸碰的星河”章節詳解)呢。

既然我們對真實的大腦、“意識”等知之如此之少,特別是“意識”,幾乎難以觸碰,談何入侵人性、重組人類甚至控制生命(至少包含對物質上的大腦和精神上的“意識”的控制)本身了。即便是將來真能控制生命本身,那也是非常遙遠的事情,甚至從某種角度來說,幾乎都是不可能辦到的事情(并非絕對,只是強調難度)。

另外,一些人還提出“意識與智能”的分離問題,這與對“算法”和“大數據”被過分延伸與夸張的道理一樣,帶有強烈的文學演繹成分。因為從古至今,工具(包括機器)從來就沒有過意識,談何分離呢?而且,“意識”正是那些“人工智能將統治、替代人類”這類觀點的鼓吹者們所“追求或擔心”機器的終極目標。

另外,你看電腦或手機,這些網頁好像知道你喜歡什么一樣,及時給你推薦鏈接;無人駕駛車好像知道你想上車,看到你提前就停了下來,這些“智能”正是人工模仿人類設計出來的程序和算法的作用,并非“意識”,更非意識與智能的分離。就像你如今拿起一張小鐵板(手機)就能看到對方的表情與行為,在家中看著一塊玻璃(電腦銀屏)就能知曉天下大事一樣。這在古人看來,是超級智能、超級“意識”甚至是超級“生命”的結果。然而,你卻對古人說,不是,那是“鐵塊”與“玻璃”的超級智能與“意識”的分離。他們應該也會因為這個說法“新穎”和對事情本身的無知,加上對神秘性“神力”的崇拜,或許便真的相信了。

但是,新穎、神秘并不代表事實。即便是未來,我們假想“意識與智能的分離”成立(僅是假想,也有一些人用了無數的例子與道理來論證,但是,其結論與論證之間存在幾乎不可逾越的大量假設),那只能表明,這樣的人工智能更是工具了,更不足以擔心人類被替代、被統治與被奴役的事情了,因為它們再怎么智能,卻沒有“如何使用智能”的意識。

“人工智能”諸如巨大的存儲能力、超常的計算能力與非常的識別能力等單向的難以跨界的諸多能力,與人們數以千計、萬計的諸如情感、判斷、跨越無數界限的通用的學習等智能,以及借此所創造的這些智能工具和輝煌的人類文化與文明等相比,人到底比人工智能要高多少個級別呢?我們的答案是無數(參見“幾何級別的差異”章節詳解)。

另外,作為人類為什么要擁有那些超級的計算能力、巨量的存儲能力和超常的識別能力呢?這些都是可以利用的資源和工具。利用資源與工具才是世上最偉大的智能與智慧,才是最高級的。你需要在一生中去體驗那些更有價值和更具意義的事,諸如人生奮斗、困難的突破與喜怒愛樂等。如果你真的具備了這些超級能力,那么你怎么與周邊的人玩耍、交往和融入這個社會呢?

主站蜘蛛池模板: 金秀| 安顺市| 长武县| 漾濞| 乐安县| 梧州市| 靖边县| 永年县| 苍山县| 南乐县| 安达市| 乌拉特前旗| 乳山市| 依安县| 仙游县| 新昌县| 平顺县| 侯马市| 保亭| 海丰县| 洛川县| 息烽县| 靖安县| 石景山区| 陆良县| 洛阳市| 靖州| 灌南县| 潮州市| 定日县| 常熟市| 潼关县| 兴城市| 封丘县| 开阳县| 德州市| 神木县| 侯马市| 宿松县| 南召县| 桃江县|