官术网_书友最值得收藏!

大數據悖論,空想的“主義”與“宗教”

未來似乎是數據的世界,但是,我們發現,大數據存在重大的缺陷。

一條大河將一座城市分為南、北兩大城區,河上有三座大橋,分別為一橋、二橋和三橋。在這座城市內,所有車輛的運行狀況都被適時跟蹤與聯網,即任何一輛車任何時候在哪兒、將去哪兒、行走的線路、方向與速度等數據都被及時傳送到該城市的交通管控中心,人們可以隨時知曉所有車輛總體、局部和個別的運行狀況。這一現象和技術被稱為基于大數據的智能交通。早期,由于數據消費價格過高,只有50輛車安裝了“車況顯示器”,即能隨時分享到這一智能交通的大數據,車主甲便是其中一位。某日,車主甲想從城南前往城北,查看了一下數據,正在前往一橋的車輛有600輛,去二橋的有400輛,去三橋的有100輛,于是他便將車開往三橋,毫無擁堵地到達了城北,只用了18分鐘;而沒有安裝“車況顯示器”的車主乙卻開往了一橋,結果堵了1.5小時的車(堵在路上,想掉頭都難)。

在如此擁擠的城市里,這50位車主隨時過橋如入無人之境,他們興奮而高呼“大數據太神奇了!”后來,隨著技術的改進和消費價格的降低,“車況顯示器”開始逐步普及。這之后,很多車主漸漸發覺“車輛適時數據”已經不太好用,甚至在添亂了。

某天,車主甲想過橋,看了一下車況數據:正往一橋去的有600輛車,往二橋去的有400輛,往三橋去的有100輛,于是他將車開向了三橋;走了不到2分鐘,車況即時播報,現在正朝三橋去的車輛增至300輛,一橋下降到200輛,他趕緊掉頭向一橋而去;又過了2分鐘,車況再顯示,一橋車輛突增至400兩,二橋車輛下降到180輛,他又掉頭奔向二橋;剛過1分鐘,車況又顯示,二橋車輛突增至320輛……車主甲像中了魔咒一樣,徹底崩潰了,只得氣急敗壞地把車停到了路邊。

為何會出現這種情況呢?這是因為大家都同時知道整座城市的適時車況,發現哪座橋車輛少,就有很多人同時涌向那座橋,就像房價漲勢不斷時,總有很多人跟風不斷買進,某只股票正在暴跌時,總有很多人不停地跟風拋單一樣。如此及時地反反復復,結果大家都被人為地拖入了“不知所措”的尷尬境地,反而引發了整座城市更大的混亂與無序。

于是,一些人開始不再使用“車況顯示器”了,從此之后,似乎城市反而變得不再那么擁擠了。這又是為什么呢?一是因為隨著使用大數據的人減少了,數據優勢漸漸又回來了;二是不再有更多的人被數據“適時”牽引,適時推高局部的“擁擠浪潮”,其“反向作用”的放大效應被弱化了。

這一特別現象,本書稱為“大數據悖論”。即當大數據被少數人掌握和使用時,能產生神奇的效用,但是,當多數參與者都知曉并使用后,其效用將大打折扣,甚至引發反向的破壞作用。該悖論在鮮有人直接影響的領域不適用,但是,在多人參與并形成競爭關系的任何領域都適用,具有普適性。

如今,正處于少數人、團體掌握和使用大數據的時代,屬于大數據初期。這時,大數據確實彰顯出了巨大的作用和價值,這是當下的主流。但是,這在未來將會被打破,同時伴隨著眾人開始介入與使用,在競爭性領域,大數據效用、價值將會下降,有時甚至還會產生反面的破壞作用。

下面介紹大數據悖論不適用的案例。例如,數據顯示影星安吉娜·朱莉患乳腺癌的風險高達87%,這一風險無人與她“競爭”,她聯想到家族病史,于是才有“切乳手術”的果斷與勇敢(一些人用以神話大數據的著名案例);又如,大數據運用的智能家居,未來的你走出辦公樓,汽車早已自動開來接你,你還在路上,家中的燈具、空調、熱水等設備已經自動啟動了,這個“享用”沒有外人與你競爭;再如,深度運用了大數據的未來天氣預報,預測會變得非常準確,將不再有“預報明天下雨而事實上卻是陽光燦爛”的尷尬出現了。這些都是大數據產生奇效并有著重大價值的方面。

大數據悖論適用的例子很多,諸如科研、教學、航空、軍備,以及思想、交流與日常生活等都普遍存在,未來更甚。

例如,適時家裝大數據,如果只有海爾公司知道你這個月正在家裝,其獨家定向推薦給你產品,你很可能產生“被關注與尊重”的榮幸,或許就買海爾的電器了。但是,當美菱、美的、格力、長虹、春蘭、海信等數十家企業都分享了這一大數據時,便是多人參與并形成了競爭關系。你被這么多企業同時關注,選擇太多,不僅讓你無從下手,而且很可能還讓你產生“被曝光與不堪其擾”的反感,當然,即便你購買了家電,也不可能只鐘情于之前的海爾了。又如,你從外地回來,講著各種新鮮事(獨占數據),吸引了很多聽眾和羨慕的眼光,正在“小炫耀”時,突然來了一幫人,他們都去過那里(數據已被分享了),而且還指出了你的很多錯誤與誤解,你頓時便失去了“小炫耀”的吸引力和資本了。這些都是大數據價值被削減、降低,甚至產生反向破壞作用的方面。

數據實際上是一個很古老的東西。上古時期的結繩記事、以月之盈虧計算歲月,到后來部落內部以獵物、采摘多寡計算貢獻,再到歷朝歷代的土地農田、人口糧食、馬匹軍隊等各類事項都涉及大量的數據。這些數據雖然越來越多、越來越大,但是,人們都未曾冠之以“大”字,是什么事情讓“數據”這瓶“老酒”突然煥發了青春并如此時髦起來呢?

當互聯網開始進一步向外延伸,并與世上的很多物品連接之后,這些物體開始不停地將適時變化的各類數據傳回到互聯網并與人開始互動的時候,物聯網便誕生了。物聯網是一個大奇跡,被認為可能是繼互聯網之后人類最偉大的技術革命,是這樣的嗎?(見“互聯網將會這樣被替代”章節的詳解。)

如今,即便是一件物品被人感知到的幾天內的各種動態數據,都足以與古代一個王國一年所收集的各類數據相匹敵,那物聯網上數以億計的物品呢?是不是數據大得不得了?于是“大數據”產生了。如此浩如煙海的數據,如何分類提取和有效處理呢?這需要強大的技術設計與運算能力,于是“云計算”產生了。其中的“技術設計”就歸屬于“算法”。“云計算”需要從海量數據中挖掘有用的信息,于是“數據挖掘”產生了。這些被挖掘出來的有用信息去服務城市,就稱為“智慧城市”;去服務交通,就稱為“智慧交通”;去服務家庭,就稱為“智能家居”;去服務醫院,就稱為“智能醫院”;去服務生活,就稱為“智能生活”……于是,智能社會產生了。不過,智能社會真正得以有序、有效運行,中間必須依托一個“橋梁”與工具,那就是“人工智能”。

這就是近幾年,諸如“人工智能”“物聯網”“大數據”“云計算”“算法”“數據挖掘”和“智能××”這些高大上的時髦名詞和概念突然同時冒了出來的原因,原來它們都是“同一條線上拴著的螞蚱”啊!

注意,萬物大數據主要包括人與人、人與物、物與物三者相互作用所產生(制造)的大數據。其中,人與人、人與物之間制造出來的數據,有少部分被感知;物與物之間制造出來的數據是根本無法被感知的。

對于人與人、人與物之間被感知到的那部分很小的數據(相對于萬物釋放的量來說非常小,但是絕對量卻非常大),主要是指在2000年后,因為人類信息交換、信息存儲、信息處理三方面能力的大幅增長而產生的數據《大數據:人工智能的基石》,美國南加利福尼亞大學安嫩伯格通信學院的馬丁·希爾伯特(Martin Hilbert)總結,來源于網易轉載《南京日報》文章,2017年6月6日。http://news.163.com/17/0606/06/CM7RHTDN000187VI.html。,這實際上就是我們日常所聽到的“大數據”的概念,這是以人為中心的狹義大數據,也是實用性(商業、監控或發展等使用)大數據。據估算,從1986年到2007年這20年間,人們每天可以通過既有信息通道交換的信息數量增長了約217倍,全球信息存儲能力增加了約120倍《大數據:人工智能的基石》,美國南加利福尼亞大學安嫩伯格通信學院的馬丁·希爾伯特(Martin Hilbert)總結,來源于網易轉載《南京日報》文章,2017年6月6日。http://news.163.com/17/0606/06/CM7RHTDN000187VI.html。。信息存儲、處理等能力的增強為我們利用大數據提供了近乎無限的想象空間。

為何說萬物之間所產生的“未被感知”的大數據非常巨大呢?舉個簡單的例子,種子掉到地上,要與土地、溫度、氣候、水分、陽光及數以億計的微生物等適時地相互作用,引發種殼、種肉、胚芽之中各類微量元素、能量與組織、細胞甚至分子之間的相互作用、生化反應等,要制造出數以億計的“信息”(數據)才能慢慢長出芽來,這是人類感知不到的。

所以,萬物的大數據本身就存在,只是現今人們能夠感知到更多了。因此,當下概念的“大數據”,實質上就是“感知到的大數據”,這與萬物本身所產生的“實際大數據”的概念不同,容量存在天壤之別。

人類社會的發展,大趨勢是朝向透明化與共享性的。例如,過去華麗的鐘表不僅是地位、身份的象征,更是對時間準確度的奢侈擁有,而平民百姓只能由上層階級賜予,所以,四五十年之前的眾多街鎮、城市最中心的位置總有一座極其高大與威嚴的“鐘鼓樓”,而如今手機、電腦甚至很多物件上都無償地分享了精準的時間。又如,互聯網的興起,過往很多高大上的諸如圖文影像剪輯特技、機密資料及很多行業的專有技術漸漸都被低廉地分享給了大眾。美國有一位大學生依靠公開發行的資料,居然設計出了一枚原子彈,這還是1976年的事呢《“原子彈小子”:這位美國大學生依靠公開發行的資料,居然設計出了一枚原子彈!》,來源于《ZAKER》2017年4月21日,https://www.myzaker.com/article/58f9eb841bc8e05260000002/。

所以,如今政府、機構和少數公司所收集、掌控的重要的、有著無限價值的大數據,未來大多數(少數不可分享是存在的)都將被低廉或無償地分享給大眾。這種被分享,并非公司、機構等愿意,而是大勢所趨下的“精明行為”。

于是,那時候,幾乎所有存在競爭因素的領域、行業,大數據悖論的效應都將產生、發酵,數據不僅將變得不再那么重要,而且大數據被普及后,在絕大多數領域其不再被作為“競爭優勢”來使用了,這個有點類似于“打印”的普及。如在20年前,大家都在手寫文案時,你突然用電腦打印文案,很有優勢,而現今,打印文案已經成為“基本常識”和“基本手段”,是一種最起碼的習慣了,于是,“打印”失去了比較優勢后變得很平常,看起來“不那么重要了”。而且,很多時候還會引發如同前文所述的車主甲過橋一樣,最后陷入“無所適從”的境況。

這里的無所適從,有時表現為“知道得越多,越難做出選擇”的心理與行為。美國哥倫比亞大學與斯坦福大學曾經共同進行了一項研究:在一家繁華的超市設了兩個小吃攤,一個有6種口味的果醬,另一個有24種口味的果醬。結果顯示,24種口味的攤位吸引顧客較多:242位經過的客人中,60%的人會停下試吃;而260個經過6種口味攤位的客人中,停下試吃的只有40%。不過,最終的結果卻出乎意料:在有6種口味的攤位前停下的顧客至少30%都買了一瓶果醬,而在有24種口味的攤位前,試吃者中只有3%的人購買了果醬《拿不定主意》,來自《中國校園文學》,2007年第11期,http://www.cnki.com.cn/Article/CJFDTotal-XYWZ200711025.htm。。這類情況,現實中很多,幾乎普遍存在。

大數據悖論中的“無所適從”在未來所有競爭性領域很多時候還會引發破壞性的作用。這一負面效應,如今看來,幾乎是不可避免的。這是為什么呢?

前面已經講過,社會透明性與共享性將會逐年增強是大趨勢,且人造大數據只會越來越多。經反復分析后,我們認為:透明、共享與人造數據這三者趨勢的“同向性”是“大數據悖論”產生的重要條件。所以,“大數據悖論”肯定是不可避免的,且會越來越厲害。那么,有沒有什么技術能解決這一大問題呢?我們認為,隨著人類科技的發展,應該是有的,如從量子科技中去發掘一些技術等。

這樣一來,是不是大數據在未來的競爭性領域、行業將徹底失去作用了呢?不是這樣的。例如,一幫人用刀打仗,而你一人有槍,你肯定占盡了優勢(少數人獨享“大數據”),當大家都拿槍時你就不占優勢了,而且可能比大家都用刀時死得更快了(大數據悖論的負面效應),但是,如果別人都用槍時,你卻不用槍了,那肯定死得極慘(大家都在使用“大數據”,你卻不用的后果)。未來,大數據就如該例中的“槍”一樣,你將怎樣選擇呢?當然,槍也只是某種作戰的工具,比它厲害的武器還有很多,未來或更甚。

既然數據并不如想象中的那么神圣和偉大,那么,它也僅僅是人類認識自己、認知世界無數不同的方式之一而已。有人把莫扎特小夜曲、經濟泡沫、流行疾病,以及詩歌、植物與泥土等萬事萬物當成不同的數據模式,那么,也可以把這些看成不同信息的集合體,更可以當成是不同能量的存在方式等。這些都不能代表“數據”一定就比其他方式“特別”。

有人把人類看成一個數據處理系統,把個體看成芯片,那么,也完全可以把人類看成一個原子,原子核就是如今以“權力”“財富”為主導的價值觀體系,圍繞原子核運轉的電子就如“金字塔”形的政治、經濟、文化等體系,充滿原子內腔那無限廣闊的“虛空”(或許是暗能量)就是人類個體和自然界的相關物種等。這些都可以展開無數豐富的聯想與文學演繹。

被譽為“硅谷天使”的投資界的思想家彼得·蒂爾(Peter Thiel)曾說:“人不是信息(也可理解為數據),而是血肉之軀。我們作為物質性的存在,比作為信息性的存在更重要。所以,世界各地的照片不重要,如何以更廉價的方式到達那里更重要;發明癌癥的診斷工具很重要,但是發明癌癥的治療方法更重要。”《為什么我們沒有會飛的車》,來源于《三聯生活周刊》2015年第12期。由于萬物皆由原子組成,比起“萬物皆為數據構成”的某些推論來說,前者已是“鐵定”的事實。所以,上文以原子來演繹人類或許更靠譜,更能靠近實質。即便是這樣,也更像一個形象的比喻,談不上闡明了某種深刻的道理,更談不上揭示了人類的什么本質,或許僅僅只是盲人摸象而已。

如果有人再用這類“美妙的比喻”與文學演繹的方式來推斷數據的未來與未來的人類,那就太離譜了。但是,現實中確實存在很多人,居然還將其當成“真相”來信服,這又是為何呢?

特別說明:一些人將世間萬物及其運行都看成了數據與數據流,以此證明人類的創造、發明并沒有什么了不起的論斷,是不是就像服裝節上,有人只盯著所有服飾下那些微小的絲線,說那些“華美的、風格各異的服飾等人類創造與才能展示都算不了什么,一切都只是一堆亂線而已”一樣呢?而且還有人說,隨著這些數據最后多到人們難以處理與應付時,人類將被取代或被迫退休了。不說這一結論所存在的問題,單說這一邏輯及推理,是偏執呢,還是已經鉆進了牛角尖了呢?

實際上,世間萬事萬物,隨時都在產生數以億萬計的“大數據”,現今如此,古代也是如此。前文已經提到,如今的大數據,只是人們感知的能力增強后所獲得的“感知數據”,過去人類沒有互聯網和物聯網,對大數據的感知不足,但并不代表它們不存在。而且,古人不去處理或者說沒有能力去處理和應付這些數量龐大的數據(從總量上來說,或許并不比如今和未來少多少),似乎也并沒有生活得很不自在,更沒有被他物替代或被迫退休。

由此,我們認為,如今特別是未來,很多時候,若過分(恰當地相信與使用,有必要也很重要,就像人們如今使用電能一樣)相信數據、依賴數據的話,肯定是會出問題的,甚至會喪失一些生存的基本能力,更不用說一些人認為“掌握數據就會讓人永生”這樣夸張的了。

未來,各類大數據就像當下人們對“精準時間”的擁有一樣容易,如不考慮大數據悖論的負面影響,也頂多像如今人們對待分子、電能與信息這類東西一樣的態度與“習慣性擁有”。

退一萬步來講,即便未來人類被替代和“退休”,那也與所謂的“數據主義”“數據宗教”沒有直接關系,有人太高估大數據了。不過,一些以文學方式演繹、聯想出來的美妙故事,確實很吸引人,但是,這些似乎都是事物的表面,遠遠還未觸及事物的實質。

主站蜘蛛池模板: 金湖县| 广州市| 陆河县| 潮安县| 高邑县| 潍坊市| 吉木萨尔县| 台东县| 乌兰浩特市| 太和县| 惠州市| 盐山县| 宜丰县| 玛纳斯县| 新田县| 满城县| 大丰市| 静安区| 南平市| 沿河| 高淳县| 宁国市| 阳西县| 沙坪坝区| 湘阴县| 景泰县| 米林县| 黔南| 澎湖县| 册亨县| 金川县| 无棣县| 晋江市| 内乡县| 和龙市| 班玛县| 松潘县| 当雄县| 封开县| 稷山县| 离岛区|