- 大數(shù)據(jù)經(jīng)濟
- 謝文
- 2148字
- 2019-01-05 07:11:12

●○●數(shù)據(jù)已成為生活必需品?
在很多會議上,總聽到一些專家們開講大數(shù)據(jù)時以引用名人的話開頭說:“不要迷信數(shù)據(jù),數(shù)據(jù)只是底層的東西,沒什么價值。真正重要的是如何把數(shù)據(jù)變成信息,信息變成知識,知識變成智慧,即所謂Data-Information-Knowledge-Wisdom金字塔,簡稱DIKW模型?!边@個在20世紀90年代初期形成的說法流行一時,被寫進很多計算機教科書里,以至于今天還有許多出了校門就不再讀書思考的人將其奉為不變真理,即使過了四分之一世紀后仍舊不假思索地照本宣科。
在這些人眼中,“數(shù)據(jù)”和“大數(shù)據(jù)”其實是一個概念,只有量的多少,沒有質(zhì)的差別。這種說法迷惑了很多外行人,或者以為大數(shù)據(jù)不過是層出不窮的時髦概念中的一個,沒什么實質(zhì)性內(nèi)容;或者以為大數(shù)據(jù)不過是古已有之的數(shù)據(jù)概念的擴展和延伸,繼續(xù)過去的思路去把握即可。
其實,DIKW模型不過是古希臘哲學中形式邏輯基本架構(gòu)的現(xiàn)代翻版,沒什么新意。在亞里士多德那里,形式邏輯的最基本要素是概念,確定概念間關系的是命題,命題推演開來得到定理或推論,所謂智慧,無非是將眾多定理和推論進行更抽象的思考和分析的能力。早期計算機發(fā)展中主要遵循形式邏輯的規(guī)則,人們輸入若干搜集來的數(shù)據(jù),然后通過機器的邏輯運算獲得數(shù)據(jù)間各種數(shù)量關系和相關關系。在此基礎上,人們用頭腦去做進一步的推論。所以,有些人認為,機器最多可以處理數(shù)據(jù)和信息,知識和智慧只能通過人腦形成。人類思維能力的神秘性、智慧的崇高性,乃至于掌握了若干知識和智慧能力的精英們的社會地位和影響力,無不基于這一假設。
社會的發(fā)展開始打破這一古老的傳說,而最終暴露出這種傳說的謬誤的力量來自由數(shù)據(jù)向大數(shù)據(jù)演變的過程。無論數(shù)據(jù)還是大數(shù)據(jù),從表面形式看都是一堆數(shù)據(jù)而已,但本質(zhì)上二者逐漸產(chǎn)生多方面的差異。
首先,數(shù)據(jù)的產(chǎn)生早已不是僅僅局限于若干實驗室和辦公室,由若干經(jīng)過訓練的專業(yè)人士采集整理而成,而是萬事萬物都在數(shù)據(jù)化,數(shù)據(jù)成為世界的另外一種存在形式。今天絕大部分的數(shù)據(jù)都不是人們有目的、有意識、在一個封閉環(huán)境中進行分析利用的產(chǎn)物,而是人們?yōu)榱藢崿F(xiàn)其他目的而不得不制造出的東西。這些東西對特定目的而言,是噪音,是垃圾,是負擔,既不是信息,也不能產(chǎn)生知識和智慧。人們現(xiàn)有知識和智慧所能處理的數(shù)據(jù)大概僅占現(xiàn)有數(shù)據(jù)量的萬分之一,而從時間和經(jīng)濟成本考慮,這萬分之一能夠被處理的數(shù)據(jù)中真正被處理的又不到其百分之一。所以,那種在人工封閉環(huán)境中的“數(shù)據(jù)—信息—知識—智慧”模式就顯得很蒼白,很無力,很沒有說服力。
其次,正因為世上萬事萬物都在被數(shù)據(jù)化,那么由此產(chǎn)生的數(shù)據(jù)形態(tài)就與原有物質(zhì)形態(tài)相對應,數(shù)據(jù)之間的相關性、因果性和或然性都以原生態(tài)的形式呈現(xiàn)出來,成為原生態(tài)的信息。人們得到的數(shù)據(jù)不再是過去那種人工采集所得到的孤立、零碎、片面、帶有明確目的性和主觀性的東西,而是原生態(tài)的數(shù)據(jù)群落,既包括數(shù)據(jù),也包括數(shù)據(jù)間的關系。那些體現(xiàn)同一主體的眾多數(shù)據(jù)可以根據(jù)其內(nèi)在聯(lián)系成為時下被科學家們命名為“元數(shù)據(jù)”的東西。例如,一個人的全部網(wǎng)絡行為記錄數(shù)據(jù),就構(gòu)成其網(wǎng)絡生活的全景圖譜,沒必要再去考證、推論、猜測才能得出結(jié)論。一個人的體溫達到38℃,同時其全面的身體狀態(tài)數(shù)據(jù)也呈現(xiàn)出來,使得數(shù)據(jù)化診斷成為非常簡單的事情。至于一個國家、一個具體領域,如果能夠得到其動態(tài)、實時、全面的數(shù)據(jù),那么,理解、分析、把握的事情也就不是什么了不起的工作。
再者,數(shù)據(jù)產(chǎn)生、存儲、處理、傳輸和利用的人工設備不再僅僅是傳統(tǒng)意義上的計算機,而是任何具備相同功能的人工制造物,例如手機、眼鏡、手表、衣物、汽車、飛機、機床等,更不用談數(shù)以十億計的各種傳感器。據(jù)專業(yè)機構(gòu)預測,到2020年,世界上各種各樣的數(shù)據(jù)終端總數(shù)將超過500億。同樣,和數(shù)據(jù)打交道的人也不再僅僅是數(shù)量有限的專家,而是絕大部分人類。獲得數(shù)據(jù)的目的不再僅僅是科學興趣或?qū)I(yè)需求、獲得知識和智慧的途徑,而是日常生活的一部分。數(shù)據(jù)化生活不僅僅是在個人層面,而是在企業(yè)、機構(gòu)、組織層面,進而在國家層面都具有了不可或缺的意義。如果說在過去,知其然,不知其所以然,是用來嘲諷一些人的淺薄無知,那么,在大數(shù)據(jù)時代,對大多數(shù)人大多數(shù)事情而言,知其然足矣,何必一定要知其所以然?換句話說,獲取數(shù)據(jù)的目的不再局限于為知識和智慧打基礎,而成為空氣和水一樣的生活必需品。
最后,原生態(tài)的數(shù)據(jù)群落已經(jīng)不能僅僅靠形式邏輯去分析推理,實時、動態(tài)、復雜相關的海量數(shù)據(jù)還需要非形式邏輯和概率分析。越來越多的專業(yè)人士開始把數(shù)據(jù)、信息、知識作為同義詞使用,因為沒有非數(shù)據(jù)化或不能數(shù)據(jù)化的信息,也沒有非數(shù)據(jù)化或不能數(shù)據(jù)化的知識,即使是過去被人神秘化的所謂“智慧”,也在近年轟轟烈烈的人工智能發(fā)展中逐步被認知,被數(shù)據(jù)化,變?yōu)楹敛簧衩氐囊欢褦?shù)據(jù)。過去,人類用了十年時間,將人類DNA數(shù)據(jù)化,使得生命過程不再神秘,數(shù)據(jù)化醫(yī)療保健成為可能?,F(xiàn)在,美國和歐洲又分別啟動了人腦數(shù)據(jù)化的十年項目,將人類思維機制和過程數(shù)據(jù)化,使“智慧”數(shù)據(jù)化。這樣看起來,數(shù)據(jù)既是手段,也是目的,既是此岸,也是彼岸,“大數(shù)據(jù)”之大,意義便是如此。
簡而言之,數(shù)據(jù)是信息,數(shù)據(jù)是知識,數(shù)據(jù)是智慧,數(shù)據(jù)是一切的一切。這應該令人興奮,而不是恐懼。什么可知不可知,陳腐的觀念在大數(shù)據(jù)面前不堪一擊。而舊瓶裝新酒,還在用過時的數(shù)據(jù)概念和認知理論套在大數(shù)據(jù)現(xiàn)象上,不僅無用,而且誤導。