- 數據中臺建設:從方法論到落地實戰
- 彭勇
- 2571字
- 2021-10-15 18:41:48
1.3 DT時代已來
1.3.1 DT時代和IT時代的差異
阿里巴巴集團創始人馬云首次提出“人類正從IT(Information Technology,信息技術)時代走向DT時代”,最早從科技和互聯網企業開始倡導大數據思維與數據優先的價值理念,逐步將其傳播和擴散到各行各業。大部分行業或者一個行業的大部分企業都在積極探索、實踐數據價值和數據智能,且形成數據優先的共識,就標志著人類已經進入了DT時代。
在IT時代,萬維網實現了網絡的互聯互通,讓之前很多線下的經營和生產活動可以在線上完成。例如,人們可以在線上聊天、購物、存/取錢、交易股票、洽談合作等。以學生學籍管理信息系統為例,該系統提供的核心功能是實現學籍管理線上化和無紙化,支持學籍在線錄入、編輯、查詢和管理。IT時代實現了線上化、信息化和流程化,體現的核心價值是將線下的行為和活動簡單地搬到線上,突破了時間、空間的限制和約束,讓人們可以隨時隨地獲取在線服務。
如果使用維度空間的理論來進行形象的解釋,那么IT時代類似于二維空間,記錄的是點線面的世界,人們無法感知更高維空間的有用信息。由于受到維度的限制,獲取的信息量不豐富、處理信息的能力不足、算法預測能力的缺陷,讓IT系統難以提供強大的預測、認知和智慧能力。
國外科學家曾做過一個實驗,在螞蟻的前、后、左、右分別放上食物,然后觀察螞蟻的行為,結果發現螞蟻可以很快地確定食物的位置。然而,如果將食物懸掛在螞蟻的頭頂上方,繼續觀察,那么會發現螞蟻因為聞到食物的氣味而在食物下方一直轉圈,需要被給予足夠的引導且要花費足夠長的時間才能最終確定食物的位置。盡管在IT時代,部分系統也具有一定的預測能力,但是這就與螞蟻聞到上方食物的氣味并被給予足夠的引導,最終才能找到上方食物的位置類似。只要得到更多的信息和線索,并被給予合適的引導,且花費足夠多的時間和精力,螞蟻就可以局部突破二維空間的限制。其中,信息和線索類似于大數據,引導類似于智能算法,花費的時間和精力類似于算力。因此只有借助于大數據、算法和算力的有效支撐,螞蟻才能確定上方食物的準確位置。
與IT時代的二維世界相比,DT時代相當于更高維度的世界。在這個高維度的世界里,人類進入了立體和網絡的世界,可以感知更多的物體,能收集更豐富的信息和數據,可以獲得更強的預測、認知和智慧能力。這個時代的核心是萬物互聯、數字化和智能化,這意味著更多的智能設備、更海量的數據、更強大的算力、更智能的算法、更個性化的用戶體驗、更強的預測和感知能力。
此外,在DT時代,數據和算法無時無刻不在影響我們的生活。我們感知的是算法和智能的魅力,享受的是大數據時代更具個性化的推薦和服務。通過DT技術(大數據、云計算、人工智能、區塊鏈、機器學習、量子計算等),我們可以更好地預測世界,更好地感知世界發生的變化和可能面臨的風險、提升認知能力,更好地決策。以智能保險服務機器人為例,客戶通過語音或智能手機的對話窗口實現與機器人實時溝通保險需求,其主要功能如下。
(1)機器人利用歷史的海量數據,挖掘和預測客戶的需求,然后智能推薦最匹配客戶需求的保險方案并按照某種算法(比如,性價比)進行排序。
(2)機器人利用客戶對保險方案的點擊、收藏、轉發或購買行為,實時更新和迭代推薦的方案,以最大化匹配客戶的保險需求。
(3)在客戶購買保險后,機器人會實時跟進客戶的保險體驗,給予客戶更多的風險管理支持服務,并感知客戶可能出現的風險情況,對客戶進行實時風險預警,以幫助客戶降低出險的概率。
(4)在客戶出險理賠后,機器人會給予更專業的理賠建議和指導,積極撫慰客戶,舒緩客戶出險之后的緊張和不安的情緒,給予客戶更極致的服務體驗。
總之,傳統的信息化系統更多的是以功能和流程驅動的,目標是完成某項業務需求而事前進行設計和實施,體現的是標準化和流程化能力,整個體系缺乏良好的自適應性和預測能力。在DT時代,業務節點普遍呈現網絡散點式分布,每個節點在數據中樞的賦能下都是一個小智慧體,彼此互聯互通,不斷地進行信息和數據交互,并根據歷史的知識和認知實時探索未知的領域,生成新的知識。整個系統具有強大的預測能力和智能化水平。在這個復雜的系統內,數據就像血液一樣川流不息,并進行新陳代謝。算法與大數據的結合形成了強大的預測、智慧能力以滿足客戶動態和個性化的需求。
1.3.2 DT時代面臨諸多挑戰
在DT時代,由于數據可以來源于任何智能設備,使得數據量呈現指數性、爆炸性增長。在這種情況下,企業如果不做好數據的梳理、分類和集合,那么數據不僅難以產生有效的價值,而且有可能變成存儲成本高昂的“數字垃圾”。在DT時代,企業面臨諸多挑戰。隨著設備越來越多、數據越來越繁雜、交互越來越頻繁、業務越來越復雜、生態圈越來越大、需求越來越動態化和個性化、環節越來越智能化,企業發現適用于IT時代的基礎理論、邏輯、系統架構、組織架構等不再能完全滿足DT時代的需求和訴求。以“因果關系”和“相關性”為例,IT時代強調因果關系,有因必有果,有果必有因。在DT時代,人們不再是線性地看問題,而是立體和多維地看問題,像“啤酒和尿布”這樣關于相關性的經典案例在DT時代會變得非常普遍。在這個多維世界里,盡管因果的邏輯依舊很重要,但是將不再占有統治地位,而相關性的應用范圍將越來越廣泛。
站在企業級數據應用的角度,從數據采集、存儲、抽象到數據價值挖掘等環節,也有很多亟須解決的問題。比如,如何實現數據的高可用性,如何提供好用的數據工具(包括數據采集工具、數據倉庫、數據湖等)以提高數據運用效率,如何實現數據的可視化分析和應用,如何在數據倉庫的基礎上合理地抽象出數據服務以達到高復用性的目的,如何實現數據價值分析、挖掘、交互、反饋的自動化和智能化,如何構建大數據平臺提高數據應用效率以降低能耗,如何設計數據服務體系保障數據服務的穩定性和健壯性,如何保障數據安全和客戶隱私……
除此之外,隨著企業各項業務有序開展,單個企業很難同時擁有其業務發展所需要的全部數據、算法、平臺等核心資源。從提升企業發展效能的角度來看,企業應該盡可能復用或者有效地利用行業的各種資源,讓其為己所用,發揮最大的價值。另外,企業之間缺乏統一的數據標準和數據服務體系,限制了數據價值的有效流通,讓數據價值的最大化實現阻力重重。
基于以上原因,構建一套統一的數據應用體系,讓數據價值有效流通,讓數據服務可以復用,并實現數據價值,是DT時代需要重點解決的。