- 大數據素質讀本
- 夏道勛
- 965字
- 2020-11-06 15:53:27
前言
人類步入信息化社會,得益于計算機技術、網絡技術、通信技術和傳感技術等的飛速發展,信息化建設已經滲透到各個行業。在信息化建設過程中,人們利用應用系統、移動App和傳感器設備等積累了越來越多的行業數據,形成了大量結構化數據、半結構化數據和非結構化數據,記載了生產、分配、交換和消費的歷史足跡,每一條數據都清晰地記錄了某人或某物,在某一時刻,某一地方涉及的相關內容或產生的金額。
隨著時間的不斷推移,歷史業務數據積累到了TB、PB甚至更高的量級,人們也逐漸意識到這些數據蘊藏著潛在的關聯關系。與此同時,海量數據也給信息技術提出了前所未有的挑戰,需要解決計算、存儲、數據庫和網絡通信這4個瓶頸問題,使人們在可承受的時間范圍內,利用新的處理模式對所有數據進行分析和處理,以適應海量、高增長和多樣化的信息資產。由此,大數據便孕育而生,人們歸納提煉出大數據應具備的4個特征,它們分別是數據體量巨大(Volume)、數據類型繁多(Variety)、處理速度快(Velocity)和價值密度低(Value)。
當前,新的處理模式如Hadoop生態圈和Spark生態圈等開源軟件已助大數據技術日趨成熟,降低了大數據產業化門檻。進入產業化階段,大數據成為培育和帶動經濟及新產業的重要力量,從商業角度和技術角度厘清大數據的核心產業鏈尤為重要。從商業角度上看,大數據產業鏈由大數據提供者、大數據產品提供者和大數據服務提供者等角色構成;而從技術角度上看,大數據產業鏈由大數據采集、大數據存儲管理和處理、大數據分析和挖掘,以及大數據呈現和應用等4個環節構成。在大數據產業具體實施過程中,產業鏈上的4個環節涉及6個關鍵技術,它們分別是大數據采集、大數據預處理、大數據存儲、大數據處理、大數據分析和大數據可視化。這些內容,本讀本都有詳細闡述。
本讀本是一本不受專業限定的科普性通識讀物,編寫的目的是讓人們了解和認識大數據,并吸引人們積極參與到大數據產業發展中來,為國家大數據戰略做出貢獻。本讀本較為全面地介紹了大數據涉及的國家政策、經濟、產業和技術發展等內容,主要包括信息技術發展現狀、大數據時代到來的成因、大數據的發展現狀、大數據技術概況、典型事例解析、貴州省大數據產業發展概況、大數據的其他重要話題等內容。如果你想零基礎入門大數據,相信此讀本一定能夠給你提供很多幫助。
夏道勛
貴州師范大學
貴州省教育大數據應用技術工程實驗室
2019年2月10日