書名: 智能與數據重構世界作者名: (美)薄智泉 徐亭主編本章字數: 987字更新時間: 2020-09-25 12:47:13
第1章 數據為王
大數據的特性
大數據的云計算平臺
去中心化的區塊鏈數據庫
大數據工具
數據安全
機遇與挑戰
20世紀80年代,著名未來學家阿爾文·托夫勒在《第三次浪潮》一書中首次提到大數據(Big data)[1]。隨著互聯網、物聯網和云計算技術的迅猛發展,大數據在互聯網信息技術行業逐漸流行起來。聯合國“全球脈動”項目分析了各國特別是發展中國家在運用大數據促進社會發展方面所面臨的歷史機遇和挑戰,并系統地介紹了運用大數據的策略建議,從而推動了數據收集和分析方式的發展;70多個國家和地區已將大數據應用上升為國家發展戰略。例如,美國、英國、日本及澳大利亞等國政府先后發布了大數據研究和發展戰略規劃;中國發布了《促進大數據發展行動綱要》,致力于建設國家數據統一開放平臺,為大數據應用、產業和技術的發展提供行動指南。
大數據是一類呈現數據容量大、數據種類多、更新頻率快、準確性高、價值密度低等特征的數據集。它不僅包括互聯網上發布的信息,也包括各種聯網傳感設備得到的數據,比如個人健身運動軌跡、環境溫度、空氣濕度及空氣污染指數。美國互聯網數據中心(IDC)指出,互聯網上的數據每年將增長50%,每兩年便翻一番。數據的數量以指數形式遞增,而且數據的結構越來越趨于復雜化。
對大數據的處理不采用隨機抽樣調查的方法,而采用對所有數據進行分析處理的方法[2],因而可以發現更多的細節。同時,大數據分析人員通過適當地忽略微觀層面的精確度,可以獲得更好的洞察力和更大的商業利益。因此,大數據是能夠對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯性分析的新一代信息技術。由于數據超出了正常的處理范圍和大小,用戶不能采用傳統處理方法,需要探索新的數據交叉、方法交叉、知識交叉、領域交叉、學科交叉等的科學研究方法。比如,云計算技術可以中心化地、快速地處理海量數據,區塊鏈技術允許進行非中心化數據賬本管理,而數據安全技術可以保證大數據只被授權者使用。隨著這些技術的工具化,數據價值可以被快速合法地挖掘出來。
因為大數據可以用來實時、精確地洞察未知邏輯領域的動態變化,并快速重塑業務流程,進行組織和行業的新興數據管理,其在各行各業中正扮演越來越重要的角色,發展前景與價值創造潛力十分巨大,將給我們的社會與生活帶來巨大的影響[2,3]。因此,大數據是一種新的思維方式,它能夠幫助人們從信息社會的海量數據中發現新知識,創造新價值,提升新能力,形成新業態[4]。
- 數據庫應用實戰
- Python數據挖掘:入門、進階與實用案例分析
- 從0到1:數據分析師養成寶典
- Neural Network Programming with TensorFlow
- Enterprise Integration with WSO2 ESB
- OracleDBA實戰攻略:運維管理、診斷優化、高可用與最佳實踐
- 數據庫技術及應用教程
- SQL優化最佳實踐:構建高效率Oracle數據庫的方法與技巧
- MATLAB Graphics and Data Visualization Cookbook
- 新手學會計(2013-2014實戰升級版)
- 聯動Oracle:設計思想、架構實現與AWR報告
- 數據時代的品牌智造
- Applying Math with Python
- Working with OpenERP
- SQL面試寶典:圖解數據庫求職題