1.1.1 5V特征
一般而言,大數據具有5V特征,即大規模(Volume)、多樣性(Variety)、快速性(Velocity)、低價值密度(Value)和真實性(Veracity)。只有具備這些特征的數據才是大數據。
● 大規模。全球數據量在2010年正式進入ZB(Zetta Byte,澤字節)時代。隨著時間的推移,數據的規模將越來越大,增速也在逐漸提高。
● 多樣性。大數據的來源廣泛。例如,移動互聯網、物聯網、AR(Augmented Reality,增強現實)、VR(Virtual Reality,虛擬現實)、MR(Mixed Reality,混合現實)、生成式人工智能等都會產生大量數據。來源的多樣性導致大數據類型的多樣性。
● 快速性。由于大數據往往以數據流的形式快速、動態地產生,因此它具有很強的時效性。由于大數據自身的狀態與價值往往隨時間變化而變化,因此采集、分析和處理大數據時對時間要求比較高。
● 低價值密度。海量數據包含大量的不相關信息。隨著數據量的增加,大數據中有意義的信息并沒有成比例增加。大數據的價值與其真實性及處理時間相關,需要通過算法來完成大數據價值的“提純”。
● 真實性。真實性是指大數據的質量和保真性。大數據要求具有較高的信噪比。信噪比與數據源和數據類型無關。
推薦閱讀
- 數據庫原理及應用教程(第4版)(微課版)
- Unity 5.x Game AI Programming Cookbook
- 輕松學大數據挖掘:算法、場景與數據產品
- Spark大數據分析實戰
- 大數據:從概念到運營
- Sybase數據庫在UNIX、Windows上的實施和管理
- OracleDBA實戰攻略:運維管理、診斷優化、高可用與最佳實踐
- Power BI商業數據分析完全自學教程
- 深入淺出 Hyperscan:高性能正則表達式算法原理與設計
- R語言數據挖掘
- 一本書講透Elasticsearch:原理、進階與工程實踐
- Augmented Reality using Appcelerator Titanium Starter
- Gideros Mobile Game Development
- SQL Server 2008寶典(第2版)
- Oracle 內核技術揭密