- 供應鏈大數(shù)據(jù):理論、方法與應用
- 代四廣 曹玉姣等編著
- 755字
- 2024-04-15 11:46:53
1.1.1 大數(shù)據(jù)的定義
大數(shù)據(jù)(Big Data)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
關于大數(shù)據(jù)的定義,很多學者也給出了自己的觀點。在維克托·邁爾-舍恩伯格、肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中,大數(shù)據(jù)指不采用隨機分析法(抽樣調(diào)查),而是采用所有數(shù)據(jù)進行分析處理。大數(shù)據(jù)具有5V特點(IBM提出):Volume(數(shù)據(jù)量大)、Velocity(高速)、Variety(多樣)、Value(價值密度低)、Veracity(真實性)。
麥肯錫全球研究所給出的大數(shù)據(jù)定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。
結合眾多學者的觀點,可以發(fā)現(xiàn)大數(shù)據(jù)具有如下特征。
(1)數(shù)據(jù)量大(Volume)
第一個特征是數(shù)據(jù)量大。大數(shù)據(jù)的起始計量單位至少是PB(220GB)、EB(230GB)或ZB(240GB)。
(2)多樣(Variety)
第二個特征是數(shù)據(jù)類型繁多,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。
(3)價值密度低(Value)
第三個特征是數(shù)據(jù)價值密度相對較低,隨著物聯(lián)網(wǎng)的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”,是大數(shù)據(jù)時代需要解決的難題。
(4)高速(Velocity)
第四個特征是高速,即產(chǎn)生速度快,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
(5)真實性(Veracity)
第五個特征是數(shù)據(jù)的真實性。具體指數(shù)據(jù)的準確性和可信賴度,即數(shù)據(jù)的質量。
大數(shù)據(jù)的價值體現(xiàn)在以下幾個方面。
1)對大量消費者提供產(chǎn)品或服務的企業(yè)可以利用大數(shù)據(jù)進行精準營銷。
2)中小微企業(yè)可以利用大數(shù)據(jù)做服務轉型。
3)傳統(tǒng)企業(yè)充分利用大數(shù)據(jù)的價值實現(xiàn)轉型。
- 徐大同《西方政治思想史》筆記和典型題詳解
- 河北大學外國語學院211翻譯碩士英語[專業(yè)碩士]歷年考研真題及詳解
- 電化學基礎教程(第二版)
- 2020年全國法律碩士《397法碩聯(lián)考專業(yè)基礎(法學)》歷年考研真題與模擬試題詳解【15小時高清視頻】
- 財務共享服務
- Hadoop+Spark大數(shù)據(jù)技術(微課版)
- 公共關系學
- 韓德培《環(huán)境保護法教程》(第6版)筆記和課后習題詳解
- Spark SQL入門與數(shù)據(jù)分析實踐
- 2020年甘肅省選聘大學生村官考試《公共基礎知識》題庫【真題精選+章節(jié)題庫+模擬試題】
- 廣播電視新聞評論(高等院校影視傳媒書系)
- 張漢熙《高級英語(1)》(第3版)學習指南【詞匯短語+課文精解+全文翻譯+練習答案】
- 消費者行為學
- 觸摸感應技術及其應用:基于CapSense
- 高銘暄《刑法學》(第5版)【教材精講+考研真題解析】講義與視頻課程【48小時高清視頻】