官术网_书友最值得收藏!

1.1.1 大數(shù)據(jù)的定義

大數(shù)據(jù)(Big Data)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。

關于大數(shù)據(jù)的定義,很多學者也給出了自己的觀點。在維克托·邁爾-舍恩伯格、肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中,大數(shù)據(jù)指不采用隨機分析法(抽樣調(diào)查),而是采用所有數(shù)據(jù)進行分析處理。大數(shù)據(jù)具有5V特點(IBM提出):Volume(數(shù)據(jù)量大)、Velocity(高速)、Variety(多樣)、Value(價值密度低)、Veracity(真實性)。

麥肯錫全球研究所給出的大數(shù)據(jù)定義是:一種規(guī)模大到在獲取、存儲、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉、多樣的數(shù)據(jù)類型和價值密度低四大特征。

結合眾多學者的觀點,可以發(fā)現(xiàn)大數(shù)據(jù)具有如下特征。

(1)數(shù)據(jù)量大(Volume)

第一個特征是數(shù)據(jù)量大。大數(shù)據(jù)的起始計量單位至少是PB(220GB)、EB(230GB)或ZB(240GB)。

(2)多樣(Variety)

第二個特征是數(shù)據(jù)類型繁多,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。

(3)價值密度低(Value)

第三個特征是數(shù)據(jù)價值密度相對較低,隨著物聯(lián)網(wǎng)的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”,是大數(shù)據(jù)時代需要解決的難題。

(4)高速(Velocity)

第四個特征是高速,即產(chǎn)生速度快,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。

(5)真實性(Veracity)

第五個特征是數(shù)據(jù)的真實性。具體指數(shù)據(jù)的準確性和可信賴度,即數(shù)據(jù)的質量。

大數(shù)據(jù)的價值體現(xiàn)在以下幾個方面。

1)對大量消費者提供產(chǎn)品或服務的企業(yè)可以利用大數(shù)據(jù)進行精準營銷。

2)中小微企業(yè)可以利用大數(shù)據(jù)做服務轉型。

3)傳統(tǒng)企業(yè)充分利用大數(shù)據(jù)的價值實現(xiàn)轉型。

主站蜘蛛池模板: 广河县| 来安县| 太仆寺旗| 长宁县| 乌鲁木齐市| 上饶市| 铁力市| 昌乐县| 哈密市| 临湘市| 惠水县| 蕉岭县| 南漳县| 固阳县| 阿克苏市| 高密市| 塔河县| 和田县| 乌海市| 新龙县| 左云县| 金门县| 名山县| 庆城县| 攀枝花市| 克什克腾旗| 蒙阴县| 寿光市| 宁明县| 禄丰县| 昌吉市| 衡阳县| 梁山县| 喀喇沁旗| 屏东市| 梓潼县| 尼玛县| 策勒县| 江油市| 木里| 新郑市|