- 大數(shù)據(jù)測試技術(shù):數(shù)據(jù)采集、分析與測試實(shí)踐(在線實(shí)驗(yàn)+在線自測)
- 劉攀
- 829字
- 2021-01-08 20:49:03
1.1 規(guī)律是否存在
今天人們正面臨著急速的數(shù)據(jù)膨脹,2003年人類創(chuàng)造的數(shù)據(jù)還僅有1018個字節(jié),到2012年,數(shù)據(jù)已多達(dá)1021個字節(jié),2015年的全球數(shù)據(jù)是2012年數(shù)據(jù)的8倍,而預(yù)計到2020年,全球數(shù)據(jù)將達(dá)到44ZB個字節(jié)(1ZB=10萬億億字節(jié))。事實(shí)上,大數(shù)據(jù)時代已經(jīng)來臨,基于大數(shù)據(jù)分析的各種應(yīng)用正改變著人們的社會、生活和工作,也為企業(yè)帶來了新的商業(yè)發(fā)展機(jī)遇。例如2012年12月12日,淘寶網(wǎng)推出了“時光機(jī)”,根據(jù)淘寶買家?guī)啄陙淼纳唐焚徺I記錄、瀏覽點(diǎn)擊次數(shù)、收貨地址等數(shù)據(jù)編輯制作了“個人網(wǎng)購日志”。該日志就是基于對4.7億淘寶注冊用戶網(wǎng)購數(shù)據(jù)的分析實(shí)現(xiàn)的,是一個經(jīng)典的大數(shù)據(jù)應(yīng)用。
目前,越來越多的公司將數(shù)據(jù)當(dāng)作一種重要的戰(zhàn)略資源,進(jìn)行數(shù)據(jù)儲備和數(shù)據(jù)分析。與以往不同,在大數(shù)據(jù)時代,人們對數(shù)據(jù)的認(rèn)識和處理方式發(fā)生了新的轉(zhuǎn)變。過去,人們將數(shù)據(jù)看作是靜止的、陳舊的,數(shù)據(jù)之間是無關(guān)聯(lián)的,對數(shù)據(jù)的處理僅限于簡單的查詢和分類統(tǒng)計,并以此得出一些人們自認(rèn)為存在的規(guī)律。然而,事實(shí)上,當(dāng)人們對海量數(shù)據(jù)進(jìn)行分析之后,往往會發(fā)現(xiàn)某些規(guī)律根本不存在。
例如對一個物流倉庫數(shù)據(jù)進(jìn)行收集,希望發(fā)現(xiàn)并預(yù)測倉庫中的哪些商品會延期交貨,在開始階段收集到的需要延期交貨的數(shù)據(jù)如表1.1所示。
根據(jù)以往的經(jīng)驗(yàn),人們通常認(rèn)為庫存為零,或者庫存較少,但未來預(yù)期銷售較多,而運(yùn)輸數(shù)目又少的產(chǎn)品極可能出現(xiàn)延期交付現(xiàn)象。而且表1.1中的數(shù)據(jù)也恰恰符合這種認(rèn)識。然而,當(dāng)獲得了10萬條庫存記錄后,會發(fā)現(xiàn)其中許多庫存數(shù)量大的商品也會延期交付。表1.2顯示了部分庫存量較大且會產(chǎn)生延期交付的產(chǎn)品數(shù)據(jù)。
表1.1 開始階段收集到的需要延期交貨的數(shù)據(jù)

表1.2 部分高庫存且會產(chǎn)生延期交付的產(chǎn)品數(shù)據(jù)

另外,通過對不需要延期交貨的數(shù)據(jù)進(jìn)行統(tǒng)計,還會發(fā)現(xiàn)大量庫存少的產(chǎn)品不會延期交付,如表1.3所示。
表1.3 庫存少但不需要延期交付的產(chǎn)品數(shù)據(jù)

過去,人們形成的“經(jīng)驗(yàn)”往往是基于非大規(guī)模數(shù)據(jù)的總結(jié),而當(dāng)數(shù)據(jù)規(guī)模達(dá)到一定數(shù)量時,原來的“經(jīng)驗(yàn)”就變得不一定準(zhǔn)確。比如基于大數(shù)據(jù)分析之后,Alpha Go曾下出了人類長期以來認(rèn)為是虧損的棋路。
- 計算機(jī)組成原理與接口技術(shù):基于MIPS架構(gòu)實(shí)驗(yàn)教程(第2版)
- 企業(yè)數(shù)字化創(chuàng)新引擎:企業(yè)級PaaS平臺HZERO
- Access 2016數(shù)據(jù)庫教程(微課版·第2版)
- 數(shù)據(jù)之巔:數(shù)據(jù)的本質(zhì)與未來
- App+軟件+游戲+網(wǎng)站界面設(shè)計教程
- Learning Spring Boot
- 文本挖掘:基于R語言的整潔工具
- 業(yè)務(wù)數(shù)據(jù)分析:五招破解業(yè)務(wù)難題
- MySQL基礎(chǔ)教程
- 達(dá)夢數(shù)據(jù)庫性能優(yōu)化
- Python金融實(shí)戰(zhàn)
- 云數(shù)據(jù)中心網(wǎng)絡(luò)與SDN:技術(shù)架構(gòu)與實(shí)現(xiàn)
- 數(shù)據(jù)科學(xué)實(shí)戰(zhàn)指南
- Access數(shù)據(jù)庫開發(fā)從入門到精通
- Oracle 11g+ASP.NET數(shù)據(jù)庫系統(tǒng)開發(fā)案例教程