- Greenplum:從大數(shù)據(jù)戰(zhàn)略到實(shí)現(xiàn)
- 馮雷
- 1413字
- 2019-10-10 18:57:06
序
“大數(shù)據(jù)”一詞最早出現(xiàn)于20世紀(jì)90年代,作為一個(gè)技術(shù)術(shù)語流行起來則始于2012年。時(shí)至今日,該詞仍沒有統(tǒng)一、明確的定義。人們通常從Volume、Velocity、Variety等角度定義大數(shù)據(jù),而最吸引大眾是Volume這一特點(diǎn)。根據(jù)維基百科的介紹,自20世紀(jì)80年代起,人均存儲信息的能力每40個(gè)月增加一倍;截至2012年,全世界每天產(chǎn)生2.5艾字節(jié)(1018字節(jié))的數(shù)據(jù)。IDC報(bào)告預(yù)測,全球數(shù)據(jù)將從2018年的33澤字節(jié)(1021字節(jié))增長到2025年的175澤字節(jié),其中近30%數(shù)據(jù)需要實(shí)時(shí)處理。世界正在以前所未有的速度數(shù)字化和創(chuàng)造數(shù)據(jù)。數(shù)字化時(shí)代到來了,數(shù)據(jù)時(shí)代到來了!
隨著數(shù)據(jù)時(shí)代的到來,越來越多的企業(yè)和政府開始重視大數(shù)據(jù)及相關(guān)技術(shù)。2012年,美國政府宣布投資2億美元拉動大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國家意志。美國政府將數(shù)據(jù)定義為“未來的新石油”,并表示一個(gè)國家擁有數(shù)據(jù)的規(guī)模、活性及解釋運(yùn)用的能力將成為綜合國力的重要組成部分。未來,對數(shù)據(jù)的占有和控制甚至將成為陸權(quán)、海權(quán)、空權(quán)之外的一種國家核心資產(chǎn)。隨后多國政府和很多組織提出了相應(yīng)的大數(shù)據(jù)戰(zhàn)略。
然而,任何行業(yè)的升級、發(fā)展都不是一蹴而就的。就目前來看,不同企業(yè)和組織處于四種不同的數(shù)字化和大數(shù)據(jù)階段:傳統(tǒng)階段、數(shù)字階段、數(shù)據(jù)階段和數(shù)學(xué)階段。傳統(tǒng)階段指企業(yè)仍然以傳統(tǒng)的方式使用軟件技術(shù),其主要特點(diǎn)是用軟件支撐企業(yè)內(nèi)部流程,通常是由企業(yè)內(nèi)部的IT部門主導(dǎo);數(shù)字階段指企業(yè)開始用全新的視角看待和使用軟件,軟件成為公司主營業(yè)務(wù)的重要組成部分或者主要組成部分;數(shù)據(jù)階段指企業(yè)通過全業(yè)務(wù)的數(shù)字化,積累大量數(shù)據(jù),再通過數(shù)據(jù)分析,從數(shù)據(jù)中獲取洞見,反過來促進(jìn)業(yè)務(wù)健康發(fā)展;數(shù)學(xué)階段是指自動化、智能化達(dá)到了高階階段,通過算法和模型的自動優(yōu)化為公司提供動力,數(shù)學(xué)算法和模型成為公司發(fā)展的核心引擎。目前來看,雖然大家已經(jīng)對“大數(shù)據(jù)”一詞耳熟能詳,但大多數(shù)企業(yè)和組織仍然處于傳統(tǒng)階段或者數(shù)字階段早期。造成這一現(xiàn)象的主要原因之一是人才匱乏。根據(jù)中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會統(tǒng)計(jì),未來我國基礎(chǔ)性數(shù)據(jù)分析人才缺口將達(dá)到1400萬,而大數(shù)據(jù)專業(yè)技術(shù)人才缺口將達(dá)數(shù)百萬。優(yōu)秀的專業(yè)書籍對培育人才、緩解這一缺口大有裨益。
目前,市面上的大多數(shù)關(guān)于大數(shù)據(jù)的書籍要么側(cè)重于大數(shù)據(jù)思維,要么側(cè)重于某種或者某幾種具體的大數(shù)據(jù)技術(shù)。與這些大數(shù)據(jù)書籍不同,本書立意新穎,涵蓋范圍很廣,從多個(gè)角度對大數(shù)據(jù)戰(zhàn)略到技術(shù)進(jìn)行系統(tǒng)性介紹。本書橫向從商業(yè)角度介紹了大數(shù)據(jù)、云計(jì)算和人工智能的關(guān)系,站在高階數(shù)字化戰(zhàn)略的高度解讀大數(shù)據(jù);縱向從數(shù)據(jù)處理背后的技術(shù)推動力的角度,闡述了大數(shù)據(jù)發(fā)展的歷程及未來趨勢;從技術(shù)實(shí)戰(zhàn)角度則詳細(xì)介紹了如何使用Greenplum大數(shù)據(jù)和機(jī)器學(xué)習(xí)平臺實(shí)現(xiàn)大數(shù)據(jù)戰(zhàn)略。
Greenplum是先進(jìn)的開源分布式數(shù)據(jù)庫之一,創(chuàng)建于2003年,2010年被EMC公司收購。它因出色的技術(shù)能力、易用性和豐富的企業(yè)級特性受到大量用戶的歡迎,被廣泛應(yīng)用于金融、保險(xiǎn)、證券、通信、航空、物流、零售、媒體、醫(yī)療、制造、能源等行業(yè),在國內(nèi)外有一大批擁躉者。2015年開源后更是發(fā)展迅速,目前在全球擁有大量的開源用戶。騰訊云等主流的云廠商都將其列為重要的大數(shù)據(jù)存儲、處理和分析服務(wù)之一。
本書作者均為Greenplum內(nèi)核開發(fā)團(tuán)隊(duì)核心成員,在大數(shù)據(jù)和機(jī)器學(xué)習(xí)行業(yè)具有豐富的經(jīng)驗(yàn),全球視野和技術(shù)前瞻性都毋庸置疑。我也有幸和作者團(tuán)隊(duì)多次深度合作,相信他們精心打造的這本書可以給讀者全新的啟發(fā),幫助大家用正確的理念和方法論來迎接大數(shù)據(jù)和人工智能時(shí)代的挑戰(zhàn)與機(jī)遇。
祝各位閱讀愉快!
王龍
騰訊云副總裁
2019年3月
- 數(shù)據(jù)庫應(yīng)用實(shí)戰(zhàn)
- Access 2016數(shù)據(jù)庫教程(微課版·第2版)
- App+軟件+游戲+網(wǎng)站界面設(shè)計(jì)教程
- 新型數(shù)據(jù)庫系統(tǒng):原理、架構(gòu)與實(shí)踐
- 數(shù)據(jù)化網(wǎng)站運(yùn)營深度剖析
- Mockito Cookbook
- Dependency Injection with AngularJS
- Python金融實(shí)戰(zhàn)
- ZeroMQ
- HikariCP連接池實(shí)戰(zhàn)
- 探索新型智庫發(fā)展之路:藍(lán)迪國際智庫報(bào)告·2015(上冊)
- 大數(shù)據(jù)分析:R基礎(chǔ)及應(yīng)用
- 數(shù)據(jù)分析思維:產(chǎn)品經(jīng)理的成長筆記
- 大數(shù)據(jù)隱私保護(hù)技術(shù)與治理機(jī)制研究
- 一類智能優(yōu)化算法的改進(jìn)及應(yīng)用研究