官术网_书友最值得收藏!

“大數(shù)據(jù)”一詞最早出現(xiàn)于20世紀(jì)90年代,作為一個(gè)技術(shù)術(shù)語流行起來則始于2012年。時(shí)至今日,該詞仍沒有統(tǒng)一、明確的定義。人們通常從Volume、Velocity、Variety等角度定義大數(shù)據(jù),而最吸引大眾是Volume這一特點(diǎn)。根據(jù)維基百科的介紹,自20世紀(jì)80年代起,人均存儲信息的能力每40個(gè)月增加一倍;截至2012年,全世界每天產(chǎn)生2.5艾字節(jié)(1018字節(jié))的數(shù)據(jù)。IDC報(bào)告預(yù)測,全球數(shù)據(jù)將從2018年的33澤字節(jié)(1021字節(jié))增長到2025年的175澤字節(jié),其中近30%數(shù)據(jù)需要實(shí)時(shí)處理。世界正在以前所未有的速度數(shù)字化和創(chuàng)造數(shù)據(jù)。數(shù)字化時(shí)代到來了,數(shù)據(jù)時(shí)代到來了!

隨著數(shù)據(jù)時(shí)代的到來,越來越多的企業(yè)和政府開始重視大數(shù)據(jù)及相關(guān)技術(shù)。2012年,美國政府宣布投資2億美元拉動大數(shù)據(jù)相關(guān)產(chǎn)業(yè)發(fā)展,將“大數(shù)據(jù)戰(zhàn)略”上升為國家意志。美國政府將數(shù)據(jù)定義為“未來的新石油”,并表示一個(gè)國家擁有數(shù)據(jù)的規(guī)模、活性及解釋運(yùn)用的能力將成為綜合國力的重要組成部分。未來,對數(shù)據(jù)的占有和控制甚至將成為陸權(quán)、海權(quán)、空權(quán)之外的一種國家核心資產(chǎn)。隨后多國政府和很多組織提出了相應(yīng)的大數(shù)據(jù)戰(zhàn)略。

然而,任何行業(yè)的升級、發(fā)展都不是一蹴而就的。就目前來看,不同企業(yè)和組織處于四種不同的數(shù)字化和大數(shù)據(jù)階段:傳統(tǒng)階段、數(shù)字階段、數(shù)據(jù)階段和數(shù)學(xué)階段。傳統(tǒng)階段指企業(yè)仍然以傳統(tǒng)的方式使用軟件技術(shù),其主要特點(diǎn)是用軟件支撐企業(yè)內(nèi)部流程,通常是由企業(yè)內(nèi)部的IT部門主導(dǎo);數(shù)字階段指企業(yè)開始用全新的視角看待和使用軟件,軟件成為公司主營業(yè)務(wù)的重要組成部分或者主要組成部分;數(shù)據(jù)階段指企業(yè)通過全業(yè)務(wù)的數(shù)字化,積累大量數(shù)據(jù),再通過數(shù)據(jù)分析,從數(shù)據(jù)中獲取洞見,反過來促進(jìn)業(yè)務(wù)健康發(fā)展;數(shù)學(xué)階段是指自動化、智能化達(dá)到了高階階段,通過算法和模型的自動優(yōu)化為公司提供動力,數(shù)學(xué)算法和模型成為公司發(fā)展的核心引擎。目前來看,雖然大家已經(jīng)對“大數(shù)據(jù)”一詞耳熟能詳,但大多數(shù)企業(yè)和組織仍然處于傳統(tǒng)階段或者數(shù)字階段早期。造成這一現(xiàn)象的主要原因之一是人才匱乏。根據(jù)中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會統(tǒng)計(jì),未來我國基礎(chǔ)性數(shù)據(jù)分析人才缺口將達(dá)到1400萬,而大數(shù)據(jù)專業(yè)技術(shù)人才缺口將達(dá)數(shù)百萬。優(yōu)秀的專業(yè)書籍對培育人才、緩解這一缺口大有裨益。

目前,市面上的大多數(shù)關(guān)于大數(shù)據(jù)的書籍要么側(cè)重于大數(shù)據(jù)思維,要么側(cè)重于某種或者某幾種具體的大數(shù)據(jù)技術(shù)。與這些大數(shù)據(jù)書籍不同,本書立意新穎,涵蓋范圍很廣,從多個(gè)角度對大數(shù)據(jù)戰(zhàn)略到技術(shù)進(jìn)行系統(tǒng)性介紹。本書橫向從商業(yè)角度介紹了大數(shù)據(jù)、云計(jì)算和人工智能的關(guān)系,站在高階數(shù)字化戰(zhàn)略的高度解讀大數(shù)據(jù);縱向從數(shù)據(jù)處理背后的技術(shù)推動力的角度,闡述了大數(shù)據(jù)發(fā)展的歷程及未來趨勢;從技術(shù)實(shí)戰(zhàn)角度則詳細(xì)介紹了如何使用Greenplum大數(shù)據(jù)和機(jī)器學(xué)習(xí)平臺實(shí)現(xiàn)大數(shù)據(jù)戰(zhàn)略。

Greenplum是先進(jìn)的開源分布式數(shù)據(jù)庫之一,創(chuàng)建于2003年,2010年被EMC公司收購。它因出色的技術(shù)能力、易用性和豐富的企業(yè)級特性受到大量用戶的歡迎,被廣泛應(yīng)用于金融、保險(xiǎn)、證券、通信、航空、物流、零售、媒體、醫(yī)療、制造、能源等行業(yè),在國內(nèi)外有一大批擁躉者。2015年開源后更是發(fā)展迅速,目前在全球擁有大量的開源用戶。騰訊云等主流的云廠商都將其列為重要的大數(shù)據(jù)存儲、處理和分析服務(wù)之一。

本書作者均為Greenplum內(nèi)核開發(fā)團(tuán)隊(duì)核心成員,在大數(shù)據(jù)和機(jī)器學(xué)習(xí)行業(yè)具有豐富的經(jīng)驗(yàn),全球視野和技術(shù)前瞻性都毋庸置疑。我也有幸和作者團(tuán)隊(duì)多次深度合作,相信他們精心打造的這本書可以給讀者全新的啟發(fā),幫助大家用正確的理念和方法論來迎接大數(shù)據(jù)和人工智能時(shí)代的挑戰(zhàn)與機(jī)遇。

祝各位閱讀愉快!

王龍

騰訊云副總裁

2019年3月

主站蜘蛛池模板: 阿鲁科尔沁旗| 静宁县| 格尔木市| 揭阳市| 江津市| 滕州市| 宁南县| 石泉县| 苗栗县| 兴义市| 察隅县| 青浦区| 江阴市| 曲沃县| 赣州市| 杭锦后旗| 洞头县| 建瓯市| 青州市| 密山市| 都昌县| 垦利县| 四子王旗| 灵台县| 丹寨县| 永城市| 太湖县| 尼勒克县| 武城县| 于田县| 兴城市| 尼玛县| 四川省| 苏尼特左旗| 全州县| 巨野县| 阳江市| 马关县| 恩施市| 旌德县| 婺源县|