官术网_书友最值得收藏!

引言

數(shù)據(jù)不是什么新鮮玩意。早在幾個(gè)世紀(jì)之前,人們就開(kāi)始對(duì)數(shù)據(jù)進(jìn)行量化分析并為之繪制表格了。然而在為FlowingData(我創(chuàng)建的一個(gè)有關(guān)設(shè)計(jì)、可視化和統(tǒng)計(jì)的網(wǎng)站)寫(xiě)作時(shí),我發(fā)覺(jué)這一領(lǐng)域在過(guò)去數(shù)年間出現(xiàn)了爆炸式的發(fā)展,而且未來(lái)還會(huì)更加蓬勃。科技的進(jìn)步使得收集和存儲(chǔ)數(shù)據(jù)變得輕而易舉,而互聯(lián)網(wǎng)則讓我們擺脫了時(shí)間和空間的束縛。如果運(yùn)用得當(dāng),這種數(shù)據(jù)的“財(cái)富”能夠提供豐富的信息,幫助人們更明智地制定決策、更清楚地傳達(dá)理念,而且能讓我們以更為客觀的角度去審視自己對(duì)世界和自身的看法。

隨著2009年年中Data.gov網(wǎng)站的上線,美國(guó)政府?dāng)?shù)據(jù)公開(kāi)化進(jìn)程發(fā)生了一次重大轉(zhuǎn)變。這是一套綜合的數(shù)據(jù)目錄系統(tǒng),由各級(jí)聯(lián)邦政府機(jī)構(gòu)提供,表現(xiàn)出各組織及官方的透明度和責(zé)任感。比如說(shuō),國(guó)民有權(quán)利了解政府把稅收收入都花在了哪里,而在此之前美國(guó)政府給人的感覺(jué)就像一個(gè)黑箱。Data.gov上的很多數(shù)據(jù)其實(shí)在許多網(wǎng)站中都能找到,但現(xiàn)在它們都被會(huì)聚在一起,而且有著統(tǒng)一的格式,更加便于人們進(jìn)行分析和可視化。除了Data.gov之外,聯(lián)合國(guó)也有類(lèi)似的網(wǎng)站UNdata,英國(guó)很快也發(fā)布了Data.gov.uk,而像紐約、舊金山和倫敦等全球許多城市也都參與到了數(shù)據(jù)公開(kāi)這一潮流中來(lái)。

如今的網(wǎng)站也變得越來(lái)越開(kāi)放,有數(shù)千個(gè)API(應(yīng)用編程接口)在鼓勵(lì)和“慫恿”著開(kāi)發(fā)人員去調(diào)用網(wǎng)站已有的數(shù)據(jù)做各種事情。比如Twitter和Flickr就提供了覆蓋面極廣的API,開(kāi)發(fā)人員可以自由定制與網(wǎng)站本身完全不同、五花八門(mén)的用戶(hù)界面。API編目網(wǎng)站ProgrammableWeb目前已收錄超過(guò)2000個(gè)API截至2012年5月底,該網(wǎng)站已收錄6100多個(gè)API。——譯者注(如無(wú)特殊說(shuō)明,下文中所有腳注均為譯者注)。諸如Infochimps和Factual這樣的應(yīng)用最近也大量涌現(xiàn)出來(lái),它們存在的目的就是向人們提供結(jié)構(gòu)化的數(shù)據(jù)。

在個(gè)人層面,我們可以在Facebook上結(jié)交朋友,在Foursquare上分享所在的位置,或者在Twitter上發(fā)布自己的最新動(dòng)態(tài),這所有的一切都只需要點(diǎn)擊幾次鼠標(biāo)或者敲擊幾下鍵盤(pán)就能實(shí)現(xiàn)。一些針對(duì)性更強(qiáng)的應(yīng)用則方便我們記錄品嘗過(guò)什么美食、體重幾何、情緒高低等林林總總的事情。幾乎可以這樣說(shuō),只要你想對(duì)自己的某個(gè)方面進(jìn)行追蹤,就會(huì)有這樣一款應(yīng)用來(lái)幫助你實(shí)現(xiàn)愿望。

數(shù)據(jù)就靜靜地待在我們生活的每一個(gè)角落。園子里已經(jīng)果實(shí)累累,正等待著我們?nèi)ゲ烧?duì)大多數(shù)人來(lái)說(shuō),真正有意思的并不是數(shù)據(jù)本身,而是數(shù)據(jù)背后蘊(yùn)涵的信息。人們都希望知道他們的數(shù)據(jù)有何意義,而如果你能幫助他們,那么你就會(huì)大受歡迎。難怪Google首席經(jīng)濟(jì)學(xué)家Hal Varian會(huì)說(shuō)統(tǒng)計(jì)學(xué)家將是未來(lái)十年內(nèi)最迷人的職業(yè),而這絕不僅僅是因?yàn)榻y(tǒng)計(jì)學(xué)家長(zhǎng)得好看(盡管以極客們的別樣眼光來(lái)看,我們確實(shí)長(zhǎng)得讓人賞心悅目)。

可視化

要想探索和理解那些大型的數(shù)據(jù)集,可視化是最有效的途徑之一。把數(shù)字置于視覺(jué)空間中,我們的大腦或者讀者的大腦就會(huì)更容易發(fā)現(xiàn)其中潛藏的模式。人類(lèi)對(duì)圖形的理解能力確實(shí)很強(qiáng),往往能夠從中發(fā)現(xiàn)一些通過(guò)常規(guī)統(tǒng)計(jì)方法很難挖掘到的信息。

John Tukey是我最喜愛(ài)的統(tǒng)計(jì)學(xué)家,也是探索性數(shù)據(jù)分析理論(Exploratory Data Analysis)的締造者。他精通各種統(tǒng)計(jì)方法和工具,而且深信圖形技術(shù)在其中亦占有一席之地。他堅(jiān)信,圖形的呈現(xiàn)方式會(huì)讓人們得到許多出乎意料的結(jié)果。只需對(duì)數(shù)據(jù)進(jìn)行可視化,我們就能從中發(fā)現(xiàn)大量信息,而且很多情況下這也是我們制定明智決策或描述復(fù)雜事件所需要的唯一手段。

比如說(shuō),在2009年美國(guó)的失業(yè)率遭遇了一次大幅增長(zhǎng)。2007年的全美平均失業(yè)率是4.6%,2008年上漲到了5.8%。而到了2009年9月,突然就攀升至9.8%。但是這些全國(guó)平均數(shù)字只揭示了事件的一部分,它們只是概括了整個(gè)國(guó)家的總體狀況。有哪些地區(qū)的失業(yè)率高于其他地區(qū)?又有哪些地區(qū)并未受到很大波及?我們無(wú)法從中獲得答案。

圖0-1用一系列美國(guó)地圖更為完整地說(shuō)明了情況,而且我們只需略掃一眼就能回答上面的問(wèn)題。顏色較深的縣失業(yè)率相對(duì)較高,而顏色較淺的縣失業(yè)率較低。在2009年的地圖上(圖0-2),我們可以看到美國(guó)西部和東部大多數(shù)地區(qū)的失業(yè)率都超過(guò)了10%,而中西部地區(qū)則未受到太大影響。

圖0-1 2004—2009年美國(guó)失業(yè)率分布圖

圖0-2 2009年失業(yè)率分布圖

如果手上只有單純的電子表格,要想找到其中蘊(yùn)涵的地區(qū)性或周期性的模式就會(huì)很花時(shí)間,而只靠前面那些全國(guó)平均數(shù)字則完全不可能。而用地圖呈現(xiàn)之后,雖然增加了許多縣的數(shù)據(jù),但讀者的理解程度反而提高了。這些地圖有可能幫助當(dāng)局決定往哪些地區(qū)劃撥救濟(jì)金或提供其他形式的援助。

這個(gè)例子的絕妙之處在于,用于產(chǎn)生地圖的數(shù)據(jù)都是免費(fèi)的,由美國(guó)勞工統(tǒng)計(jì)局直接面向公眾開(kāi)放。盡管找到這些數(shù)據(jù)并不是那么輕而易舉,但它們確實(shí)就在某個(gè)地方聽(tīng)候我們的差遣,而且還有更多格式化的數(shù)據(jù)正等待著我們作更好的視覺(jué)處理。

比如說(shuō),《美國(guó)統(tǒng)計(jì)摘要》(The Statistical Abstract of the United States《美國(guó)統(tǒng)計(jì)摘要》由美國(guó)商務(wù)部人口普查局整理發(fā)布,是美國(guó)社會(huì)、政治和經(jīng)濟(jì)機(jī)構(gòu)的標(biāo)準(zhǔn)統(tǒng)計(jì)摘要。每一篇都提供文字說(shuō)明并在表格下方注明出處。自1878年首次出版以來(lái),每年出版一次。因經(jīng)費(fèi)問(wèn)題,在2012年出版最后一期(第131期)后該刊即停刊。——編者注就含有數(shù)百個(gè)數(shù)據(jù)表格(見(jiàn)圖0-3),但沒(méi)有任何圖表。這簡(jiǎn)直是天賜的良機(jī),我們可以在此基礎(chǔ)上進(jìn)行加工,展現(xiàn)整個(gè)國(guó)家的概貌。這個(gè)過(guò)程將會(huì)非常有趣。不久前我用圖形描繪了其中的部分表格(見(jiàn)圖0-4),很快就得到了美國(guó)近年來(lái)結(jié)婚率及離婚率、郵政資費(fèi)、用電量等信息的直觀變化情況。單純的表格形式很難閱讀,讀者只能得到一些零散的數(shù)值,而在圖表化視圖中,人們能夠輕易地發(fā)現(xiàn)變化的趨勢(shì)和模式,而且一眼就能作出比較。

圖0-3 美國(guó)統(tǒng)計(jì)摘要網(wǎng)站中的表格

圖0-4 美國(guó)統(tǒng)計(jì)摘要網(wǎng)站數(shù)據(jù)的圖表化視圖

類(lèi)似《紐約時(shí)報(bào)》、《華盛頓郵報(bào)》這樣的新聞機(jī)構(gòu)很擅長(zhǎng)讓數(shù)據(jù)變得栩栩如生、易于理解。它們對(duì)已有數(shù)據(jù)的利用也許是最充分的,因?yàn)榻?jīng)常會(huì)有相關(guān)主題的新聞故事見(jiàn)諸報(bào)端。有時(shí)故事中還會(huì)插入數(shù)據(jù)圖表以強(qiáng)調(diào)不同的觀點(diǎn),而有時(shí)只需要圖表就能講述整個(gè)故事。

在傳統(tǒng)媒體向網(wǎng)絡(luò)媒體轉(zhuǎn)型的過(guò)程中,圖形的應(yīng)用變得更加普及。如今的新聞機(jī)構(gòu)中都已設(shè)立了專(zhuān)門(mén)處理交互、圖表或地圖數(shù)據(jù)的各種部門(mén),比如《紐約時(shí)報(bào)》就專(zhuān)門(mén)為“計(jì)算機(jī)輔助報(bào)道”成立了一個(gè)新聞編輯部,旗下的記者都專(zhuān)注于用數(shù)據(jù)來(lái)報(bào)道新聞。而《紐約時(shí)報(bào)》的圖形編輯部處理起大量數(shù)據(jù)來(lái)也同樣得心應(yīng)手。

即使是在流行文化領(lǐng)域,可視化也占據(jù)了自己的一席之地。Stamen Design是一家以在線交互聞名的可視化公司,他們?cè)谶^(guò)去數(shù)年中一直都在對(duì)每年的MTV音樂(lè)錄影帶大獎(jiǎng)?lì)C獎(jiǎng)時(shí)期的Twitter狀態(tài)進(jìn)行追蹤。Stamen Design每一次的設(shè)計(jì)都與之前有所不同,但其核心一直保持不變:實(shí)時(shí)展現(xiàn)人們?cè)赥witter上的熱門(mén)話題。2009年Kanye West在Taylor Swift發(fā)表獲獎(jiǎng)感言時(shí)突然暴走Kanye West是美國(guó)黑人說(shuō)唱歌手,他在2009年的MTV音樂(lè)錄像帶頒獎(jiǎng)典禮上沖上臺(tái)打斷了當(dāng)屆最佳錄影帶大獎(jiǎng)得主Taylor的獲獎(jiǎng)感言,并聲稱(chēng)該獎(jiǎng)項(xiàng)應(yīng)屬于Beyonce。,我們通過(guò)Stamen Design的追蹤可以很容易地了解人們對(duì)他這種行徑的看法。

現(xiàn)在看來(lái),我們發(fā)現(xiàn)這個(gè)領(lǐng)域中也有偏重情緒而非分析的一面,對(duì)可視化的定義開(kāi)始變得模糊起來(lái)。在很長(zhǎng)一段時(shí)間內(nèi)人們都認(rèn)為,可視化就是關(guān)于量化后的事實(shí):我們把它們作為工具來(lái)識(shí)別事物發(fā)展的模式,轉(zhuǎn)而為分析研究提供幫助。但可視化并不僅僅與冰冷的事實(shí)有關(guān)。就如同Stamen Design的追蹤設(shè)計(jì)一樣,它有著很強(qiáng)的娛樂(lè)因素,為觀眾提供了另一種方式去關(guān)注頒獎(jiǎng)典禮,并在過(guò)程中與其他粉絲進(jìn)行互動(dòng)。Jonathan Harris的設(shè)計(jì)也是一個(gè)很好的例子。在他的We Feel Fine(我們感覺(jué)良好)作品見(jiàn)http://www.wefeelfine.org/。本書(shū)第1章有詳細(xì)介紹。Whale Hunt(捕鯨)作品見(jiàn)http://thewhalehunt.org/。設(shè)計(jì)師將在一次為期7天的捕鯨行動(dòng)中所拍攝的大量照片用可視化方式進(jìn)行排列。讀者可以選擇馬賽克、時(shí)間線或輪輻等瀏覽模式。等作品中,Harris并不是出于分析角度,而是圍繞著故事本身來(lái)進(jìn)行設(shè)計(jì),而且這些故事以人類(lèi)情感為中心,超越了單純的數(shù)字和分析行為。

圖表和圖形逐漸也超出了工具的范疇,發(fā)展為傳達(dá)理念的載體。GraphJam和Indexed之類(lèi)的網(wǎng)站這兩個(gè)網(wǎng)站可以被歸類(lèi)于“每日一漫畫(huà)”類(lèi)型的網(wǎng)站,只不過(guò)通常以簡(jiǎn)單的圖表形式來(lái)展現(xiàn)笑料。就喜歡運(yùn)用文氏圖 文氏圖(Venn diagram)是一種常見(jiàn)的用于表示集合或類(lèi)的粗略草圖。例如用圓圈A和圓圈B分別代表兩個(gè)集合,那么兩個(gè)圓圈交疊的區(qū)域就是集合A與集合B的交集。、餅圖等形式來(lái)戲謔流行歌曲及文化,用紅白黑等顏色組合來(lái)譏諷政客,或者譴責(zé)虐待動(dòng)物的行為。我自己也在這個(gè)方向上作了一些嘗試,在FlowingData上發(fā)表了系列漫畫(huà)Data Underload(數(shù)據(jù)低負(fù)荷)。在圖0-5中,我用圖形表現(xiàn)了美國(guó)電影協(xié)會(huì)評(píng)選出的一些經(jīng)典電影臺(tái)詞——非常無(wú)厘頭,但很有趣(至少對(duì)我來(lái)說(shuō)如此)。原圖內(nèi)并未給出相關(guān)臺(tái)詞的原文,考慮到國(guó)內(nèi)讀者可能不太熟悉出處,特在圖中添加。

圖0-5 圖表形式的電影臺(tái)詞

?訪問(wèn)http://datafl.ws/underload,欣賞FlowingData網(wǎng)站上的更多Data Underload漫畫(huà)。

那么,到底什么是可視化呢?每個(gè)人都有自己的答案。有些人認(rèn)為只有嚴(yán)格意義上的傳統(tǒng)圖形圖表才是可視化。而另一些人的觀點(diǎn)則更加開(kāi)放,他們認(rèn)為只要是在表現(xiàn)數(shù)據(jù),不管是數(shù)據(jù)藝術(shù)品還是微軟Excel表格,都可以算是可視化。我個(gè)人較為傾向于后者,但有時(shí)也發(fā)現(xiàn)自己站在前一陣營(yíng)。畢竟,這一問(wèn)題上孰是孰非并不是那么重要,只要能達(dá)成我們的目的就行了。

不管可視化是什么,我們繪制演示用的圖例也好、進(jìn)行數(shù)據(jù)分析也好、用數(shù)據(jù)來(lái)報(bào)道新聞也罷,最終其實(shí)都是在尋求真相。在某些時(shí)候,統(tǒng)計(jì)也會(huì)產(chǎn)生錯(cuò)誤的假象,但造成錯(cuò)覺(jué)的并不是數(shù)字本身,而是運(yùn)用數(shù)字的人。有時(shí)候這是有意為之,但更多情況下是疏忽大意所致。如果我們不知道如何創(chuàng)建合適的圖形,或者不知道如何客觀地看待數(shù)據(jù),那么就會(huì)產(chǎn)生謬誤。但只要我們掌握了適當(dāng)?shù)目梢暬记珊吞幚矸绞剑湍芨幼孕诺仃愂鲇^點(diǎn),并且對(duì)自己的發(fā)現(xiàn)感覺(jué)良好。

學(xué)習(xí)數(shù)據(jù)

我在大學(xué)一年級(jí)時(shí)開(kāi)始接觸統(tǒng)計(jì)學(xué),當(dāng)時(shí)它是一門(mén)必修的基礎(chǔ)課,但與我的專(zhuān)業(yè)電氣工程并沒(méi)有太大關(guān)系。講課的教授熱情極高,而且對(duì)這一領(lǐng)域樂(lè)此不疲。他上課時(shí)喜歡在教室的臺(tái)階上來(lái)回走動(dòng),身體語(yǔ)言極為豐富,而且不時(shí)鼓勵(lì)身邊的學(xué)生參與討論。我從未遇到過(guò)如此興奮的老師,而且毫無(wú)疑問(wèn),正是這種精神吸引我進(jìn)入了數(shù)據(jù)領(lǐng)域,最終在四年后考上了統(tǒng)計(jì)學(xué)的研究生。

在本科四年中,統(tǒng)計(jì)學(xué)就是數(shù)據(jù)分析、頻率分布和假設(shè)檢驗(yàn),而我一直樂(lè)在其中。我覺(jué)得觀察數(shù)據(jù)集,探索其中的趨勢(shì)、模式和關(guān)聯(lián)性很有意思。但開(kāi)始研究生學(xué)業(yè)之后,我的觀點(diǎn)發(fā)生了改變,事情變得更加有趣了。

統(tǒng)計(jì)學(xué)不再是假設(shè)檢驗(yàn)(結(jié)果表明,在許多情況下它并無(wú)太大作用)以及尋找模式了。哦,不,我收回這句話。統(tǒng)計(jì)學(xué)仍然與這些有關(guān),但我對(duì)它產(chǎn)生了不一樣的感受。統(tǒng)計(jì)學(xué)其實(shí)是在用數(shù)據(jù)講故事。我們手頭的大堆數(shù)據(jù)反映了真實(shí)的世界,然后我們對(duì)它們進(jìn)行分析,得到的不只是數(shù)據(jù)的關(guān)聯(lián)性,我們還能了解到身邊正在發(fā)生什么。這些故事反過(guò)來(lái)可以幫助我們解決真實(shí)世界中存在的問(wèn)題,例如降低犯罪率、提高衛(wèi)生意識(shí)、改善高速上的交通狀況,或者只是增長(zhǎng)我們的見(jiàn)識(shí)。

很多人都未能找到數(shù)據(jù)與真實(shí)生活之間的聯(lián)系。我想這也是為什么當(dāng)我告訴人們我讀研是為了學(xué)統(tǒng)計(jì)學(xué)時(shí),大多數(shù)人都說(shuō)那是他們“上學(xué)時(shí)最痛恨的一門(mén)課”。我相信讀者們不會(huì)犯同樣的錯(cuò)誤,否則你就不會(huì)選擇讀這本書(shū)了,不是嗎?

運(yùn)用數(shù)據(jù)需要一些技能,如何才能掌握呢?你可以像我一樣去學(xué)校選擇正規(guī)的課程訓(xùn)練,但你也可以通過(guò)大量的實(shí)踐經(jīng)驗(yàn),自學(xué)成才。其實(shí)大多數(shù)研究生課程和自學(xué)也沒(méi)有多大區(qū)別。

在可視化和信息圖(infographics)方面也是如此。并不是只有專(zhuān)業(yè)圖形設(shè)計(jì)師才能創(chuàng)建優(yōu)秀的圖表,同樣,你也不需要拿到統(tǒng)計(jì)學(xué)的博士學(xué)位。你所需要的只是保持對(duì)學(xué)習(xí)的渴望,而且和生活中的所有事情一樣,你需要不斷練習(xí)才能變得更在行。

我制作的第一張數(shù)據(jù)圖大概是在小學(xué)四年級(jí),那是為了應(yīng)付一次課外科學(xué)研究。我和搭檔一直很想知道蝸牛在什么樣的平面上會(huì)爬得更快,于是把它們放在各種粗糙或光滑的物體表面上,并計(jì)時(shí)觀察它們爬過(guò)一段特定距離各需要多久。最后我拿到了蝸牛在不同表面上爬行的時(shí)間數(shù)據(jù),并據(jù)此制作了一張柱形圖。至于當(dāng)時(shí)是否知道應(yīng)該將它們按長(zhǎng)短進(jìn)行排序,我已經(jīng)記不太清了,但是和Excel軟件的辛苦糾纏倒是一直刻骨銘心。不過(guò)第二年當(dāng)我們研究赤擬谷盜赤擬谷盜(red flour beetle)是一種鞘翅目昆蟲(chóng),對(duì)農(nóng)作物危害極大。最喜歡吃哪種谷制品時(shí),作圖就是小菜一碟了。當(dāng)你理順某款軟件的基本功能和操作方式之后,剩下的幾乎都輕而易舉。這個(gè)例子完美地說(shuō)明了什么叫做從經(jīng)驗(yàn)中學(xué)習(xí)。噢,順便提一句,如果你還在琢磨前面的問(wèn)題,答案是蝸牛在玻璃上爬得最快,而赤擬谷盜最喜歡吃葡萄果仁麥片(Grape Nut)。

從本質(zhì)上來(lái)說(shuō),學(xué)習(xí)任何軟件或編程語(yǔ)言的過(guò)程幾乎都是一樣的。如果你一行代碼都沒(méi)寫(xiě)過(guò),那么R(許多統(tǒng)計(jì)學(xué)家都采用的一種計(jì)算環(huán)境)必然會(huì)讓你望而生畏,而一旦你跟著完成了幾個(gè)范例之后,就會(huì)很快找到竅門(mén)。這本書(shū)能夠幫助你做到這些。

之所以這樣說(shuō),是因?yàn)槲冶救司褪沁@樣學(xué)習(xí)的。我還記得自己第一次深入接觸可視化的設(shè)計(jì)層面時(shí)的情形。那還是我讀研究生的第二年,好消息從天而降,我得知自己獲得了《紐約時(shí)報(bào)》圖形編輯的實(shí)習(xí)機(jī)會(huì)。在那一刻之前,圖表對(duì)我而言只是一種分析工具而已(比如小學(xué)課外活動(dòng)時(shí)作的柱形圖),就算其中含有一些美學(xué)和設(shè)計(jì)因素,比重也少得可憐。而將數(shù)據(jù)用于新聞報(bào)道,這對(duì)我來(lái)說(shuō)更是無(wú)從入手。

所以為了作準(zhǔn)備,我閱讀了手邊能找到的所有設(shè)計(jì)書(shū)籍,以及一本Adobe Illustrator的使用指南,因?yàn)槲抑馈都~約時(shí)報(bào)》圖形編輯部用的就是這款軟件。不過(guò)還沒(méi)等我真正上手就已經(jīng)開(kāi)始繪制工作了。當(dāng)你被迫邊學(xué)邊干的時(shí)候,就不得不盡快掌握那些必需的知識(shí),而當(dāng)你開(kāi)始處理更多數(shù)據(jù)、設(shè)計(jì)更多圖表時(shí),你的技能也會(huì)隨之突飛猛進(jìn)。

如何閱讀本書(shū)

本書(shū)以實(shí)例講解為主,目的是讓大家熟悉制圖所需的每一個(gè)步驟,掌握每一項(xiàng)技能。你可以從頭開(kāi)始完整地讀一遍,不過(guò)如果你已經(jīng)有想法在醞釀了,也可以只挑選最感興趣的幾章來(lái)讀。所有的章節(jié)都經(jīng)過(guò)了精心的組織,案例是相互獨(dú)立的。如果讀者對(duì)數(shù)據(jù)領(lǐng)域還比較陌生,那么閱讀最開(kāi)始的幾章應(yīng)該會(huì)很有幫助。它們介紹了處理數(shù)據(jù)的方法、需要關(guān)注的重點(diǎn)以及各種可用的工具,便于讀者了解如何獲得數(shù)據(jù),如何規(guī)范格式并為可視化作準(zhǔn)備。之后的幾章會(huì)根據(jù)不同的數(shù)據(jù)類(lèi)型和側(cè)重面分別介紹各種可視化技巧。請(qǐng)記住,永遠(yuǎn)都要讓數(shù)據(jù)說(shuō)話。

不管你選擇何種閱讀方式,我都強(qiáng)烈建議你在閱讀時(shí)打開(kāi)電腦,和我一起逐步完成每一個(gè)范例,并且瀏覽在注釋和參考中提到的各種資源。你也可以在www.wiley.com/visualizethishttp://book.flowingdata.com亦可從圖靈社區(qū)(www. ituring.com.cn)本書(shū)相關(guān)頁(yè)面下載。——編者注上下載到所有的代碼、數(shù)據(jù)文件和可交互演示。

為了表述得更清楚一些,圖0-6給出了一張流程圖,便于讀者找到需要的章節(jié)。祝大家閱讀開(kāi)心!

圖0-6 從何處開(kāi)始閱讀

主站蜘蛛池模板: 德保县| 桃江县| 游戏| 红桥区| 双鸭山市| 都昌县| 清远市| 稻城县| 龙里县| 临洮县| 芦溪县| 新野县| 贺州市| 延津县| 镇平县| 冀州市| 五家渠市| 乡宁县| 兴山县| 余庆县| 增城市| 滨州市| 华宁县| 基隆市| 淮北市| 高陵县| 九江市| 富蕴县| 和龙市| 乡宁县| 沁阳市| 峨边| 宿松县| 磐安县| 大宁县| 青河县| 济南市| 肃南| 望城县| 布拖县| 平舆县|