- 數(shù)據(jù)可視化五部曲
- 王鑫
- 7539字
- 2021-10-29 23:49:51
1.1 讀圖時(shí)代呼喚信息可視化
大約從21世紀(jì)伊始,書本中冰冷的文字被配上熱鬧的插圖,讀書人重新回到了兒童時(shí)代的看圖識(shí)字。圖像取代文字成了“溝通之王”,現(xiàn)代人仿佛又過起了祖先象形指事的文化記錄生活。各種各樣的圖像如花海一樣淹沒了信息時(shí)代的人們,讀圖已經(jīng)成為風(fēng)尚,甚至成為日常生活中不可或缺的一部分。鋪天蓋地的圖像帶領(lǐng)人類進(jìn)入“讀圖時(shí)代”。然而,“讀圖時(shí)代”也會(huì)帶來種種負(fù)面影響,圖像淺顯易懂,使人們只能被動(dòng)接受,而不像面對(duì)文字時(shí)還須主動(dòng)思索。人們往往只注重圖像的視覺效果,而忽視了圖像背后的信息價(jià)值。于是,信息可視化孕育而生,通過圖表的可視化展現(xiàn),傳遞出數(shù)據(jù)所蘊(yùn)含的“信達(dá)雅”(數(shù)據(jù)可信、表達(dá)清晰、展現(xiàn)美觀),這項(xiàng)技術(shù)將為讀圖時(shí)代帶來新的活力。
1.1.1 讀圖時(shí)代的誕生與影響
“讀圖時(shí)代”是指隨著科學(xué)技術(shù)的發(fā)展和生活節(jié)奏的加快,現(xiàn)代人自愿或被迫進(jìn)入的一個(gè)時(shí)代。在這個(gè)時(shí)代里,文字已經(jīng)不能滿足人們對(duì)知識(shí)和信息的渴求,需要圖片不斷刺激我們的眼球,激發(fā)我們的求知欲,觸動(dòng)我們麻木的神經(jīng)。
讀圖時(shí)代最早在報(bào)紙、期刊等平面媒體上表現(xiàn)出了它的特征。19世紀(jì),由美國(guó)著名報(bào)人普利策和赫斯特發(fā)起的一輪報(bào)紙“黃色化傾向”競(jìng)爭(zhēng),可以看作讀圖時(shí)代在報(bào)紙上高潮運(yùn)動(dòng)的到來(見圖1.1),這次運(yùn)動(dòng)似乎顛覆了圖像在人們心中的美好形象。大幅煽動(dòng)性的彩色照片、絢麗刺眼的色彩、滑稽膚淺的內(nèi)容……都讓人們覺得圖像“爆炸”了,而文字從“王者”變成了“懦夫”。

圖1.1 諷刺普利策和赫斯特的漫畫
在我國(guó),第一個(gè)提出“讀圖時(shí)代”概念的是花城出版社編輯鐘潔玲。1988年,花城出版社出版《紅風(fēng)車經(jīng)典漫畫叢書》,以圖文并茂的形式,展現(xiàn)了當(dāng)時(shí)的風(fēng)云人物和思潮,如圖1.2所示。為宣傳此書,鐘潔玲提出“讀圖時(shí)代”這一概念。那時(shí)的“讀圖”,指的是讀者愛好閱讀以圖形或圖片為主的圖書資料。互聯(lián)網(wǎng)時(shí)代,圖片在原有基礎(chǔ)上,發(fā)生了很多變化。期刊、網(wǎng)絡(luò)平臺(tái)等“讀圖”載體多樣,藝術(shù)、漫畫等圖片類型也更豐富。當(dāng)下的“讀圖時(shí)代”,具備了特有的時(shí)代含義。

圖1.2 花城出版社出版的《紅風(fēng)車經(jīng)典漫畫叢書》
在現(xiàn)代社會(huì)中,圖片已經(jīng)成為人們獲取信息、了解世界的重要渠道。圖片以報(bào)紙、書籍、網(wǎng)絡(luò)等為載體進(jìn)行傳播,具有豐富的信息、生動(dòng)的畫面和直觀的視覺體驗(yàn)。如今,很多人已不再花大量時(shí)間進(jìn)行文字閱讀,而是習(xí)慣快速瀏覽圖片,并結(jié)合標(biāo)題對(duì)自己感興趣的內(nèi)容進(jìn)行閱讀。對(duì)于新聞圖片來說,我們經(jīng)常可以看到一張巨幅照片占據(jù)了幾乎整個(gè)報(bào)紙版面,優(yōu)秀的新聞圖片會(huì)以強(qiáng)烈的現(xiàn)場(chǎng)感、視覺沖擊力和極強(qiáng)的時(shí)效性來吸引讀者。網(wǎng)絡(luò)、電影、電視中的圖像就更多了,甚至廣告、漫畫、圖書、期刊等,可以說只要有人的地方,就會(huì)留下“讀圖時(shí)代”的痕跡,可以說圖片已經(jīng)以不可擋之勢(shì)充斥在我們周圍。
然而,也許你不禁要問,為什么我們會(huì)來到“讀圖時(shí)代”?
首先,科技的進(jìn)步、網(wǎng)絡(luò)的普及促進(jìn)了“讀圖時(shí)代”的到來(見圖1.3)。圖像采集、處理技術(shù)的進(jìn)步使平面媒體可以自由、準(zhǔn)確地使用圖像。清晰、流暢的圖像帶給受眾前所未有的美感,媒體認(rèn)識(shí)到了圖像對(duì)于受眾強(qiáng)大的吸引力,從而越來越廣泛地使用圖像。較之報(bào)紙、期刊等平面媒體,網(wǎng)絡(luò)的普及帶給閱讀者的是更加廣闊的信息空間和更加便利的接觸途徑。網(wǎng)絡(luò)上提供給人們的信息量大大超過了報(bào)紙、期刊所能提供的信息量,且價(jià)格更為低廉、用時(shí)更為節(jié)省、形式更為新穎、獲取更為便捷。網(wǎng)絡(luò)的普及給圖像的廣泛傳播提供了可能,可以說,網(wǎng)絡(luò)改變了圖像的命運(yùn),為圖像的迅速傳播提供了便利的途徑。

圖1.3 網(wǎng)絡(luò)改變了圖像的命運(yùn)(5G技術(shù)發(fā)展)
其次,圖像本身具有直觀、便捷、形象生動(dòng)的特點(diǎn),這也是促使“讀圖時(shí)代”到來的重要原因(見圖1.4)。圖像中包含了豐富的信息量,能夠引起人們無窮的聯(lián)想。比如,我們小時(shí)候參加看圖作文的比賽,面對(duì)圖像發(fā)揮想象力,這種作文形式利用的就是兒童喜歡看圖片的心理。一些探險(xiǎn)和科普文章,如果缺少圖片,就總會(huì)使人覺得缺少些什么。再比如,作者想傳達(dá)給讀者某種信息,但是用文字不能準(zhǔn)確地表達(dá)出來,這時(shí)一張圖片或許可以解決問題,這就是人們會(huì)對(duì)那些精心設(shè)計(jì)的公益廣告圖片感到嘆為觀止的原因。

圖1.4 圖像具有直觀、便捷、形象生動(dòng)的特點(diǎn)(人類月球探險(xiǎn))
再次,現(xiàn)代生活節(jié)奏的加快也使“讀圖”大行其道(見圖1.5)。生活節(jié)奏加快,社會(huì)競(jìng)爭(zhēng)激烈,奔波于快速轉(zhuǎn)變著的時(shí)間、地點(diǎn)中的人們希望用最少的時(shí)間獲得最大的信息量。而“閱讀圖像”能幫助人們盡量節(jié)省時(shí)間、避免大腦疲勞,于是時(shí)尚感十足的“快餐讀物”越來越受歡迎。都市快節(jié)奏的生活造成整個(gè)社會(huì)浮躁的心理,而人們浮躁、無聊的情緒使他們沉不下心去讀書,對(duì)文字產(chǎn)生了排斥感。或許某一文本內(nèi)容豐富、語言優(yōu)美、思想深刻、蘊(yùn)含哲理,但是人們沒有時(shí)間、沒有心情閱讀和欣賞,再好的書也只是一堆廢紙。人們需要的只是滿足他們獵奇心理、改變他們無聊心情的“故事”,能讓他們笑一下或者皺一下眉頭,這就夠了。

圖1.5 圖像符合當(dāng)今社會(huì)生活節(jié)奏的需求
最后,媒體、網(wǎng)絡(luò)刻意迎合讀者庸俗、獵奇的心理,使標(biāo)題夸大其詞,使信息充斥眼球,這也是產(chǎn)生“讀圖時(shí)代”不容忽視的原因(見圖1.6)。正如法國(guó)學(xué)者艾柯形容的,我們已被后現(xiàn)代的場(chǎng)景包圍,分不清什么是虛假什么是真實(shí)。電視、報(bào)紙和期刊批量化生產(chǎn)了大批明星,人們?cè)谶@些產(chǎn)品面前被擊潰,不管你接不接受,他們就像活人一樣,也像沒有生命的物體一樣,就在那兒,無法回避。所以雖然我們會(huì)對(duì)娛樂報(bào)道嗤之以鼻,但是當(dāng)我們看到這樣的標(biāo)題或圖片時(shí),還是會(huì)不自覺地打開閱讀。而且大量信息充斥媒體網(wǎng)絡(luò),讀者無法分辨哪些有價(jià)值哪些無價(jià)值,更何況讀者也懶得去分辨,于是讀者會(huì)對(duì)自己說:“看張圖吧,就什么都知道了。”
接下來我們看一下,“讀圖時(shí)代”的意義,以及它給我們的生活帶來的影響。
從媒介產(chǎn)生與發(fā)展的歷史脈絡(luò)來看,圖片的傳播方式經(jīng)歷了十分漫長(zhǎng)的歷史過程,而這期間圖片對(duì)我們的生活乃至社會(huì)的發(fā)展產(chǎn)生了重要的影響。從口語傳播擺脫了“與狼共舞”的野蠻狀態(tài),到文學(xué)傳播加速了文明發(fā)展與傳承,又到印刷傳播時(shí)代提高了媒介傳播效率,再到當(dāng)下電子傳播信息的多元化多層次擴(kuò)散。媒介方法的不斷變革,不但標(biāo)志著新的文化形態(tài)的漸成與轉(zhuǎn)變,同時(shí)也標(biāo)志著一種新型理念的逐漸拓展,更表明了人類思維方式的更新轉(zhuǎn)換。人類最早的“讀圖時(shí)代”是象形文字的使用,一個(gè)簡(jiǎn)約的圖形模擬表現(xiàn)物體本身的含義,質(zhì)樸、形象、一目了然。在相當(dāng)長(zhǎng)的時(shí)間里,圖片發(fā)揮了重要的作用,如圖1.7所示。

圖1.6 圖像迎合讀者庸俗、獵奇的心理

圖1.7 人類最早的“讀圖時(shí)代”
進(jìn)入現(xiàn)代之后,“讀圖”不再是從文字形體中攝取含義,而是自成一體,以大幅圖片的形式展現(xiàn)在受眾面前。報(bào)紙、期刊、電子媒體等媒介中圖片層出不窮,為受眾展示出了一系列圖景,如圖1.8所示。解讀圖片,深入挖掘,已經(jīng)成為一種風(fēng)尚,大眾習(xí)慣開始逐步向“讀圖時(shí)代”靠攏。加拿大傳播學(xué)家麥克盧漢曾說:“媒介是人的延伸。不同的傳播媒介也就是人的不同感官和器官向外部世界的延伸,這個(gè)過程不斷擴(kuò)大了人類征服大自然和改造世界的能力”。從這個(gè)角度看,圖片作為視覺的延伸,通過給人以視覺沖擊力,引發(fā)人內(nèi)部心靈的感受;通過多維度地傳播社會(huì)信息,從而達(dá)到圖片體驗(yàn)與精神體驗(yàn)的有機(jī)結(jié)合,眼球與心靈的相互融合。圖片以一種非語言符號(hào)的方式,在傳遞視覺信息的同時(shí),表現(xiàn)視覺文化;在生活節(jié)奏日益加快、知識(shí)碎片化的情況下,滿足了受眾的需求,豐富了實(shí)踐生活的方方面面,推進(jìn)著復(fù)雜的社會(huì)歷史發(fā)展。

圖1.8 現(xiàn)代的“讀圖時(shí)代”
正如前文所述,圖片具有生動(dòng)形象、信息量大的優(yōu)勢(shì),“讀圖時(shí)代”滿足了人們?cè)诳旃?jié)奏的生活中對(duì)于知識(shí)、新聞、故事、娛樂等信息的需求。圖像傳播滲透在社會(huì)的方方面面,對(duì)我們的實(shí)際生活具有非常重要的意義。例如,一份煩瑣的工作文件,如果加入一個(gè)樹狀圖,各項(xiàng)步驟就會(huì)立刻清晰地展現(xiàn)在我們眼前,可以縮短閱讀時(shí)間,提高工作效率,如圖1.9所示。
然而,“讀圖時(shí)代”也會(huì)帶來種種負(fù)面影響。圖像的優(yōu)點(diǎn)是形象生動(dòng)、信息量大,但這些優(yōu)點(diǎn)擴(kuò)大后恰恰是它的缺點(diǎn)。由于圖像的淺顯易懂,使人們只能被動(dòng)接受,而不像面對(duì)文字時(shí)還須主動(dòng)思索。文字與其說是表達(dá),不如說是一個(gè)人對(duì)自己的思考和閱讀的歸納;圖像雖然直觀,但人們面對(duì)圖像往往缺乏深入的思索和品味。曾有專家憂心忡忡地指出,如果人們把大量的時(shí)間消耗在讀圖上,很容易造成全民閱讀水平低下的情況。

圖1.9 樹狀圖——人力資源部年度工作報(bào)告
另外,圖像有很強(qiáng)的沖擊力,對(duì)人的感官有著強(qiáng)烈的刺激,大量的圖片沖擊會(huì)造成人的感官麻木。設(shè)想一下,當(dāng)讀者像翻書一樣翻閱成百上千張圖片時(shí),由于圖片數(shù)量過多,真正的優(yōu)質(zhì)圖片很容易被淹沒,難以被讀者發(fā)現(xiàn),就算發(fā)現(xiàn)了,由于已經(jīng)習(xí)慣讀者還會(huì)花時(shí)間做一些思索嗎?
最后,圖片充斥電視和網(wǎng)絡(luò),現(xiàn)代人為之耗費(fèi)了大量的時(shí)間和精力。我們的兒童是由電視“抱大”的,我們的青少年沉溺于網(wǎng)絡(luò)游戲和網(wǎng)絡(luò)聊天中不能自拔。算一算,假如每人每天平均坐在電視和網(wǎng)絡(luò)前2小時(shí),乘以365天,再乘以14.1億人,得數(shù)會(huì)是多少?而這些時(shí)間,原本是我們用來讀書、和朋友聊天、與家人做游戲、出去旅游、鍛煉身體的時(shí)間啊!而且一個(gè)人天天與電視和網(wǎng)絡(luò)為伴,恐怕會(huì)被冷冰冰的機(jī)器思維所主宰。這些年因?yàn)槌聊缬诰W(wǎng)絡(luò)中的色情、暴力、謊言而導(dǎo)致的悲劇還少嗎?
1.1.2 信息可視化孕育而生
在“讀圖時(shí)代”生活的我們,面對(duì)圖像的優(yōu)點(diǎn)和缺點(diǎn)應(yīng)該何去何從呢?如何在享受圖片帶來的視覺放松、感受圖片傳來的濃濃情意的同時(shí),去挖掘圖像背后的故事,理解圖像所蘊(yùn)含的深刻含義呢?于是信息可視化技術(shù)孕育而生,通過圖表的可視化展現(xiàn),傳遞出數(shù)據(jù)所蘊(yùn)含的“信達(dá)雅”(數(shù)據(jù)可信,表達(dá)清晰,展現(xiàn)美觀),這項(xiàng)技術(shù)將為讀圖時(shí)代帶來新的活力。
首先,我們來了解一下什么是可視化。“可視化”一詞源于英文“Visualization”,譯為“形象化”“成就展現(xiàn)”等。事實(shí)上,將任何抽象的事物、過程變成圖形圖像等形象化的表示都可以稱為可視化。用可視化的手段來呈現(xiàn)信息已不是一個(gè)新奇的現(xiàn)象。最初的“可視化”可以追溯到幾千年前,如古時(shí)洞穴里的繪畫,后來的地圖、科學(xué)圖畫和數(shù)據(jù)圖等。這些早期的可視化探索與運(yùn)用在一定程度上以平直的向前方式對(duì)計(jì)算機(jī)形象化產(chǎn)生了重要影響。而可視化研究是一個(gè)新興學(xué)科,它展現(xiàn)了一個(gè)迄今為止高度非結(jié)構(gòu)化的研究領(lǐng)域,如人機(jī)交互、平面設(shè)計(jì)、管理、建筑等。
當(dāng)我們理解了什么是可視化以后,信息可視化便不難懂了。確切地說,信息可視化是一個(gè)過程,它將數(shù)據(jù)、文字、圖像轉(zhuǎn)化為一種形象化的視覺表達(dá)形式,即通過特征性抽離、提煉、整合,將這些內(nèi)容轉(zhuǎn)化為人們需要的信息,進(jìn)而充分利用人們對(duì)可視模式快速識(shí)別的自然能力,以形象化的姿態(tài)呈現(xiàn)給讀者,如圖1.10所示。這個(gè)傳達(dá)過程也可以看成一個(gè)視覺化思考過程,它為閱讀者建立起整個(gè)知識(shí)的邏輯性,簡(jiǎn)化復(fù)雜文絡(luò),直接且有重點(diǎn)地帶領(lǐng)閱讀者思考,目的是利用圖形化的信息可視方法,用平易近人、易于理解的方式向受眾傳達(dá)一定的內(nèi)容信息,提高人們對(duì)抽象信息獲取的最大能力。
接下來,我們看一下在進(jìn)行信息可視化呈現(xiàn)的過程中,所需要遵循的信息可視化的設(shè)計(jì)要素。
(1)信息內(nèi)容充實(shí)、精簡(jiǎn)。原始數(shù)據(jù)的信息量大、資料繁多,假如直接將這些內(nèi)容鋪放給閱讀者,立刻會(huì)給閱讀者帶來視覺疲憊的感覺,在閱讀過程中會(huì)有許多讀者因失去耐心而停止接受信息。即使艱難地完成閱讀也會(huì)浪費(fèi)讀者大量的時(shí)間與精力,人類大腦在面對(duì)復(fù)雜信息的時(shí)候,會(huì)自動(dòng)提取它認(rèn)為有用的信息,但提取到的是否確實(shí)是重要信息是由每個(gè)人不同的認(rèn)知水平?jīng)Q定的。信息可視化就是要在設(shè)計(jì)的過程中提煉出重要內(nèi)容,使處于不同認(rèn)知水平的人們,可以用最短的時(shí)間獲取到重要信息。由此可見,信息可視化最重要的一個(gè)因素就是要用充實(shí)而又精簡(jiǎn)的內(nèi)容來甄別、篩選重要的信息,這個(gè)要素的宗旨就是言簡(jiǎn)意賅。這里我們舉一個(gè)例子,表1.1所示為我們從國(guó)家統(tǒng)計(jì)局官網(wǎng)獲取的我國(guó)不同地區(qū)城市的固定資產(chǎn)投資總額、地區(qū)生產(chǎn)總值、最終消費(fèi)支出、消費(fèi)者價(jià)格指數(shù)。

圖1.10 信息可視化設(shè)計(jì)(示意圖)
表1.1 我國(guó)不同地區(qū)的經(jīng)濟(jì)情況

續(xù)表

我們想通過這些數(shù)據(jù)找到哪個(gè)城市具有核心競(jìng)爭(zhēng)力,但由于數(shù)據(jù)過多,往往不能從數(shù)據(jù)中直接看到結(jié)果,于是我們通過可視化的方法化繁為簡(jiǎn),利用簡(jiǎn)單的氣泡圖來找到具有核心競(jìng)爭(zhēng)力的地區(qū),如圖1.11所示。在圖1.11中,我們以橫坐標(biāo)代表固定資產(chǎn)投資總額,縱坐標(biāo)代表地區(qū)生產(chǎn)總值,以氣泡的大小代表最終消費(fèi)支出。不難發(fā)現(xiàn),在這張圖中越靠右上角同時(shí)氣泡越大的數(shù)據(jù)點(diǎn),代表整個(gè)城市的競(jìng)爭(zhēng)力越強(qiáng)。于是我們可以輕松地找到,廣東、山東、江蘇幾個(gè)地區(qū)具有核心競(jìng)爭(zhēng)力,而安徽、四川等地區(qū)的整體實(shí)力則相對(duì)較弱。

圖1.11 我國(guó)不同地區(qū)的經(jīng)濟(jì)情況——信息可視化
(2)信息圖形美觀恰當(dāng)。美好的事物歷來是建立兩個(gè)陌生關(guān)系的第一通道,美的東西總是能夠吸引人們的目光。在對(duì)信息進(jìn)行視覺化的設(shè)計(jì)時(shí),美觀的圖形可以給人們帶來興趣,讓人們產(chǎn)生好奇心,拉近閱讀者與信息內(nèi)容的距離,使讀者在主觀上更愿意進(jìn)一步了解設(shè)計(jì)者想要傳遞的信息與內(nèi)容。這里我們舉一個(gè)例子,在2017年熱播的電視劇《人民的名義》中,幾個(gè)主要人物讓人印象深刻,如侯亮平、高育良、祁同偉、蔡成功、歐陽菁等人,我們現(xiàn)在想通過一定的可視化方法把電視劇中復(fù)雜的人物關(guān)系呈現(xiàn)出來。做社交網(wǎng)絡(luò)可視化分析,不得不提的是Gephi這個(gè)軟件,Gephi是一款開源免費(fèi)跨平臺(tái)基于JVM的復(fù)雜網(wǎng)絡(luò)分析軟件,主要用于各種網(wǎng)絡(luò)和復(fù)雜系統(tǒng),動(dòng)態(tài)和分層圖的交互可視化與探測(cè)開源工具。現(xiàn)在我們采用Gephi把電視劇中的人物關(guān)系呈現(xiàn)出來,如圖1.12所示。在圖中,我們以節(jié)點(diǎn)代表人物,以節(jié)點(diǎn)之間的連線代表人物之間的關(guān)系,同時(shí)在連線上端以文字方式標(biāo)識(shí)出人物之間的具體關(guān)系,用節(jié)點(diǎn)的顏色表示節(jié)點(diǎn)的中心度指標(biāo),即越具有復(fù)雜關(guān)系的人物越具有核心位置,從圖1.12中我們不難發(fā)現(xiàn),侯亮平、高育良、陳海、祁同偉等人是電視劇中的主要人物,而蔡成功、歐陽菁、季昌明、鐘小艾等人則是電視劇中的配角。通過這種方法呈現(xiàn),固然可以清晰簡(jiǎn)明地傳導(dǎo)出復(fù)雜網(wǎng)絡(luò)中的結(jié)構(gòu),但是并沒有實(shí)現(xiàn)可視化過程中要求的圖形美觀。

圖1.12 基于Gephi實(shí)現(xiàn)的社交網(wǎng)絡(luò)可視化
現(xiàn)在,我們采用另外一種方法,即采用Excel中的插件NodeXL來呈現(xiàn)電視劇中的復(fù)雜人物關(guān)系,如圖1.13所示。我們對(duì)比前后兩張社交網(wǎng)絡(luò)圖會(huì)發(fā)現(xiàn),通過NodeXL實(shí)現(xiàn)的社交網(wǎng)絡(luò)效果更加生動(dòng)有趣,它不僅表達(dá)出了人物間的關(guān)系,更重要的是每個(gè)節(jié)點(diǎn)不再是枯燥無味的氣泡,而是換成了人物的臉譜。同時(shí),當(dāng)我們用鼠標(biāo)單擊到某個(gè)關(guān)鍵人物時(shí),與該人物具有緊密關(guān)系的人物及其關(guān)系也會(huì)突出顯示。通過這個(gè)例子我們會(huì)發(fā)現(xiàn),可視化居然可以呈現(xiàn)得如此栩栩如生。
(3)信息視覺層次分明。建立分明的視覺層次可以分為兩個(gè)方面,一是要有符合人類視覺習(xí)慣的版式,比如從上到下或從左至右的視覺走向;二是將信息分類排序,建立一個(gè)清晰的路徑,讓閱讀者輕松地找到想要尋找的內(nèi)容,這類似導(dǎo)視的功能。這里我們來看一個(gè)例子,在2008年美國(guó)總統(tǒng)大選過程中,有兩位重要候選人——奧巴馬和麥凱恩,兩位重要人物分別是民主黨和共和黨的參選人,我們想通過可視化把民主黨對(duì)奧巴馬、共和黨對(duì)麥凱恩的支持情況呈現(xiàn)出來。我們用藍(lán)色代表民主黨,用紅色代表共和黨,可視化的結(jié)果顯示,紅色占據(jù)地圖的大部分面積,這意味著紅色代表的共和黨擁有多數(shù)選票。然而大家都知道,2008年的美國(guó)總統(tǒng)大選,奧巴馬最終獲勝,當(dāng)選美國(guó)總統(tǒng)。那可視化為什么得到了完全相反的結(jié)果呢?

圖1.13 基于NodeXL實(shí)現(xiàn)的社交網(wǎng)絡(luò)可視化
原因在于,地圖上色塊大小由地理面積決定,不能反映真實(shí)權(quán)重(選票)。類似地,跨國(guó)公司可能會(huì)利用這種手段夸大自己在國(guó)外的經(jīng)營(yíng)情況。一家只在某國(guó)幾個(gè)城市有業(yè)務(wù)的公司,可能會(huì)在報(bào)告財(cái)務(wù)指標(biāo)時(shí)將整個(gè)國(guó)家涂上顏色。我們重新繪制圖形,用地圖上的氣泡大小來反映人口數(shù)量,可以發(fā)現(xiàn)藍(lán)色氣泡逐漸占據(jù)主導(dǎo)。地廣人稀的地區(qū)不再呈現(xiàn)整片紅色,而是零星的小紅點(diǎn)。這時(shí)我們會(huì)發(fā)現(xiàn),民主黨人數(shù)遠(yuǎn)遠(yuǎn)超過共和黨人數(shù),可視化結(jié)果與事實(shí)相符。
(4)信息邏輯條理明確。在人類的認(rèn)知世界中,人們的視覺易與感知連續(xù)的內(nèi)容形成完整的知識(shí)樹,而對(duì)于碎片化的知識(shí)則相對(duì)較難。所以,信息可視化設(shè)計(jì)的成功,必須有清晰且連貫的邏輯布局。比如,當(dāng)你畫一個(gè)餅狀圖、堆疊柱形圖或堆疊面積圖時(shí),所有數(shù)字的總和加起來應(yīng)該是100。聽上去這種簡(jiǎn)單的錯(cuò)誤似乎根本沒必要指出,但讀者一定會(huì)感到驚訝,因?yàn)槿藗兘?jīng)常犯這樣的錯(cuò)誤。圖1.14是來自福克斯新聞的一張圖片,你能看出有什么問題嗎?這三個(gè)扇形的數(shù)字加起來不是100%而是193%。在該調(diào)查中,很可能是允許一人投多票的,因此餅狀圖很明顯不能體現(xiàn)這一數(shù)據(jù)的正確選擇。另外,如果讀者不讀這些數(shù)字,只是觀察餅狀圖的大小,就會(huì)有這樣一個(gè)印象:每位候選人得到的支持都是近三分之一,這又是一個(gè)錯(cuò)誤的結(jié)論。為了避免這樣的錯(cuò)誤,作者要仔細(xì)檢查圖中的數(shù)字并確保自己使用了標(biāo)準(zhǔn)的工具。標(biāo)準(zhǔn)的工具不會(huì)做出這樣的錯(cuò)誤餅狀圖。

圖1.14 福克斯新聞中錯(cuò)誤的統(tǒng)計(jì)圖表
(5)可視色彩鮮明合理。數(shù)據(jù)可視化是一個(gè)用各種視覺變量把數(shù)據(jù)進(jìn)行編碼、再現(xiàn)的過程,如把數(shù)據(jù)轉(zhuǎn)換成位置(散點(diǎn)圖)、長(zhǎng)度(柱形圖)、面積(比例面積圖)、顏色(熱力圖)等。其中,顏色是所有視覺變量中最富于變化的一種。在色彩學(xué)上計(jì)算出來的色彩數(shù)大約有750萬種,一般人可以分辨出3000~5000種顏色。色彩主要分為色相、純度和明度三大要素,如圖1.15所示。色相,即色調(diào),紅色、黃色、綠色、藍(lán)色、紫色是五大主色。純度,即飽和度,指色彩的純凈程度,純度越低越接近灰色。明度,即亮度,指色彩的敏感程度,明度越高越靠近白色。

圖1.15 色彩的分類(示意)
在可視化作品中,設(shè)計(jì)者往往會(huì)有一定的顏色偏好,形成一定的顏色“風(fēng)格”。實(shí)際上,顏色不僅塑造了作品的風(fēng)格,還包含很多“隱喻”。顏色利用得當(dāng),會(huì)給整個(gè)作品加分不少,否則那些吸引人的色彩可能會(huì)毀掉整個(gè)可視化作品。《美國(guó)水資源協(xié)會(huì)雜志》利用可視化方法展示了美國(guó)各州水資源蒸散總量情況,然而由于色相差異與實(shí)際數(shù)據(jù)差異不匹配,導(dǎo)致可視化中的顏色陷阱。這幅圖運(yùn)用了很多顏色,視覺上也很美觀。但是圖中有一個(gè)比較嚴(yán)重的問題,它將美國(guó)劃分為兩個(gè)部分,右邊是深綠色和藍(lán)色,而左邊是淺綠色、黃色和橙色,因?yàn)樽筮吅陀疫叺念伾嘞嗖钶^大,很容易使讀者認(rèn)為美國(guó)東西部水資源蒸散總量情況相差很大。而實(shí)際上,色相變動(dòng)非常大的部分對(duì)應(yīng)的數(shù)值變動(dòng)非常小。這幅圖很容易誤導(dǎo)讀者,讀者會(huì)根據(jù)色相的差異判定美國(guó)東西部水資源蒸散總量情況差異非常大,然而事實(shí)并非如此。
總之,信息可視化所呈現(xiàn)的內(nèi)容不僅是數(shù)據(jù)的羅列,而是一個(gè)完整的系統(tǒng),一個(gè)包含數(shù)據(jù)分類、邏輯關(guān)系、閱讀習(xí)慣和視覺體驗(yàn)的系統(tǒng),任何數(shù)據(jù)和信息在進(jìn)行可視化展示后,都應(yīng)該是生動(dòng)有趣且富有親和力的。可視化分類法被用來實(shí)現(xiàn)用戶需求與相關(guān)可視化技術(shù)的匹配。在研究人員進(jìn)行可視化技術(shù)的研究,以及用戶進(jìn)行可視化方案的設(shè)計(jì)時(shí),首先應(yīng)確定用戶需求,然后以可視化分類法為指導(dǎo),從現(xiàn)有的可視化方法中選取合適的可視化方法。
- 大規(guī)模數(shù)據(jù)分析和建模:基于Spark與R
- 數(shù)據(jù)庫(kù)原理及應(yīng)用教程(第4版)(微課版)
- Architects of Intelligence
- MySQL從入門到精通(第3版)
- Oracle高性能自動(dòng)化運(yùn)維
- 數(shù)據(jù)驅(qū)動(dòng)設(shè)計(jì):A/B測(cè)試提升用戶體驗(yàn)
- Dependency Injection with AngularJS
- Hands-On Mathematics for Deep Learning
- 云原生數(shù)據(jù)中臺(tái):架構(gòu)、方法論與實(shí)踐
- 數(shù)據(jù)庫(kù)應(yīng)用系統(tǒng)開發(fā)實(shí)例
- SAS金融數(shù)據(jù)挖掘與建模:系統(tǒng)方法與案例解析
- MySQL技術(shù)內(nèi)幕:SQL編程
- Spring Boot 2.0 Cookbook(Second Edition)
- 數(shù)據(jù)中臺(tái)實(shí)戰(zhàn):手把手教你搭建數(shù)據(jù)中臺(tái)
- 成功之路:ORACLE 11g學(xué)習(xí)筆記