官术网_书友最值得收藏!

1.1 什么是數(shù)據(jù)可視化

數(shù)據(jù)是指對(duì)客觀事件進(jìn)行記錄并可以鑒別的符號(hào),主要記載客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系。它是可識(shí)別的、抽象的符號(hào)。

數(shù)據(jù)不僅指狹義上的數(shù)字,還可以是具有一定意義的文字、字母、數(shù)字符號(hào)的組合、圖形、圖像、視頻、音頻等,或者客觀事物的屬性、數(shù)量、位置及其相互關(guān)系的抽象表示。例如,“0、1.2…”“陰、雨、下降、氣溫”“學(xué)生的檔案記錄、貨物的運(yùn)輸情況”等都是數(shù)據(jù)。

在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)是指所有能輸入到計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號(hào)的介質(zhì)的總稱,是用于輸入電子計(jì)算機(jī)進(jìn)行處理,具有一定意義的數(shù)字、字母、符號(hào)和模擬量等的通稱。計(jì)算機(jī)存儲(chǔ)和處理的對(duì)象十分廣泛,表示這些對(duì)象的數(shù)據(jù)也隨之變得越來越復(fù)雜。

數(shù)據(jù)經(jīng)過加工后就成為信息。兩者既有聯(lián)系,又有區(qū)別。數(shù)據(jù)是信息的表現(xiàn)形式和載體,可以是符號(hào)、文字、數(shù)字、語音、圖像、視頻等。而信息是數(shù)據(jù)的內(nèi)涵,信息是加載于數(shù)據(jù)之上對(duì)數(shù)據(jù)做的具有含義的解釋。數(shù)據(jù)和信息是不可分離的,信息依賴數(shù)據(jù)來表達(dá),數(shù)據(jù)則生動(dòng)具體表達(dá)出信息。數(shù)據(jù)是符號(hào),是物理性的;信息是對(duì)數(shù)據(jù)進(jìn)行加工處理之后所得到的、能夠?qū)Q策產(chǎn)生影響的數(shù)據(jù),是邏輯性和觀念性的;數(shù)據(jù)是信息的表現(xiàn)形式,信息是數(shù)據(jù)有意義的表示。數(shù)據(jù)是信息的表達(dá)、載體,信息是數(shù)據(jù)的內(nèi)涵,它們之間是形與質(zhì)的關(guān)系。數(shù)據(jù)本身沒有意義,數(shù)據(jù)只有對(duì)實(shí)體行為產(chǎn)生影響時(shí)才成為信息。

數(shù)據(jù)可視化就是數(shù)據(jù)中信息的可視化。人類對(duì)圖形、圖像等可視化符號(hào)的處理效率要比對(duì)數(shù)字、文本的處理效率高很多。經(jīng)過可視化的數(shù)據(jù),可以讓人更直觀、更清晰地了解到數(shù)據(jù)中蘊(yùn)含的信息,從而最大化數(shù)據(jù)的價(jià)值。

數(shù)據(jù)可視化是一門科學(xué)。它主要借助圖形化的手段,達(dá)到有效傳達(dá)與溝通信息的目的。它與信息圖形化、信息可視化、科學(xué)可視化和統(tǒng)計(jì)圖形化等領(lǐng)域密切相關(guān)。近些年,數(shù)據(jù)可視化已經(jīng)在商業(yè)中發(fā)揮了巨大的價(jià)值,是商務(wù)智能重要的一部分,其主要形式包括報(bào)表、圖表,以及各種用于制作計(jì)分卡(Scorecards)和儀表盤(Dashboards)的可視化元素。

數(shù)據(jù)可視化又是一門藝術(shù)。它需要在功能與美學(xué)形式之間達(dá)到一種平衡。太注重實(shí)現(xiàn)復(fù)雜的功能會(huì)令可視化結(jié)果枯燥乏味,太注重美學(xué)形式會(huì)將信息埋沒在絢麗多彩的圖形中,讓人難以捕捉。

當(dāng)前,在研究、教學(xué)和開發(fā)領(lǐng)域,數(shù)據(jù)可視化都是一個(gè)極為活躍而又關(guān)鍵的方向。特別是在大數(shù)據(jù)時(shí)代,面對(duì)規(guī)模、種類快速增長(zhǎng)的數(shù)據(jù),可視化已然成為各個(gè)領(lǐng)域傳遞信息不可缺少的手段,是快速理解數(shù)據(jù)的必然要求。

數(shù)據(jù)可視化主要從數(shù)據(jù)中尋找三個(gè)方面的信息:模式、關(guān)系和異常。

1)模式,指數(shù)據(jù)中的規(guī)律。比如,城市交通流量在不同時(shí)刻差異很大,而流量變化的規(guī)律就蘊(yùn)含在海量傳感器源源不斷地傳來的數(shù)據(jù)中。如果能及時(shí)從中發(fā)現(xiàn)交通運(yùn)行模式,就可以為交通的管理和調(diào)控提供依據(jù),進(jìn)而減輕堵塞現(xiàn)象。

2)關(guān)系,指數(shù)據(jù)之間的相關(guān)性。統(tǒng)計(jì)學(xué)中,通常代表關(guān)聯(lián)性和因果關(guān)系。無論數(shù)據(jù)的總量和復(fù)雜程度如何,數(shù)據(jù)間的關(guān)系大多可分為三類:數(shù)據(jù)間的比較、數(shù)據(jù)的構(gòu)成,以及數(shù)據(jù)的分布或聯(lián)系。比如,收入水平與幸福感之間的關(guān)系是否成正比,經(jīng)統(tǒng)計(jì),對(duì)于月收入在1萬元以下的人來說,一旦收入增加,幸福感會(huì)隨之提升,但對(duì)于月收入水平在1萬元以上的人來說,幸福感并不會(huì)隨著收入水平的提高而明顯提升,這種非線性就是一種關(guān)系。

3)異常,指有問題的數(shù)據(jù)。異常的數(shù)據(jù)不一定都是錯(cuò)誤的數(shù)據(jù),有些異常數(shù)據(jù)可能是設(shè)備出錯(cuò)或者人為錯(cuò)誤輸入,有些可能就是正確的數(shù)據(jù)。通過異常分析,用戶可以及時(shí)發(fā)現(xiàn)各種異常情況。如圖1-1所示,圖中大部分點(diǎn)都集中在一個(gè)區(qū)域,極少數(shù)點(diǎn)分散在其他區(qū)域,正是這些點(diǎn)可能會(huì)影響對(duì)數(shù)據(jù)相關(guān)性的判斷,通過可視化可以初步將其識(shí)別出來。

圖1-1 異常點(diǎn)示例

主站蜘蛛池模板: 云浮市| 威信县| 舞钢市| 封开县| 紫阳县| 三台县| 安福县| 三江| 上思县| 海林市| 阿合奇县| 长寿区| 绥江县| 阳谷县| 北辰区| 清丰县| 措勤县| 台安县| 甘洛县| 石门县| 甘肃省| 同江市| 松原市| 平邑县| 清水河县| 叶城县| 上思县| 天峻县| 晋州市| 商南县| 类乌齐县| 靖西县| 南召县| 武平县| 淅川县| 将乐县| 绥芬河市| 苏州市| 霍林郭勒市| 乐业县| 邳州市|