- 數(shù)據(jù)可視化:從小白到數(shù)據(jù)工程師的成長之路
- 劉英華
- 595字
- 2020-07-24 10:01:17
第1章 基礎(chǔ)知識(shí)
1.1 模擬和數(shù)字化
現(xiàn)實(shí)世界中我們看得見、摸得著的物品經(jīng)常使用模擬信息表示其屬性,如物品的長度、高度和寬度。模擬信息最重要的一個(gè)特點(diǎn)是連續(xù)性,即在某個(gè)區(qū)間產(chǎn)生的連續(xù)值,如桌子的長度是2.15米。這個(gè)模擬信息值僅是一個(gè)相對(duì)準(zhǔn)確的概念,或者說是一個(gè)近似值,因?yàn)樽雷拥拈L度往往不是恰好2.15米,而是近似2.15米,這主要取決于測(cè)量工具的精度。測(cè)量值小數(shù)點(diǎn)后的位數(shù)隨著測(cè)量工具的精度增加。模擬信息的另一個(gè)重要特點(diǎn)是無限性??萍嫉倪M(jìn)步讓測(cè)量精度可以增加到非常多,甚至無限多的小數(shù)位數(shù)。在模擬世界中可以借助某種設(shè)備用測(cè)量的方法取得模擬信息的數(shù)值,數(shù)值是一個(gè)無限小數(shù),介于兩個(gè)相鄰的數(shù)值之間,這兩個(gè)相鄰的數(shù)值隨著精度的增加可以無限分割。
在計(jì)算機(jī)和網(wǎng)絡(luò)世界中,任何數(shù)據(jù)都使用有限個(gè)“0”和“1”組合的代碼來表示,如計(jì)算機(jī)中的數(shù)字、文字、圖片、聲音、視頻和動(dòng)畫等數(shù)據(jù)。美國信息交換標(biāo)準(zhǔn)碼(American Standard Code for Information Interchange,ASCII)是計(jì)算機(jī)最早使用的編碼。如字母“A”的ASCII編碼為“1000001”。計(jì)算機(jī)系統(tǒng)不存在無限的概念,因?yàn)槿魏螖?shù)據(jù)均存儲(chǔ)在有限的內(nèi)存或外存中,所以存儲(chǔ)數(shù)據(jù)時(shí)必須使用有限的位數(shù)表示。在計(jì)算機(jī)系統(tǒng)中,數(shù)據(jù)最大的特點(diǎn)是離散性,即孤立的點(diǎn)集。如整數(shù)集的任何兩個(gè)元素之間都有一定的距離,任何兩個(gè)連續(xù)的整數(shù)之間無任何其他整數(shù)值,即任何兩個(gè)連續(xù)的整數(shù)之間無法繼續(xù)分割。
思考:(1)計(jì)算機(jī)中的小數(shù)是離散的還是連續(xù)的?[1]
(2)計(jì)算機(jī)中的顏色是離散的還是連續(xù)的?[2]
- 我們都是數(shù)據(jù)控:用大數(shù)據(jù)改變商業(yè)、生活和思維方式
- Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)
- Word 2010中文版完全自學(xué)手冊(cè)
- 企業(yè)大數(shù)據(jù)系統(tǒng)構(gòu)建實(shí)戰(zhàn):技術(shù)、架構(gòu)、實(shí)施與應(yīng)用
- 業(yè)務(wù)數(shù)據(jù)分析:五招破解業(yè)務(wù)難題
- R數(shù)據(jù)科學(xué)實(shí)戰(zhàn):工具詳解與案例分析(鮮讀版)
- 軟件成本度量國家標(biāo)準(zhǔn)實(shí)施指南:理論、方法與實(shí)踐
- Starling Game Development Essentials
- Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)(第3版)
- 貫通SQL Server 2008數(shù)據(jù)庫系統(tǒng)開發(fā)
- 大數(shù)據(jù)時(shí)代系列(套裝9冊(cè))
- PostgreSQL高可用實(shí)戰(zhàn)
- Oracle 內(nèi)核技術(shù)揭密
- 高效使用Redis:一書學(xué)透數(shù)據(jù)存儲(chǔ)與高可用集群
- SQL應(yīng)用開發(fā)參考手冊(cè)