- 數據可視化:從小白到數據工程師的成長之路
- 劉英華
- 7字
- 2020-07-24 10:01:17
第1章 基礎知識
1.1 模擬和數字化
現實世界中我們看得見、摸得著的物品經常使用模擬信息表示其屬性,如物品的長度、高度和寬度。模擬信息最重要的一個特點是連續性,即在某個區間產生的連續值,如桌子的長度是2.15米。這個模擬信息值僅是一個相對準確的概念,或者說是一個近似值,因為桌子的長度往往不是恰好2.15米,而是近似2.15米,這主要取決于測量工具的精度。測量值小數點后的位數隨著測量工具的精度增加。模擬信息的另一個重要特點是無限性。科技的進步讓測量精度可以增加到非常多,甚至無限多的小數位數。在模擬世界中可以借助某種設備用測量的方法取得模擬信息的數值,數值是一個無限小數,介于兩個相鄰的數值之間,這兩個相鄰的數值隨著精度的增加可以無限分割。
在計算機和網絡世界中,任何數據都使用有限個“0”和“1”組合的代碼來表示,如計算機中的數字、文字、圖片、聲音、視頻和動畫等數據。美國信息交換標準碼(American Standard Code for Information Interchange,ASCII)是計算機最早使用的編碼。如字母“A”的ASCII編碼為“1000001”。計算機系統不存在無限的概念,因為任何數據均存儲在有限的內存或外存中,所以存儲數據時必須使用有限的位數表示。在計算機系統中,數據最大的特點是離散性,即孤立的點集。如整數集的任何兩個元素之間都有一定的距離,任何兩個連續的整數之間無任何其他整數值,即任何兩個連續的整數之間無法繼續分割。
思考:(1)計算機中的小數是離散的還是連續的?[1]
(2)計算機中的顏色是離散的還是連續的?[2]