官术网_书友最值得收藏!

1.1 計算機基礎

計算機(Computer)是一種能按照某些預定的程序(這些程序往往體現的是人類的意志)對輸入到其中的信息進行處理,并將處理結果輸出的高度自動化的電子設備。本節將介紹計算機應用的基礎知識,為讀者步入本書后面知識的學習打下基礎。

知識點講解:

1.1.1 中央處理器

中央處理器(Central Processing Unit,CPU)是一塊超大規模的集成電路,通常是一臺計算機的運算核心和控制核心,主要包括算術和邏輯單元(Arithmetic and Logic Unit,ALU)和控制器(Control Unit,CU)兩大部件。此外,還包括若干個寄存器和存儲器,以及用于實現它們之間聯系的數據、控制及狀態總線。CPU與內部存儲器和輸入/輸出設備合稱為電子計算機三大核心部件,其功能主要是執行計算機指令以及處理計算機軟件中的數據。計算機的性能在很大程度上由CPU的性能決定,而CPU的性能主要體現在其運行速度上。

1.1.2 比特和字節

1.比特

比特音譯自英文名詞bit。在現實應用中,比特是表示信息量的一種單位。二進制數中的位表示信息量的度量單位,為信息量的最小單位。二進制數中的一位所包含的信息就是1比特,如二進制數0100就是4比特。在計算機應用中,二進制數0和1是構成信息的最小單位,被稱作“位”或“比特”。例如數字化音響中用電脈沖表達音頻信號,“1”代表有脈沖,“0”代表脈沖間隔。如果波形上每個點的信息用4位一組的代碼表示,則稱4比特,比特數越大,表達的模擬信號就越精確,對音頻信號的還原能力就越強。

2.字節

字節(Byte)是計算機信息技術用于計量存儲容量的一種計量單位,有時也表示一些計算機編程語言中的數據類型和語言字符。

在計算機應用中,由若干比特組成1字節。字節由多少比特組成取決于計算機的自身結構。通常來說,微型計算機的CPU多用8位組成1字節,用以表示一個字符的代碼,構成1字節的8位被看作一個整體,字節是存儲信息的基本單位。大多數情況下,計算機存儲單位的換算關系如下所示。

1B=8bit

1KB=1024B

1MB=1024KB

1GB=1024MB

上述關系中各個單位的具體說明如下所示。

? B表示字節。

? bit表示比特。

? KB表示千字節。

? MB表示兆字節。

? GB表示吉字節。

1.1.3 二進制

二進制是計算技術中被廣泛采用的一種數制,是使用0和1兩個數碼來表示數字的數制。二進制的基數為2,進位規則是“逢二進一”,借位規則是“借一當二”,由18世紀德國數理哲學大師萊布尼茨發現。當前的計算機系統使用的基本上是二進制系統,數據在計算機中主要是以補碼的形式存儲的。計算機中的二進制則是一種非常微小的開關,用“開”表示1,用“關”表示0。因為只使用0、1兩個數字符號,所以二進制非常簡單方便,易于用電子方式實現。

下面介紹如何從十進制轉換成二進制。

? 正整數轉換成二進制:轉換原則是除以2取余,然后倒序排列,高位補零。也就是說,將正的十進制數除以2,將得到的商再除以2,依次類推,直到商為0或1時為止,然后在旁邊標出各步的余數,最后倒著寫出來,高位補零即可。例如,為了將十進制數字42轉換為二進制,將42除以2,根據余數得到010101,然后將得到的余數倒著排一下,就會得到數字42對應二進制數是101010。但是因為計算機內部用于表示數的字節單位是定長的,如8位、16位或32位,所以當位數不夠時,需要在高位補零。前面將42轉換成二進制數時得到的結果是6位的101010,在前面缺少兩位,所以將十進制42轉換成二進制的最終結果是00101010。

? 負整數轉換成二進制:轉換原則是先將對應的正整數轉換成二進制,對二進制取反,然后對結果加1。以十進制負整數-42為例,將42的二進制形式(00101010)取反,得到的結果是11010101,然后再加1,結果是11010110。

? 二進制整數轉換成十進制:轉換原則是先將二進制數字補齊位數,首位如果是0,就代表正整數;首位如果是1,則代表負整數。先看首位是0的正整數,補齊位數以后,獲取“n×2m”的計算結果,其中上標“m”表示二進制數字的位數,“n”表示二進制的某個位數。將二進制中的各個位數分別實現“n×2m”計算,然后將計算結果相加,得到的值就為十進制。比如,將二進制1010轉換為十進制的過程如下所示:

二進制 1 0 1 0

補齊位數 0 0 0 0 1 0 1 0

進行“n×2m”計算0×270×260×250×241×230×221×210×20

計算結果 0 0 0 0 8 0 2 0

將各位求和的結果是10。所以,將二進制1010轉換為十進制的結果是10。

如果要轉換的二進制數補足位數后首位為1,表示這個二進制數是負整數。此時就需要先進行取反,再進行換算。例如,二進制數11101011的首位為1,那么先取反,得到-00010100,然后按照上面的計算過程得出10100對應的十進制數為20,所以二進制數11101011對應的十進制數為-20。

1.1.4 編碼格式

1.ASCII格式

美國信息交換標準代碼(American Standard Code for Information Interchange,ASCII)是基于拉丁字母的一套計算機編碼系統,主要用于顯示現代英語和其他西歐語言。ASCII是現今最通用的單字節編碼系統,并等同于國際標準ISO/IEC 646。

一個英文字母(不分大小寫)占1字節的空間,一個中文漢字占2字節的空間。一個二進制數字序列,在計算機中作為一個數字單元,一般為8位二進制數,換算為十進制后,最小值為0,最大值為255。例如,一個ASCII碼就是1字節。

2.Unicode格式

Unicode(又稱統一碼、萬國碼或單一碼)是計算機科學領域里的一項業界標準,包括字符集、編碼方案等。Unicode是為了解決傳統的字符編碼方案的局限性而產生的,它為每種語言中的每個字符設定統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求。

最初的Unicode編碼采用固定長度的16位,也就是2字節代表一個字符,這樣一共可以表示65536個字符。顯然,要表示各種語言中所有的字符,這是遠遠不夠的。Unicode 4.0規范考慮到了這種情況,定義了一組附加字符編碼,附加字符編碼采用兩個16位來表示,這樣最多可以定義1048576個附加字符,在Unicode 4.0規范中只定義了45960個附加字符,在Unicode 5.0版本中已定義的字符有238605個。

Unicode只是一種編碼規范,目前實際實現的Unicode編碼只有3種——UTF-8、UCS-2和UTF-16。這3種Unicode字符集之間可以按照規范進行轉換。

3.UTF-8格式

UTF-8(8-bit Unicode Transformation Format)是一種針對Unicode的可變長度字符編碼,又稱萬國碼。UTF-8由Ken Thompson于1992年創建,現在已經標準化為RFC 3629。UTF-8用1~6字節編碼Unicode字符,用在網頁上,可以統一頁面顯示的中文簡體及其他語言(如英文、日文、韓文)。一個UTF-8英文字符等于1字節。一個UTF-8中文(含繁體)字符,少數占用3字節,多數占用4字節。一個UTF-8數字占用1字節。

主站蜘蛛池模板: 樟树市| 河池市| 沙湾县| 湟中县| 莱州市| 关岭| 远安县| 库尔勒市| 渝北区| 新巴尔虎右旗| 南华县| 五台县| 顺义区| 泰和县| 奇台县| 鹿泉市| 苏州市| 仪征市| 崇义县| 蒙山县| 遵义县| 新龙县| 托克逊县| 绥德县| 南华县| 温宿县| 巴中市| 白玉县| 广昌县| 浦东新区| 泽州县| 泸水县| 福鼎市| 连城县| 故城县| 潞西市| 东丰县| 视频| 六枝特区| 厦门市| 南平市|