官术网_书友最值得收藏!

1.1 數(shù)據(jù)管理技術的發(fā)展

數(shù)據(jù)管理是指人們對數(shù)據(jù)進行收集、組織、存儲、加工、傳播和利用的一系列活動的總和。隨著計算機軟件、硬件技術的不斷發(fā)展和應用領域的不斷深化擴大,計算機在數(shù)據(jù)處理方面經(jīng)歷了從低級到高級的發(fā)展過程。20世紀80年代后,不僅在大、中型計算機上實現(xiàn)并應用了數(shù)據(jù)管理的數(shù)據(jù)庫技術,如Oracle、SYSBASE、Informix等,在微型計算機上也可以使用數(shù)據(jù)庫管理軟件,如常見的Access、FoxPro等軟件,使數(shù)據(jù)庫技術得到廣泛的應用和普及。數(shù)據(jù)管理技術的發(fā)展過程大致經(jīng)歷了人工管理、文件管理、數(shù)據(jù)庫管理三個階段。每個階段的發(fā)展以數(shù)據(jù)存儲冗余不斷減小、數(shù)據(jù)獨立性不斷增強、數(shù)據(jù)操作更簡單和方便為標志,各有各的特點。從人工管理到數(shù)據(jù)庫管理,標志著數(shù)據(jù)管理技術質(zhì)的飛躍。

1.人工管理階段

在計算機出現(xiàn)之前,人們運用常規(guī)的手段對數(shù)據(jù)記錄、存儲和加工,即利用紙張來記錄數(shù)據(jù)和利用計算工具(如算盤、計算尺)來進行計算,并主要使用人的大腦來管理和利用這些數(shù)據(jù)。而計算機出現(xiàn)之后到20世紀50年代中期,這個階段計算機則主要用于數(shù)值計算,也沒有管理數(shù)據(jù)的軟件,因此從計算機內(nèi)記錄的數(shù)據(jù)上看,其數(shù)據(jù)量小,數(shù)據(jù)無結構,用戶直接管理,且數(shù)據(jù)間缺乏邏輯組織,數(shù)據(jù)僅依賴特定的應用,缺乏獨立性。

2.文件系統(tǒng)階段

20世紀50年代后期至60年代中后期,隨著計算機的處理速度和存儲能力的飛速提升,硬件方面出現(xiàn)了磁鼓、磁盤等直接存取的外部存儲設備,軟件方面出現(xiàn)了高級語言和操作系統(tǒng)。操作系統(tǒng)中的文件系統(tǒng)則是專門管理存儲器中的數(shù)據(jù)處理系統(tǒng),是將計算機中的數(shù)據(jù)組織成相互獨立的被命名的數(shù)據(jù)文件,并可按文件的名字來進行訪問,是對文件中的記錄進行存取的數(shù)據(jù)管理技術。數(shù)據(jù)可以長期保存在計算機外存上,計算機可以對數(shù)據(jù)進行反復處理,并支持文件的查詢、修改、插入和刪除等操作。文件系統(tǒng)實現(xiàn)了記錄內(nèi)的結構化,但從文件的整體來看卻是無結構的。其數(shù)據(jù)面向特定的應用程序,因此數(shù)據(jù)共享性、獨立性差,且冗余度大,管理和維護的代價也很大。文件管理階段應用程序與數(shù)據(jù)的關系如圖1-1所示。

圖1-1

3.數(shù)據(jù)庫系統(tǒng)階段

20世紀60年代后期,計算機性能得到進一步提高,數(shù)據(jù)處理的規(guī)模也隨之擴大,對數(shù)據(jù)共享的需求日益增強,文件系統(tǒng)的數(shù)據(jù)管理方法已經(jīng)不能滿足應用程序開發(fā)的需求。期間出現(xiàn)了大容量磁盤,存儲容量大大增加且價格下降,在此基礎上就可以克服文件系統(tǒng)管理數(shù)據(jù)時的不足,來滿足和解決實際應用中多個用戶、多個應用程序共享數(shù)據(jù)的要求,從而使數(shù)據(jù)能為盡可能多的應用程序服務,于是就出現(xiàn)了數(shù)據(jù)庫管理技術。數(shù)據(jù)庫的特點是數(shù)據(jù)不再只針對某個特定的應用程序,而是面向全組織,具有整體的結構性,共享性高,冗余度減小,程序與數(shù)據(jù)之間具有一定的獨立性,并且對數(shù)據(jù)進行統(tǒng)一控制。

數(shù)據(jù)庫的主要特點如下:

(1)數(shù)據(jù)結構化

在文件系統(tǒng)中,文件之間不存在聯(lián)系,從整體看數(shù)據(jù)是沒有結構的;與文件系統(tǒng)相比,數(shù)據(jù)庫是存儲在外存上的數(shù)據(jù)集合,并按某種數(shù)據(jù)模型組織起來的結構化數(shù)據(jù),文件之間是相互聯(lián)系的,并在總體上遵從一定的結構形式。數(shù)據(jù)庫正是通過文件之間的聯(lián)系來反映現(xiàn)實世界中事物自然聯(lián)系的。

(2)數(shù)據(jù)共享性

由于數(shù)據(jù)庫中是按某種數(shù)據(jù)模型組織起來的結構化數(shù)據(jù),考慮了所有用戶的數(shù)據(jù)需求、面向整個系統(tǒng)組織的,從而實現(xiàn)了多個應用程序、多種語言和多個用戶能共享一個數(shù)據(jù)庫中的數(shù)據(jù)。不同用戶所使用的數(shù)據(jù)可以重疊,同一部分數(shù)據(jù)也可以為多個用戶使用,大大提高了數(shù)據(jù)的利用率。數(shù)據(jù)共享節(jié)省了大量人力物力,為數(shù)據(jù)庫系統(tǒng)的廣泛應用奠定了基礎。

(3)數(shù)據(jù)冗余度的減少

在數(shù)據(jù)庫技術之前,應用系統(tǒng)都需要建立各自的數(shù)據(jù)文件,即使相同的數(shù)據(jù)也需要在各自的系統(tǒng)中重復建立,造成大量的數(shù)據(jù)重復存儲,這個現(xiàn)象稱為數(shù)據(jù)的冗余。

在數(shù)據(jù)庫方式下,應用系統(tǒng)的數(shù)據(jù)是取自數(shù)據(jù)庫中的某個子集,是數(shù)據(jù)庫管理系統(tǒng)(DataBsae Management Systerm, DBMS)從數(shù)據(jù)庫中映像出來的,稱為邏輯文件。應用系統(tǒng)使用的數(shù)據(jù)可能出現(xiàn)在不同的邏輯文件中,實際上的物理存儲只出現(xiàn)一次,從而減少了數(shù)據(jù)的冗余。數(shù)據(jù)庫管理階段應用程序與數(shù)據(jù)的關系如圖1-2所示。

圖1-2

(4)數(shù)據(jù)獨立性

數(shù)據(jù)庫技術中的數(shù)據(jù)與程序是相互獨立的,互不依賴。

數(shù)據(jù)獨立有兩個含義:物理數(shù)據(jù)獨立性和邏輯數(shù)據(jù)獨立性。所謂物理數(shù)據(jù)獨立性,是指數(shù)據(jù)庫物理結構(包括數(shù)據(jù)的組織和存儲、存取方法、外部存儲設備等)發(fā)生變化時,不會影響到邏輯結構,而用戶用的是邏輯數(shù)據(jù),故程序不需改動。所謂邏輯數(shù)據(jù)獨立性,是指數(shù)據(jù)庫全局邏輯發(fā)生改變時,程序也不需改動,就像數(shù)據(jù)庫并沒有發(fā)生改變。

主站蜘蛛池模板: 汉源县| 上杭县| 乌拉特中旗| 鹤峰县| 久治县| 顺平县| 安康市| 桃江县| 门源| 普陀区| 巴林右旗| 桐城市| 邳州市| 阳泉市| 巴林左旗| 临邑县| 忻城县| 内丘县| 尼玛县| 禹城市| 志丹县| 寿宁县| 改则县| 十堰市| 中卫市| 衢州市| 若尔盖县| 衢州市| 象州县| 绥德县| 海城市| 甘肃省| 肇东市| 开阳县| 布尔津县| 淮滨县| 巩留县| 南昌县| 光山县| 景泰县| 汤阴县|