官术网_书友最值得收藏!

1.4 數據庫設計基礎

考點17 數據庫系統的基本概念

1.數據、數據庫、數據庫管理系統、數據庫系統

真考鏈接

考核概率為100%,考生要熟記該考點內容,尤其是數據、數據庫的概念、數據庫管理系統的6個功能,數據庫技術發展經歷的3個階段,數據庫系統的4個基本特點,以及數據獨立性,數據庫系統的三級模式和兩級映射,并理解數據庫、數據庫系統、數據庫管理系統之間的關系。

(1)數據。

數據(Data)是描述事物的符號記錄。

(2)數據庫。

數據庫(DataBase,簡稱DB)是指長期存儲在計算機內的、有組織的、可共享的數據集合。

(3)數據庫管理系統。

數據庫管理系統(DataBaseManagementSystem,DBMS)是數據庫的機構,它是一個系統軟件,負責數據庫中的數據組織、數據操縱、數據維護、控制及保護和數據服務等。

數據庫管理系統的主要類型有4種,即文件管理系統、層次數據庫系統、網狀數據庫系統和關系數據庫系統,其中關系數據庫系統的應用最廣泛。

(4)數據庫系統。

數據庫系統(DataBaseSystem,DBS)是指引進數據庫技術后的整個計算機系統,能實現有組織地、動態地存儲大量相關數據,提供數據處理和信息資源共享的便利手段。

小提示

在數據庫系統、數據庫管理系統和數據庫三者之間,數據庫管理系統是數據庫系統的組成部分,數據庫又是數據庫管理系統的管理對象,因此可以說數據庫系統包括數據庫管理系統,而數據庫管理系統又包括數據庫。

2.數據庫系統的發展

數據管理發展至今已經經歷了人工管理階段、文件系統階段和數據庫系統階段三個階段。

一般認為,未來的數據庫系統應支持數據管理、對象管理和知識管理,應該具有面向對象的基本特征。在關于數據庫的諸多新技術中,面向對象數據庫系統、知識庫系統和關系數據庫系統的擴充是比較重要的。

(1)面向數據庫系統。

用面向對象方法構筑面向對象數據庫模型,使其具有比關系數據庫系統更為通用的能力。

(2)知識庫系統。

用人工智能中的方法特別是用邏輯知識表示方法構筑數據模型,使其模型具有特別通用的能力。

(3)關系數據庫系統的擴充。

利用關系數據庫作進一步擴展,使其在模型的表達能力與功能上有進一步的加強,如與網絡技術相結合的Web數據庫、數據倉庫及嵌入式數據庫等。

3.數據庫系統的基本特點

數據庫系統具有數據的集成性、數據的高共享性與低冗余性、數據獨立性、數據統一管理與控制等特點。

4.數據庫系統的內部機構體系

數據模式是數據庫系統中數據結構的一種表示形式,具有不同的層次與結構方式。

數據庫系統在其內部具有三級模式及二級映射,三級模式分別是概念模式、內模式與外模式;二級映射是外模式/概念模式的映射和概念模式/內模式的映射。三級模式與二級映射構成了數據庫系統內部的抽象結構體系。

模式的三個級別層次反映了模式的三個不同環境以及它們的不同要求,其中內模式處于最底層,它反映了數據在計算機物理結構中的實際存儲形式;概念模式處于中層,它反映了設計者的數據全局邏輯要求,而外模式位于最外層,它反映了用戶對數據的要求。

小提示

一個數據庫只有一個概念模式和一個內模式,但是有多個外模式。

真題精選

【例1】下列敘述中正確的是______。

A)數據庫系統是一個獨立的系統,不需要操作系統的支持

B)數據庫技術的根本目標是要解決數據的共享問題

C)數據庫管理系統就是數據庫系統

D)以上說法都不對

【答案】B

【解析】數據庫系統(DataBaseSystem,DBS),是由數據庫(數據)、數據庫管理系統(軟件)、計算機硬件、操作系統及數據庫管理員組成。作為處理數據的系統,數據庫技術的主要目的就是解決數據的共享問題。

【例2】在數據庫系統中,用戶所見的數據模式為______。

A)概念模式

B)外模式

C)內模式

D)物理模式

【答案】B

【解析】概念模式是數據庫系統中對全局數據邏輯結構的描述,是全體用戶(應用)公共數據視圖,它主要描述數據的記錄類型及數據間關系,還包括數據間的語義關系等。數據庫管理系統的三級模式結構由外模式、模式、內模式組成。數據庫的外模式也叫做用戶級數據庫,是用戶所看到和理解的數據庫,是從概念模式導出的子模式,用戶可以通過子模式描述語言來描述用戶級數據庫的記錄,還可以利用數據語言對這些記錄進行操作。內模式(或存儲模式、物理模式)是指數據在數據庫系統內的存儲介質上的表示,是對數據的物理結構和存取方式的描述。

考點18 數據模型

1.數據模型的基本概念

數據是現實世界符號的抽象,而數據模型是數據特征的抽象。它從抽象層次上描述了系統的靜態特征、動態行為和約束條件,為數據庫系統的信息表示與操作提供一個抽象的框架。數據模型所描述的內容包括數據結構、數據操作及數據約束。

真考鏈接

考核概率為90%,考生要熟記該考點內容,尤其是數據模型的概念、數據模型的三要素及類型、層次模型,以及E-R模型的基本概念、聯系的類型,并理解E-R模型三個概念之間的聯接關系、E-R圖,以及關系模式中常用的術語及完整性約束。

數據模型按不同的應用層次分為概念數據模型、邏輯數據模型和物理數據模型。

目前,邏輯數據模型也有很多種,較為成熟并先后被人們大量使用過的有層次模型、網狀模型、關系模型、面向對象模型等。

2.E-R模型

E-R模型(實體聯系模型)將現實世界的要求轉化成實體、聯系、屬性等幾個基本概念,以及它們間的兩種基本連接關系,并且可以用E-R圖非常直觀地表示出來。

E-R圖提供了表示實體、屬性和聯系的方法。

●實體:客觀存在并且可以相互區別的事物,用矩形表示,矩形框內寫明實體名。

●屬性:描述實體的特性,用橢圓形表示,并用無向邊將其與相應的實體連接起來。

●聯系:實體之間的對應關系,它反映現實世界事物之間的相互聯系用菱形表示,菱形框內寫明聯系名。

在現實世界中,實體之間的聯系可分為“一對一”的聯系(簡記為1∶1)、“一對多”的聯系(簡記為1∶n)、“多對多”的聯系(簡記為MNmn)三種類型。

3.層次模型

層次模型是用樹型結構表示實體及其之間聯系的模式。在層次模型中,節點是實體,樹枝是聯系,從上到下是一對多的關系。

層次模型的基本結構是樹型結構,自頂向下,層次分明。其缺點是:受文件系統影響大,模型受限制多,物理成分復雜,操作與使用均不理想,且不適用于表示非層次性的聯系。

4.網狀模型

網狀模型是用網狀結構表示實體及其之間聯系的模型。可以說,網狀模型是層次模型的擴展,表示多個從屬關系的層次結構,呈現一種交叉關系。

網狀模型是以記錄型為節點的網絡,它反映現實世界中較為復雜的事物間的聯系。

網狀模型結構如圖1.4所示。

圖1.4

5.關系模型

(1)關系的數據結構。

關系模型采用二維表來表示,簡稱表。二維表由表框架及表的元組組成。表框架是由n個命名的屬性組成,n稱為屬性元數。每個屬性都有一個取值范圍稱為值域。表框架對應了關系的模式,即類型的概念。在表框架中按行可以存放數據,每行數據稱為元組。

在二維表中唯一能標識元組的最小屬性集稱為該表的鍵(或碼)。二維表中可能有若干個鍵,它們稱為該表的候選碼(或候選鍵)。從二維表的候選鍵中選取一個作為用戶使用的鍵稱為主鍵(或主碼)。如表A中的某屬性集是某表B的鍵,則稱該屬性集為A的外鍵(或外碼)。

關系是由若干個不同的元組所組成的,因此關系可視為元組的集合。

(2)關系的操縱。

關系模型的數據操縱即是建立在關系上的數據操縱,一般有數據查詢、增加、刪除及修改4種操作。

(3)關系中的數據約束。

關系模型允許定義三類數據約束:實體完整性約束、參照完整性約束和用戶定義的完整性約束。其中前兩種完整性約束由關系數據庫系統自動支持。對于用戶定義的完整性約束,則由關系數據庫系統提供完整性約束語言,用戶利用該語言寫出約束條件,運行時由系統自動檢查。

真題精選

【例1】下列說法中正確的是______。

A)為了建立一個關系,首先要構造數據的邏輯關系

B)表示關系的二維表中各元組的每一個分量還可以分成若干個數據項

C)一個關系的屬性名稱為關系模式

D)一個關系可以包含多個二維表

【答案】A

【解析】元組已經是數據的最小單位,不可再分;關系的框架稱為關系模式;關系框架與關系元組一起構成了關系,即一個關系對應一張二維表。選項A中指出,在建立關系前,需要先構造數據的邏輯關系是正確的。

【例2】用樹型結構表示實體之間聯系的模型是______。

A)關系模型

B)網狀模型

C)層次模型

D)以上都是

【答案】C

【解析】數據模型是指反映實體及其實體間聯系的數據組織的結構和形式,有關系模型、網狀模型和層次模型等。其中層次模型實際上是以記錄型為節點構成的樹,它把客觀問題抽象為一個嚴格的、自上而下的層次關系,所以,它的基本結構是樹型結構。

考點19 關系代數

1.傳統的集合運算

(1)關系并運算。

若關系R和關系S具有相同的結構,則關系R和關系S的并運算記為RS,表示由屬于R的元組或屬于S的元組組成。

(2)關系交運算。

若關系R和關系S具有相同結構,則關系R和關系S的交運算記為RS,表示由既屬于R的元組又屬于S的元組組成。

(3)關系差運算。

若關系R和關系S具有相同的結構,則關系R和關系S的差運算記為R-S,表示由屬于R的元組且不屬于S的元組組成。

真考鏈接

考核概率為90%,考生要掌握該考點內容,尤其是投影、選擇、笛卡爾積運算,以及交、差、并等一些基本型運算。

(4)廣義笛卡兒積。

分別為n元和m元的兩個關系RS的廣義笛卡兒積R×S是一個(n ×m)元組的集合。其中的兩個運算對象RS的關系可以是同類型,也可以是不同類型。

2.專門的關系運算

專門的關系運算有選擇、投影、連接等。

(1)選擇。

從關系中找出滿足給定條件元組的操作稱為選擇。選擇的條件以邏輯表達式給出,使得邏輯表達式為真的元組將被選取。選擇又稱為限制。它是在關系R中選擇滿足給定選擇條件F的諸元組,記作:

其中,選擇文件F是一個邏輯表達式,取邏輯值“真”或“假”。

(2)投影。

從關系模式中指定若干個屬性組成新的關系稱為投影。

關系R上的投影是從關系R中選擇出若干屬性列組成新的關系,記作:

其中AR中的屬性列。

(3)連接。

也稱為θ連接,它是從兩個關系的笛卡兒積中選取滿足條件的元組,記作:

其中,AB分別為RS上度數相等且可比的屬性組。θ是比較運算符。

連接運算是從廣義笛卡兒積R×S中選取R關系在A屬性組上的值與S關系在B屬性組上值滿足關系θ的元組。

連接運算中有兩種最為重要且常用的連接,一種是等值連接;另一種是自然連接。

θ為“=”的連接運算稱為等值連接,是從關系R與關系S的廣義笛卡兒積中選取 A、B屬性值相等的元組,則等值連接為:

自然連接(Natural-join)是一種特殊的等值連接,它要求兩個關系中進行比較的分量必須是相同的屬性組,并且在結果中去掉重復的屬性列,則自然連接可記作:

真題精選

例1】設有如下3個關系表:

下列操作中正確的是______。

A)T=RS

B)T=RS

C)T=R×S

D)T=RS

答案】C

解析】集合的并、交、差、廣義笛卡兒積:設有兩個關系為RS,它們具有相同的結構,RS的并是由屬于RS,或者同時屬于RS的所有元組組成,記作RS;RS的交是由既屬于R又屬于S的所有元組組成,記作RS;RS的差是由屬于R但不屬于S的所有元組組成,記作R-S;元組的前n個分量是R的一個元組,后m個分量是S的一個元組,若RK1個元組,SK2個元組,則R×SK1 ×K2個元組,記為R×S。從圖中可見,關系T是關系R和關系S的簡單擴充,而擴充的符號為“×”,故答案為T=R×S

例2】在下列關系運算中,不改變關系表中的屬性個數但能減少元組個數的是______。

A)并

B)交

C)投影

D)笛卡兒積

答案】B

解析】關系的基本運算有兩類:傳統的集合運算(并、交、差)和專門的關系運算(選擇、投影、連接)。集合的并、交、差:設有兩個關系為RS,它們具有相同的結構,RS的并是由屬于RS,或同時屬于RS的所有元組組成,記作RS;RS的交是由既屬于R又屬于S的所有元組組成,記作RS;RS的差是由屬于R但不屬于S的所有元組組成,記作R-S。因此,在關系運算中,不改變關系表中的屬性個數但能減少元組(關系)個數的只能是集合的交。

考點20 數據庫設計與管理

數據庫設計是數據庫應用的核心。

1.數據庫設計概述

數據庫設計的基本任務是根據用戶對象的信息需求、處理需求和數據庫的支持環境設計出數據模型。

真考鏈接

考核概率為55%,考生要熟記該考點內容,主要是一些基本概念和一些方法步驟,以及數據庫設計的方法和步驟、數據庫管理的6個方面內容,并理解概念設計及邏輯設計。

數據庫設計的基本思想是過程迭代和逐步求精。數據庫設計的根本目標是要解決數據共享問題。

在數據庫設計中有兩種方法:

●面向數據的方法,是以處理信息需求為主,兼顧處理需求;

●面向過程的方法,是以處理需求為主,兼顧信息需求。

其中,面向數據的方法是主流的設計方法。

目前,數據庫設計一般采用生命周期法,即將整個數據庫應用系統的開發分解成目標獨立的若干階段,包括需求分析階段、概念設計階段、邏輯設計階段、物理設計階段、編碼階段、測試階段、運行階段、進一步修改階段。

2.數據庫設計的需求分析

需求收集和分析是數據庫設計的第一階段,這一階段收集到的基礎數據和一組數據流圖是下一步設計概念結構的基礎。需求分析的主要工作有繪制數據流程圖、數據分析、功能分析、確定功能處理模塊和數據之間的關系。

需求分析和表達經常采用的方法有結構化分析方法和面向對象的方法。結構化分析方法用自頂向下、逐層分解的方式分析系統。數據流圖表達了數據和處理過程的關系,數據字典對系統中數據的詳盡描述,是各類數據屬性的清單。

數據字典是各類數據描述的集合,它通常包括5個部分,即數據項,是數據的最小單位;數據結構,是若干數據項有意義的集合;數據流,可以是數據項,也可以是數據結構,表示某一處理過程的輸入和輸出;數據存儲,處理過程中存取的數據,常常是手工憑證、手工文檔或計算機文件;處理過程。

數據字典是在需求分析階段建立,在數據庫設計過程中不斷修改、充實、完善的。

3.數據庫的概念設計

(1)數據庫概念設計。

數據庫概念設計的目的是分析數據間內在的語義關聯,在此基礎上建立一個數據的抽象模型。

數據庫概念設計的方法主要有兩種:

●集中式模式設計法;

●視圖集成設計法。

(2)數據庫概念設計的過程。

使用E-R模型與視圖集成法進行設計時,需要按以下步驟進行:

①選擇局部應用;

②視圖設計;

③視圖集成。

4.數據庫的邏輯設計

(1)從E-R圖向關系模式轉換。

從E-R圖到關系模式的轉換是比較直接的,實體與聯系都可以表示成關系,在E-R圖中屬性也可轉換成關系的屬性。實體集也可轉換成關系,如表1.2所示。

表1.2 在E-R模型與關系間的比較

如聯系類型為1∶1,則每個實體的碼均是該關系的候選碼。

如聯系類型為1∶N,則關系的碼為N端實體的碼。

如聯系類型為MN,則關系的碼為諸實體的組合。具有相同碼的關系模式可合并。

(2)邏輯模式規范化。

在關系數據庫設計中存在的問題有數據冗余、插入異常、刪除異常和更新異常。

數據庫規范化的目的在于消除數據冗余和插入/刪除/更新異常。規范化理論有4種范式,從第一范式到第四范式的規范化程度逐漸升高。

(3)關系視圖設計。

關系視圖是在關系模式的基礎上所設計的直接面向操作用戶的視圖,它可以根據用戶需求隨時創建。

5.數據庫的物理設計

(1)數據庫物理設計的概念。

數據庫在物理設備上的存儲結構與存取方法稱為數據庫的物理結構,它依賴于給定的計算機系統。為一個給定的邏輯模型選取一個最符合應用要求的物理結構的過程,就是數據庫的物理設計。

(2)數據庫物理設計的主要目標。

數據庫物理設計的主要目標是對數據庫內部物理結構作調整并選擇合理的存取路徑,以提高數據庫訪問速度及有效利用存儲空間。

6.數據庫管理

數據庫是一種共享資源,它需要維護與管理,這種工作稱為數據庫管理,而實施此項管理的人稱為數據庫管理員(DBA)。

數據庫管理包括數據庫的建立、數據庫的調整、數據庫的重組、數據庫安全性與完整性控制、數據庫故障恢復和數據庫監控。

真題精選

在E-R圖中,用來表示實體之間聯系的圖形是______。

A)矩形

B)橢圓形

C)菱形

D)平行四邊形

【答案】 C

【解析】E-R圖中規定,用矩形表示實體,橢圓表示實體屬性,菱形表示實體關系。

常見問題

聯系有哪三種類型?它們的區別是什么?

一對一:A中的每一個實體只與B中的一個實體相聯系,反之亦然,則稱一對一聯系;一對多:A中的每一個實體,在B中都有多個實體與之對應,B中的每一個實體,在A中只有一個實體與之相對應,則稱一對多聯系;多對多:A中的每一個實體,在B中都有多個實體與之對應,反之亦然,則稱多對多聯系。

主站蜘蛛池模板: 常山县| 祁门县| 荥阳市| 龙山县| 玉龙| 湘乡市| 襄汾县| 榕江县| 平定县| 丘北县| 柳河县| 合江县| 顺义区| 孙吴县| 抚松县| 沁源县| 买车| 盐源县| 康乐县| 广平县| 大名县| 湘西| 镇巴县| 旺苍县| 北海市| 琼海市| 东平县| 阜城县| 卓尼县| 靖江市| 高淳县| 海兴县| 霸州市| 绥江县| 交口县| 资兴市| 龙井市| 赣榆县| 凤城市| 营山县| 岚皋县|