官术网_书友最值得收藏!

第二節 數據元模型

數據元模型是描述數據元特性、結構和相互關系的模型,是數據元的元數據。GB/T18391-2009《信息技術 元數據注冊系統(MDR)》定義的數據元模型包括:數據元基本模型、數據元屬性基本模型、數據元值域基本模型和數據元總體模型[6-9]。數據元模型是理解和掌握數據元概念和原理的基礎。

一、數據元基本模型

1.數據元概念

數據元概念由對象類和特性組成(圖7-1)。對象(又稱為實體)是指事物或概念;對象類是指特性和其行為遵循同樣規律的對象集合。特性是指對象或對象類共有特征的抽取結果。因此,數據元概念就是特定特征組合而成的,關于數據元的知識單元。在數據元概念中,基數1∶1表示一個對象類只具有一類特性。

圖7-1 數據元基本模型

2.數據元基本模型

數據元概念加上表示成為數據元。在一個數據元中,一個對象類只具有一類特性(數據元概念),一類特性只能有一種表示(1∶1)。圖7-1是數據元的基本模型。

根據數據元的表示不同,一個數據元概念可以對應多個數據元(1∶N)。例如,人體的體溫,可以采用測量值表示,也可以將溫度分6檔表示(1:〈36℃;2:36~36.9℃;3:37~37.9℃;4:38~38.9℃;5:39~39.9℃;6:≥40℃),從而形成兩個數據元。

3.數據元屬性

數據元的特性以及表示構成數據元的屬性,每一個數據元都需要若干屬性對其特征和表示進行客觀和完整的描述。

4.數據元表示

數據元表示由值域、數據類型、計量單位(如果需要)、表示類(可選)組成,用于表達數據元的取值,包括取值的允許值、類型和范圍。

二、數據元屬性基本模型

圖7-2是數據元的基本屬性模型,該模型采用兩種準則對數據元的屬性進行分組,分在同一組的屬性共同擁有相似的基數和邏輯相關性。

圖7-2 數據元基本屬性模型

1.基數性準則

每一個數據元規范都可能包含0或1(0∶1)、1且僅是1(1∶1)、0或多(0∶N)個屬性。

2.邏輯相關性準則

屬性除了有相似基礎類型外,還可能彼此依賴,或者說某種屬性在沒有其他屬性存在的情況下不能存在。

三、數據元值域基本模型

圖7-3是值域基本模型。

圖7-3 數據元值域的基本模型

1.值域

模型中的值域是指數據元允許值的集合,一個允許值是某個值和該值的含義的組合,值的含義稱為值含義。值域是一個或多個數據元有效值的集合,用于在信息系統或數據交換中確認數據的有效性。它也是描述一個數據元的元數據的必要構成部分。特別是值域是數據元所表示的數據內容、形式和結構的指南。值域分為可枚舉值域和不可枚舉值域兩類。

(1)可枚舉值域:

由允許值(值和它們的含義)列表規定的值域。一個可枚舉值域是包含了它的所有值及關聯含義的一個列表。每對值和含義稱為一個允許值。每個值的含義稱為值含義。圖7-4是國家衛生行業標準WS363.14-2011《衛生信息數據元目錄 第14部分:衛生機構》中的兩個數據元。圖7-4A是“機構分類管理類別代碼”數據元,其允許值為代碼1、2、9,分別表示非營利性醫療機構、營利性醫療機構、其他。采用代碼(數字、字母等)表示允許值,適合于計算機處理。圖7-4B是“衛生監督機構編制類別代碼”數據元,其允許值是采用值域代碼表的方式給出。當允許值數量較多時,可以采用代碼表的方式。

圖7-4 數據元值域的表示

采用數據元值域代碼表,有助于數據元允許值的使用、管理和維護。與WS363-2011《衛生信息數據元目錄》配套的WS364-2011《衛生信息數據元值域代碼》,將WS363-2011《衛生信息數據元目錄》中數量超過3個的數據元允許值整理為值域代碼表,并以標準的形式發布。

“衛生監督機構編制類別代碼”的數據元允許值,是在WS364.15-2011《衛生信息數據元值域代碼 第15部分:衛生人員》的衛生監督機構人員編制類別代碼表CV08.30.001中給出。

(2)不可枚舉值域:

由描述規定的值域,不可枚舉值域準確描述了屬于該值域的允許值,例如“大于0小于1的全部實數”。

2.概念域

模型中的概念域是指對象類的特征集合(特性),因為特征需要通過有效的值含義來表示,概念域也稱為值含義的集合。概念域分為可枚舉概念域和不可枚舉概念域兩類。

(1)可枚舉概念域:

由值含義列表規定的概念域。可枚舉概念域的值含義可以明確地枚舉,該類型概念域對應于可枚舉類型的值域。

(2)不可枚舉概念域:

由描述規定的概念域。不可枚舉概念域的值含義由稱為不可枚舉概念域描述的規則來表述。這樣,值含義并非明確列出,這個規則描述了不可枚舉值域中允許值的含義。

描述數據有時需要使用計量單位,例如記錄溫度的計量單位(華氏度或攝氏度)、記錄速度的計量單位(海里/小時或米/秒)等。如果一個計量單位的任何量可以轉化為另一種計量單位下同等的量,則這些計量單位彼此之間是等價的。所有等價的計量單位被認為具有相同的維。例如,以上提到的溫度單位華氏度與攝氏度,速度單位海里/小時與米/秒具有相同的維。

計量單位與值域關聯,維與概念域關聯。圖7-3的數據元值域的基本模型給出以下基本原理。

(1)值域與一個概念域直接關聯表示概念,一個概念域可以有多個值域來表示。例如人體溫度這個概念,可以有多個值域表示,可以用體溫的具體數值表示(如37.1℃、38.0℃等),也可以用區間范圍表示(如〈37.0℃、37.0~39.0℃、〉39.0℃),還可以用“正常”“低熱”“高熱”狀態描述表示。

(2)概念域和值域有兩種(非互斥的)子類,可枚舉和不可枚舉的。可枚舉通過列表來規定,不可枚舉通過描述來規定。

(3)一個可枚舉概念域可以有多個值含義,一個可枚舉值域也可以有多個允許值,但一個允許值只與一個值含義關聯(1∶1),即值域中的每個允許值在概念域中是有特定值含義的。這里繼續以人體溫度為例說明,人體體溫這個概念,可以有多個值含義表示:具體數值、區間范圍、狀態描述,但每個值含義的允許值是一一對應的,如體溫具體數值的37.1℃、38.0℃,區間范圍的〈37.0℃、37.0~39.0℃、〉39.0℃,狀態描述的“正常”“低熱”“高熱”。

四、元數據總體模型

數據元的元數據總體模型由概念層和表示層兩個部分組成,見圖7-5。概念層包括數據元概念類和概念域類,這兩種類都表示概念。表示層包括數據元類和值域類,這兩種類都表示數據值的容器。圖7-5給出4個類的以下若干基本事實。

圖7-5 數據元的元數據總體模型

1.一個數據元是一個數據元概念和一個值域的結合體。

2.多個數據元可以共享相同數據元概念,即一個數據元概念可以用多個數據元表示,這意味著一個數據元概念可以用多個不同方式表示。例如地址這個數據元概念,可以是患者地址、患者聯系人地址、監護人地址等,即地址這個數據元概念可以用多個不同方式表示。

3.多個數據元可以共享相同的表示,即一個值域可以被不同數據元重復利用。例如患者地址、患者聯系人地址、監護人地址等數據元可以使用相同的地址值域。

4.值域不是必然與一個數據元關聯,可以單獨管理。

5.不同值域的允許值所對應的值含義相同時,這些值域在概念上是等價或相關的,因此多個值域可共享一個概念域。

6.許多數據元概念可以共享相同的概念域。

對圖7-5總體模型的理解,可以借助WS363-2011《衛生信息數據元目錄》和WS364-2011《衛生信息數據元值域代碼》。這兩部標準,前者是數據元標準,后者是值域標準。如前所述,WS363-2011的部分數據元允許值(允許值數量超過3個時)在WS364-2011以代碼表的形式給出。WS364-2011中的一個值域(允許值的集合)代碼表,并非只與WS363-2011的一個數據元對應,不同的數據元可以使用同一個值域代碼表。當然,前提是使用同一個值域代碼的數據元,具有相同的數據元概念。在國家后續發布的衛生信息基本數據集中,部分新增加的數據元也采用WS364-2011中已有的值域代碼。表7-1列出部分使用相同值域代碼表的數據元。從表7-1中可以看到,使用相同值域代碼表的數據元具有相同概念。

表7-1 使用同一值域代碼的數據元

主站蜘蛛池模板: 泊头市| 伊通| 汝阳县| 湖口县| 韶关市| 于田县| 柏乡县| 河北区| 中宁县| 潢川县| 安达市| 康马县| 交城县| 凤台县| 乐都县| 达拉特旗| 调兵山市| 安宁市| 巴东县| 泾源县| 乌审旗| 丰原市| 邹城市| 介休市| 同江市| 荣成市| 泰安市| 长春市| 新源县| 乡宁县| 德庆县| 肥西县| 女性| 甘洛县| 康马县| 巴林右旗| 乐东| 辉南县| 秦皇岛市| 舞钢市| 九龙坡区|