官术网_书友最值得收藏!

第二節(jié) 衛(wèi)生信息分類與編碼的方法

一、分類方法

(一)確定分類對(duì)象

衛(wèi)生信息分類與編碼的對(duì)象是醫(yī)療衛(wèi)生領(lǐng)域各項(xiàng)業(yè)務(wù)、科研和管理活動(dòng)中產(chǎn)生的,能夠通過信息系統(tǒng)處理的,一系列滿足數(shù)據(jù)交換與共享的數(shù)據(jù),主要任務(wù)是探索這些基本數(shù)據(jù)在醫(yī)療衛(wèi)生概念層的歸并、編目和計(jì)算機(jī)管理。衛(wèi)生信息分類對(duì)象的最小單元是數(shù)據(jù),不涉及具體信息系統(tǒng)的設(shè)計(jì)和數(shù)據(jù)庫字段。

(二)明確分類指征

衛(wèi)生信息分類與編碼以醫(yī)療衛(wèi)生業(yè)務(wù)活動(dòng)類別為主體,參考國(guó)內(nèi)外醫(yī)療衛(wèi)生學(xué)科分類、機(jī)構(gòu)分類和其他領(lǐng)域的信息資源分類辦法,依據(jù)信息資源的業(yè)務(wù)屬性和活動(dòng)特征,按照層次和關(guān)聯(lián)進(jìn)行歸并,不同于醫(yī)療衛(wèi)生學(xué)科、機(jī)構(gòu)、文獻(xiàn)等內(nèi)容的分類,不代替學(xué)科、文獻(xiàn)、圖書分類及學(xué)術(shù)上的各種觀點(diǎn)[4]

(三)制定分類原則

1.系統(tǒng)性原則

醫(yī)療衛(wèi)生各業(yè)務(wù)領(lǐng)域間信息資源存在著密切的聯(lián)系和廣泛的交叉,因此信息資源分類堅(jiān)持系統(tǒng)性原則,以業(yè)務(wù)一致性為基本內(nèi)容,簡(jiǎn)化分類體系,減少信息冗余,優(yōu)化分類結(jié)構(gòu)。

2.實(shí)用性原則

信息資源分類的終點(diǎn)是數(shù)據(jù)實(shí)體層,也是用戶的最終應(yīng)用層,因此分類體系要充分考慮用戶的可操作性。操作性強(qiáng)的信息分類體系能滿足用戶對(duì)數(shù)據(jù)歸屬和查詢的理解,也有助于數(shù)據(jù)的規(guī)范化設(shè)計(jì)和編制。

3.可擴(kuò)展性原則

醫(yī)療衛(wèi)生信息資源的內(nèi)容會(huì)隨著時(shí)間的推移、業(yè)務(wù)的發(fā)展而不斷擴(kuò)展,因此分類體系應(yīng)保證充分的可擴(kuò)展性,確保分類體系框架適應(yīng)不斷豐富的信息種類和數(shù)量的增長(zhǎng)。

4.兼顧科學(xué)性原則

醫(yī)療衛(wèi)生信息是一個(gè)相對(duì)獨(dú)立的資源域,各種不同屬性間存在著多角度的內(nèi)在關(guān)聯(lián),因此分類系統(tǒng)應(yīng)遵循自上向下優(yōu)先選擇最能代表信息資源的本質(zhì)特征的內(nèi)容進(jìn)行分類[5]

(四)分類法

1.面分類法

是把給定的分類對(duì)象,依據(jù)其本身固有的各類屬性,分成相互之間沒有隸屬關(guān)系的面,每個(gè)面都包含一組類目。將某個(gè)面中的一種類目和另一個(gè)面的一種類目組合在一起,即組成一個(gè)復(fù)合類目。

應(yīng)用面分類法將所有醫(yī)藥衛(wèi)生現(xiàn)有或可能產(chǎn)生的數(shù)據(jù)的屬性或特征視為若干個(gè)“面”,每個(gè)“面”再分為彼此獨(dú)立的若干個(gè)類目。根據(jù)需要將這些“面”中的類目組合在一起,形成一個(gè)復(fù)合類目。面分類法的分類原則是根據(jù)需要選擇分類對(duì)象本質(zhì)屬性或特征作為分類對(duì)象的各個(gè)“面”,不同“面”內(nèi)的條目間相互不交叉,對(duì)每個(gè)“面”都給出明確的定義。面分類法具有較大的彈性,一個(gè)面內(nèi)類目的改變,不會(huì)影響其他的面;可根據(jù)需要組成任何類目,同時(shí)也便于應(yīng)用計(jì)算機(jī)處理信息,易于添加和修改類目。面分類法不經(jīng)常使用,往往是同線分類法結(jié)合構(gòu)成混合分類法使用。

2.線分類法

也稱層次分類法,它是將初始的分類對(duì)象按選定的屬性作為劃分基礎(chǔ),逐漸分成相應(yīng)的若干個(gè)層次級(jí)類目,并排列成一個(gè)有層次的逐級(jí)展開的分類體系。這種表現(xiàn)形式是大類、中類、小類等。將分類對(duì)象一層一層進(jìn)行具體劃分,逐級(jí)展開。各個(gè)類之間構(gòu)成并列或隸屬關(guān)系,既不重復(fù),也不交叉。在線分類體系中,一個(gè)類目相對(duì)由它直接劃分出來的下一層級(jí)的類目而言,稱為上位類,其類目也叫母項(xiàng)。有上位類與直接劃分出來的下一層級(jí)的類目,相對(duì)于上位類而言,稱為下位類,也叫子項(xiàng)。在這里上位類與下位類之間存在著從屬關(guān)系,即下位類從屬于上位類,也就是子項(xiàng)從屬于母項(xiàng)。

線分類法遵循的基本原則由某一上位類劃分出的下位類類目的總的范圍應(yīng)與其上位類類目的范圍相等,當(dāng)某一個(gè)上位類類目劃分為若干個(gè)下位類的類目時(shí),應(yīng)選擇一個(gè)劃分基礎(chǔ)。同位類的類目之間只對(duì)應(yīng)于一個(gè)上位類分類,要依次進(jìn)行,不應(yīng)有空層或加層[6]

(五)構(gòu)建分類框架

1.層級(jí)設(shè)計(jì)

根據(jù)醫(yī)療衛(wèi)生信息的基礎(chǔ)屬性和本質(zhì)特征分析本領(lǐng)域資源域的全集范疇和主體類別。按線分類和面分類相結(jié)合的方法,再將其逐次分成相應(yīng)的層級(jí),每一個(gè)層級(jí)設(shè)若干節(jié)點(diǎn)作為類目,由此排成一個(gè)有層次、有節(jié)點(diǎn)、逐級(jí)展開的分類框架。在該分類框架中,同位類之間按并列關(guān)系設(shè)置,下位類與上位類之間按隸屬關(guān)系設(shè)置。為兼顧穩(wěn)定性和擴(kuò)展性,將分類框架設(shè)計(jì)4層,前2層按面分類,保持穩(wěn)定性;第3、4層遵循線分類原則,提供擴(kuò)展空間。

2.類目設(shè)計(jì)

將上述4層分類框架分別定義為主題域、主類、子類和小類。其中前3層劃分出的下位類類目范圍與其上位類類目保持范圍相等,第1層將醫(yī)療衛(wèi)生領(lǐng)域信息資源域全集抽象為若干個(gè)主題域;第2層將每個(gè)主題域按現(xiàn)有和可能產(chǎn)生的信息資源的本質(zhì)屬性或特征分解為若干主類;第3層是對(duì)每個(gè)主類信息進(jìn)行概念抽象的基礎(chǔ)上,根據(jù)目前現(xiàn)有或規(guī)劃的信息系統(tǒng)為特征進(jìn)行劃分,構(gòu)建若干子類。不同主題域、主類和子類間相互不重復(fù)、不交叉,每個(gè)主題域、主類和子類都給出明確的釋義。小類是子類的下位類,也是具體業(yè)務(wù)活動(dòng)中相同屬性多個(gè)數(shù)據(jù)集合的類目,內(nèi)容范圍等于或小于子類,即小類類目可以不是子類的全集,因?yàn)殡S著信息資源的擴(kuò)展和信息系統(tǒng)建設(shè)的不斷發(fā)展,小類屬性需要不斷地補(bǔ)充和完善。

3.類目名稱定義

分類框架中的每一個(gè)類目都是一個(gè)特定的主題,表達(dá)一類信息的內(nèi)涵和外延,需要給出明確的定義和名稱。本分類系統(tǒng)將4個(gè)主題域分別定義為疾病預(yù)防控制、醫(yī)療衛(wèi)生服務(wù)、醫(yī)療衛(wèi)生管理和衛(wèi)生監(jiān)督[7]。主類、子類和小類的類名稱定義以“疾病預(yù)防控制”主題域內(nèi)容為例說明,如將“疾病預(yù)防控制”主題域分解為5個(gè)主類,分別定義為監(jiān)測(cè)、調(diào)查、干預(yù)、評(píng)價(jià)和發(fā)布,將“監(jiān)測(cè)”主類目分解為4個(gè)子類目,分別將其定義為健康監(jiān)測(cè)、疾病監(jiān)測(cè)、傷害監(jiān)測(cè)和危險(xiǎn)因素監(jiān)測(cè)。由于小類可根據(jù)所屬數(shù)據(jù)基本內(nèi)容進(jìn)行不斷補(bǔ)充設(shè)置,所以本研究目前已經(jīng)根據(jù)需要給出可能的內(nèi)容,如將“健康監(jiān)測(cè)”子類目給出了出生監(jiān)測(cè)、生命過程事件監(jiān)測(cè)和死因監(jiān)測(cè)3個(gè)小類定義,用戶可以根據(jù)需求按規(guī)則擴(kuò)展。

二、編碼方法

編碼是一個(gè)對(duì)特定對(duì)象或事物進(jìn)行分類的過程,或是對(duì)事物進(jìn)行多軸分類的分類集合。在大多數(shù)分類中,各類用代碼表示。事實(shí)上,編碼是對(duì)對(duì)象多方面性質(zhì)的解釋,代碼可以是數(shù)字、字母或兩者兼具。

根據(jù)編碼對(duì)象的特征或根據(jù)所擬訂的分類方法,應(yīng)采用不同的編碼方法。編碼方法不同,產(chǎn)出的代碼類型不同。常見的代碼類型如圖6-2所示。

(一)縮寫碼

縮寫碼是按一定的縮寫規(guī)則從編碼對(duì)象名稱中抽取一個(gè)或多個(gè)字符而生成的代碼。這種編碼方法的本質(zhì)特性是依據(jù)統(tǒng)一的方法縮寫編碼對(duì)象的名稱,由取自編碼對(duì)象名稱中的一個(gè)或多個(gè)字符賦值成編碼表示。

圖6-2 代碼類型

縮寫碼編碼方法能有效用于那些相當(dāng)穩(wěn)定的,并且編碼對(duì)象的名稱在用戶環(huán)境中已是人所共知的有限標(biāo)識(shí)代碼集。

1.優(yōu)點(diǎn)

用戶容易記憶代碼值,從而避免頻繁查閱代碼表,可以壓縮冗長(zhǎng)的數(shù)據(jù)長(zhǎng)度。

2.缺點(diǎn)

編碼依賴編碼對(duì)象的初始表達(dá)語言、度量系統(tǒng)等方法。

3.示例

《世界各國(guó)和地區(qū)名稱代碼》中,部分國(guó)家的字母代碼,如奧地利(Australia)代碼AT;加拿大(Canada)代碼CA;中國(guó)(China)代碼CN。

(二)層次碼

層次碼編碼方法以編碼對(duì)象集合中的層級(jí)分類為基礎(chǔ),將編碼對(duì)象編碼成為連續(xù)且遞增的組(類)。

位于較高層級(jí)上的每一個(gè)組類都包含并且只能包含它下面較低層級(jí)全部的組類。這種代碼類型以每個(gè)層級(jí)上編碼對(duì)象特性之間的差異為編碼基礎(chǔ)[8],每個(gè)層級(jí)上特性必須互不相容。層次碼的一般結(jié)構(gòu)如圖6-3所示。

圖6-3 層次碼示意圖

層次碼能反映編碼對(duì)象間的隸屬關(guān)系。層級(jí)數(shù)目的建立依賴于信息管理的需求。層次碼較少用于標(biāo)識(shí)和參照的目的。

層次碼非常適合于諸如統(tǒng)計(jì)目的、報(bào)告貨物運(yùn)轉(zhuǎn)、基于學(xué)科的出版分類等情況。在實(shí)踐中既有固定格式,也有可變格式。固定格式比可變格式更容易處理一些。

1.優(yōu)點(diǎn)

易于編碼對(duì)象的分類或分組,能在較高的合計(jì)層級(jí)上匯總代碼值。

2.缺點(diǎn)

限制了理論容量的利用,因精密原則而缺乏彈性。

3.示例

《學(xué)科分類與代碼》,在數(shù)學(xué)學(xué)科(代碼110)下有數(shù)理邏輯與數(shù)學(xué)基礎(chǔ)(代碼110-14)。

(三)復(fù)合代碼

復(fù)合碼是由若干個(gè)完整的、獨(dú)立的代碼組合而成的代碼。一般地,復(fù)合碼編碼方法包括并置碼編碼方法和組合碼編碼方法。

1.并置碼編碼方法

并置碼是由一些代碼段組成的復(fù)合代碼,這些代碼段提供了描繪編碼對(duì)象的特性,這些特性是相互獨(dú)立的。這種方法的編碼表達(dá)式可以是任意類型順序碼、縮寫碼、無序碼的組合。并置碼編碼方法側(cè)重于對(duì)編碼對(duì)象特性的標(biāo)識(shí)。

(1)優(yōu)點(diǎn):

以代碼值中表現(xiàn)出一個(gè)或多個(gè)特性為基礎(chǔ),可以很容易地對(duì)編碼對(duì)象進(jìn)行分組,容量與每個(gè)特性可能帶有的值的數(shù)量相聯(lián)系,代碼值可以解釋。

(2)缺點(diǎn):

因需要含有大量的特性,導(dǎo)致每個(gè)代碼值有許多字符,難以適應(yīng)新特性的要求。

2.組合碼編碼方法

組合碼也是由一些代碼段組成的復(fù)合代碼,這些代碼段提供了編碼對(duì)象的不同特性。與并置碼不同的是,這些特性相互依賴,并且通常具有層次關(guān)聯(lián)。

組合碼編碼方法常用于標(biāo)識(shí)目的,以覆蓋寬泛的應(yīng)用領(lǐng)域。組合碼偏重于利用編碼對(duì)象的重要特性來縮小編碼對(duì)象集合的規(guī)模,從而達(dá)到標(biāo)識(shí)目的。

(1)優(yōu)點(diǎn):

代碼值容易賦予有助于配置和維護(hù)代碼值,能夠在相當(dāng)程度上解釋代碼值,有助于確認(rèn)代碼值。

(2)缺點(diǎn):

理論容量不能充分利用。

(3)示例:

居民身份證號(hào)整個(gè)組合碼共分4段,前兩個(gè)代碼段標(biāo)識(shí)了編碼對(duì)象公民的空間和時(shí)間特性,第三個(gè)代碼段則依賴于前兩個(gè)代碼段所限定的范圍,第四個(gè)代碼段依賴于前三個(gè)代碼段賦值后的校驗(yàn)計(jì)算結(jié)果。

(四)順序碼

順序碼是由阿拉伯?dāng)?shù)字或拉丁字母的先后順序來標(biāo)識(shí)編碼對(duì)象的。順序碼編碼方法就是從一個(gè)有序的字符集合中順序地取出字符,分配給各個(gè)編碼對(duì)象。這些字符通常是自然數(shù)的整數(shù),如以“1”打頭,也可以是字母字符,如AAA、AAB、AAC……

順序碼一般作為以標(biāo)識(shí)或參照為目的的獨(dú)立代碼來使用,或者作為復(fù)合代碼的一部分來使用,后一種情況經(jīng)常附加分類代碼。

在碼位固定的數(shù)字字段中,應(yīng)使用零填滿字段的位數(shù),直到滿足碼位的要求。

順序碼編碼方法還可細(xì)分為以下三種方法:遞增順序碼編碼方法、系列順序碼編碼方法、約定順序碼編碼方法。

1.遞增順序碼編碼方法

編碼對(duì)象被賦予的代碼值,可由預(yù)定數(shù)字遞增決定。例如,預(yù)定數(shù)字可以是1(純遞增型),或者是10(只有10的倍數(shù)可以賦值),或者是其他數(shù)字(如偶數(shù)情況下的2)等。用這種方法,代碼值不帶有任何含義。為了以后始代碼集的修改,可能需要使用中間的代碼值,這些中間代碼值的賦值根據(jù)不必按1遞增。

(1)優(yōu)點(diǎn):

能快速賦予代碼值、簡(jiǎn)明、編碼表達(dá)式容易確認(rèn)。

(2)缺點(diǎn):

編碼對(duì)象的分類或分組不能由編碼表達(dá)式來決定、不能充分利用最大容量。

2.系列順序碼編碼方法

系列順序碼是根據(jù)編碼對(duì)象屬性或特征的相同或相似,將編碼對(duì)象分為若干組,再將順序碼分為相應(yīng)的若干系列,并分別賦予各編碼對(duì)象組,在同一組內(nèi),對(duì)編碼對(duì)象連續(xù)編碼。

這種編碼方法首先要確定編碼對(duì)象的類別,按各個(gè)類別確定它們的代碼取值范圍,然后在各類別代碼取值范圍內(nèi)對(duì)編碼對(duì)象順序地賦予代碼值。系列順序碼只有在類別穩(wěn)定并且每一具體編碼對(duì)象在目前或可預(yù)見的將來不可能屬于不同類別的條件下才能使用。

(1)優(yōu)點(diǎn):

能快速賦予代碼值簡(jiǎn)明編碼表達(dá)式、容易確認(rèn)。

(2)缺點(diǎn):

不能充分利用最大容量。

3.約定順序碼編碼方法

約定順序碼不是一種純順序碼。這種代碼只能在全部編碼對(duì)象都預(yù)先知道并且編碼對(duì)象集合將不會(huì)擴(kuò)展的條件下才能順利使用。

在賦予代碼值之前,編碼對(duì)象應(yīng)按某些特性進(jìn)行排列,例如依名稱的字母順序排序,按事件、活動(dòng)的年代順序排序等。這樣得到的順序再用代碼值表達(dá),而這些代碼值本身也應(yīng)是從有序的列表中順序選出的。

(1)優(yōu)點(diǎn):

能快速賦予代碼值簡(jiǎn)明編碼表達(dá)式、容易確認(rèn)。

(2)缺點(diǎn):

不能適應(yīng)于將來可能的進(jìn)一步擴(kuò)展。

(五)無序碼

無序碼編碼方法是將無序的自然數(shù)或字母賦予編碼對(duì)象。此種代碼無任何編寫規(guī)律,是靠機(jī)器的隨機(jī)程序編寫的。

無序碼既可用作編碼對(duì)象的自身標(biāo)識(shí),又可作為復(fù)合代碼的組成部分(復(fù)合代碼的其他部分則以其他編碼規(guī)則為基礎(chǔ))。

主站蜘蛛池模板: 康乐县| 大港区| 衡东县| 平江县| 扎赉特旗| 娄底市| 马边| 海南省| 阳曲县| 汝南县| 比如县| 大宁县| 济源市| 宁波市| 新密市| 彭阳县| 武乡县| 视频| 政和县| 顺昌县| 敖汉旗| 东莞市| 资源县| 惠州市| 清镇市| 康马县| 尉犁县| 九龙城区| 阿勒泰市| 霍山县| 阿图什市| 错那县| 渑池县| 嫩江县| 维西| 宜昌市| 桐柏县| 彭阳县| 延寿县| 仁寿县| 盖州市|