官术网_书友最值得收藏!

第二節(jié) SNOMED CT邏輯設(shè)計(jì)

一、概述

SNOMED CT目前(2019年1月國際發(fā)布版)包括大約349 548條概念(concepts)、超過90萬條臨床概念相關(guān)的描述(descriptions),和超過280萬條進(jìn)一步描述概念的關(guān)系(relationships)。

SNOMED CT的核心構(gòu)成為:概念表、描述表和關(guān)系表。圖5-3反映了各個(gè)表的組成和邏輯關(guān)系。

圖5-3 SNOMED CT的邏輯模型

SNOMED CT邏輯模型[20]提供了SNOMED CT的基本結(jié)構(gòu),并指定了如何可以在實(shí)施機(jī)構(gòu)中管理各組件的方法,以滿足各種診療和二次利用的需求。

SNOMED CT邏輯模型定義了每種SNOMED CT核心組件(component)和衍生物(derivative)進(jìn)行關(guān)聯(lián)和表達(dá)的方式。SNOMED CT中的核心構(gòu)成要素類型是概念、描述和關(guān)系。因此,邏輯模型指定了表示臨床意義的結(jié)構(gòu)化概念、指向這些概念的描述,以及概念之間的關(guān)系。

二、概念

概念作為SNOMED CT的核心部分。每個(gè)SNOMED CT概念都代表一種獨(dú)特的臨床含義,并且具有唯一的數(shù)字標(biāo)識(shí)符來標(biāo)識(shí)。該標(biāo)識(shí)符明確地、唯一地指向一個(gè)概念,用于計(jì)算機(jī)讀取和存儲(chǔ),其本身不具備人類可理解的意義。

SNOMED CT的概念是一組標(biāo)識(shí)符,可通過與完全指定名稱(fully specified name,F(xiàn)SN)相關(guān)聯(lián),標(biāo)識(shí)符和臨床概念的含義之間的聯(lián)系是永久的、不可改變的。概念由概念I(lǐng)D唯一標(biāo)識(shí),例如SCTID:22298006指心肌梗死。

(一)根概念和頂層概念

SNOMED CT中采用復(fù)合層級(jí)結(jié)構(gòu)(polyhierarchy)來組織概念,即一個(gè)概念可以有兩個(gè)或多個(gè)父概念。主要通過子類型關(guān)系構(gòu)建概念間層級(jí)關(guān)系。|SNOMED CT concep t|是SNOMED CT的根概念,是所有其他概念超類型(super t ype),所有其他概念都是根概念的子類型。

根概念的直接子類型被稱為頂層概念。 這些概念用于命名層級(jí)結(jié)構(gòu)的主要分類。SNOMED CT包含19個(gè)頂層概念,見表5-3。

表5-3 SNOMED CT頂層概念

(二)復(fù)合層級(jí)結(jié)構(gòu)

復(fù)合層級(jí)結(jié)構(gòu),即層級(jí)結(jié)構(gòu)中每個(gè)節(jié)點(diǎn)擁有一個(gè)或多個(gè)父節(jié)點(diǎn)。例如,|Pulmonary tuberculosis(disorder)|擁有三個(gè)父節(jié)點(diǎn),分別是|Tuberculosis of respiratory system|(disorder)、|Pulmonary disease caused by Mycobacteria(disorder)|和|Pneumonitis(disorder)。

通過這種層級(jí)結(jié)構(gòu)定義不同粒度的概念,既可以滿足臨床實(shí)際應(yīng)用,同時(shí)也可靈活支撐醫(yī)療大數(shù)據(jù)各種應(yīng)用場(chǎng)景,例如在隊(duì)列研究中,構(gòu)建心臟病隊(duì)列,需要收集所有心臟病相關(guān)的病例數(shù)據(jù),利用SNOMED CT中心臟病層級(jí)關(guān)系不僅可以收集包含“心臟疾病”的病例數(shù)據(jù),同時(shí)包含其子概念“心律失常”“纖維性顫動(dòng)”“房顫”及“持續(xù)性房顫”的病例數(shù)據(jù)均可以收集到,因?yàn)樯鲜?個(gè)子概念的其中一個(gè)父概念是“心臟疾病”。

與分類體系(如ICD-10)的簡(jiǎn)單層級(jí)結(jié)構(gòu)(mono-hierarchy)不同的是,SNOMED CT采用復(fù)合層級(jí)結(jié)構(gòu)(Poly-hierarchy),每個(gè)概念可以同時(shí)有多個(gè)父概念,圖5-4中“心肌梗死”有4個(gè)父概念,分別為“缺血性心臟病”“心肌病”“心肌壞死”“解剖部位壞死”。這種復(fù)合層級(jí)結(jié)構(gòu)更加符合醫(yī)學(xué)邏輯,能夠更好地實(shí)現(xiàn)對(duì)醫(yī)學(xué)含義的存儲(chǔ)及二次利用。也就是說,可以實(shí)現(xiàn)采用不同方式檢索同一概念,例如本例中,當(dāng)數(shù)據(jù)庫中的數(shù)據(jù)已經(jīng)被SNOMED CT這樣的復(fù)合層級(jí)結(jié)構(gòu)術(shù)語體系標(biāo)記后,檢索“缺血性心臟病”“心肌病”“心肌壞死”“解剖部位壞死”其中任何一個(gè)疾病時(shí),都能包含“心肌梗死”所對(duì)應(yīng)的病例數(shù)據(jù)。

圖5-4 SNOMED CT復(fù)合層級(jí)結(jié)構(gòu)

(三)SNOMED CT概念的覆蓋程度及顆粒度

正如美國哥倫比亞大學(xué)James Cimino教授發(fā)表的文章[1]中所述,構(gòu)建醫(yī)學(xué)術(shù)語體系應(yīng)該注意12條準(zhǔn)則最重要的一條就是術(shù)語體系內(nèi)容的覆蓋程度。已有多篇文章對(duì)SNOMED CT的內(nèi)容覆蓋做了各方面的研究[21-23]。現(xiàn)在,SNOMED CT已經(jīng)擁有覆蓋19個(gè)不同領(lǐng)域超過34萬的概念,如表5-4所示。總體來說,349 548個(gè)概念,907 283個(gè)描述,2 876 521個(gè)關(guān)系。平均每個(gè)概念擁有2.6個(gè)描述(同義詞)和8.23個(gè)關(guān)系。可見SNOMED CT在醫(yī)學(xué)術(shù)語方面的覆蓋程度,以及對(duì)每個(gè)概念定義的闡述詳細(xì)程度是非常大的。概念個(gè)數(shù)最多的是在Clinical finding層級(jí)結(jié)構(gòu)下,共有超過112 000個(gè)概念。

表5-4 SNOMED CT概念、描述、關(guān)系在各層級(jí)結(jié)構(gòu)分布表(數(shù)據(jù)來自SNOMED CT International Release 2019年1月版本)

以“高脂血癥”為例,如圖5-5可見,SNOMED CT中高脂血癥的各級(jí)子概念有多達(dá)50多個(gè)。再如表5-5所示,ICD-10國際版本中與“Atrial Fibrillation”相關(guān)有三個(gè)編碼,“Coronary arteriosclerosis”僅有1個(gè)編碼;SNOMED CT國際版中,分別有12個(gè)和21個(gè)。SNOMED CT中這樣詳細(xì)地對(duì)醫(yī)學(xué)概念進(jìn)行描述的好處在于:①使得對(duì)各種臨床細(xì)節(jié)的描述成為可能;②當(dāng)與ICD這樣的分類體系進(jìn)行映射后,可以大大地豐富其他分類體系的功能使用。

圖5-5 SNOMED CT中高脂血癥各級(jí)子概念一覽

表5-5 SNOMED CT和ICD-10在概念顆粒度的比較

三、描述

每個(gè)SNOMED CT概念均由一組同義詞(醫(yī)學(xué)術(shù)語)對(duì)其進(jìn)行描述。描述表用來指定人類可讀的概念形式和概念之間的關(guān)系。對(duì)于同一個(gè)醫(yī)學(xué)概念,可能存在幾個(gè)甚至十幾個(gè)與之對(duì)應(yīng)的術(shù)語,而所有的概念至少有一個(gè)完全指定名稱和至少一個(gè)同義詞(synonym,Syn),F(xiàn)SN與Syn是描述中術(shù)語的兩種主要類型。其中,完全指定名稱是一個(gè)明確描述概念的短語,是概念的權(quán)威含義。雖然FSN不一定在臨床記錄中顯示,但是在相同的、通用字詞或短語指向不同概念時(shí),F(xiàn)SN對(duì)于消除歧義非常有用。在某一種語言或方言中,每個(gè)概念只能擁有一個(gè)FSN。同義詞表示可用于顯示或選擇的術(shù)語,是被臨床醫(yī)生廣泛用于指代某概念的單詞或短語,在用戶界面中被用于搜索、篩選和展示。一個(gè)概念可能有幾個(gè)同義詞。這一點(diǎn)為SNOMED CT的用戶使用具有特定臨床意義的、個(gè)人傾向性的術(shù)語提供了便利。一個(gè)概念可以有多個(gè)同義詞,兩個(gè)概念可以有相同的同義詞,對(duì)同義詞的解釋取決于概念的標(biāo)識(shí)符。

在指定的語言、方言或使用環(huán)境中,每個(gè)概念都有且僅有一個(gè)同義詞,被標(biāo)記為首選的(preferred),并且也是臨床醫(yī)生常用來命名該概念的短語,其他的同義詞被標(biāo)記為可接受的(acceptable),如圖5-6。

圖5-6 SNOMED CT單一概念的描述示例

四、關(guān)系

關(guān)系用來連接SNOMED CT中的概念。兩個(gè)概念由第三個(gè)概念,即“關(guān)系類型”進(jìn)行連接,表示由“源概念”到“目標(biāo)概念”的聯(lián)系。在SNOMED CT中,有許多關(guān)系類型,每個(gè)關(guān)系都表達(dá)了一個(gè)概念的定義特征,即描述這個(gè)概念所應(yīng)具備的必要條件。因此,一個(gè)概念可能是另一個(gè)概念的子類型,也可能有一個(gè)特定的屬性,其值由另一個(gè)概念提供。

所有的關(guān)系類型可以分為兩大類,即定義關(guān)系和非定義關(guān)系。

(一)定義關(guān)系

定義關(guān)系(definitional relationship)用來描述源概念所“必定”擁有的“特征”或“屬性”[3],它所包含關(guān)系的類型分為子類型關(guān)系(subtype relationships)和屬性關(guān)系(attribute relationships),如圖5-7。

圖5-7 定義關(guān)系示例

1.子類型關(guān)系

子類型關(guān)系是應(yīng)用最廣泛的關(guān)系類型。子類型關(guān)系使用|is a|來表達(dá),因此也被認(rèn)為是|is a|關(guān)系。幾乎所有有效的SNOMEDCT概念都至少是一種|is a|關(guān)系的源概念。唯一例外的是,根概念|SNOMED CT Concept|是最抽象的概念,|is a|關(guān)系表明源概念是目標(biāo)概念的亞型。

如果兩個(gè)概念通過單一|is a|關(guān)系直接鏈接,源概念就可以被認(rèn)為是目標(biāo)概念的子類型。如果兩個(gè)概念通過多個(gè)|is a|關(guān)系鏈接,則源概念被認(rèn)為是目標(biāo)概念的派生子類型,即|is a|關(guān)系的源概念被目標(biāo)概念所包含,|is a|關(guān)系的目標(biāo)概念則包含源概念。

每一個(gè)概念都擁有 |is a| 關(guān)系,并可以關(guān)聯(lián)到其他幾個(gè)概念(例如一個(gè)概念可能有多個(gè)父類型概念)。因此,認(rèn)為SNOMED CT的層級(jí)并不僅是一個(gè)簡(jiǎn)單的層級(jí)結(jié)構(gòu),而是一個(gè)復(fù)合層級(jí)結(jié)構(gòu)。通過|is a| 關(guān)系構(gòu)成了SNOMED CT的層級(jí)結(jié)構(gòu),因此該關(guān)系也被稱為層級(jí)關(guān)系。|is a|關(guān)系中的源概念擁有比目標(biāo)概念更詳細(xì)的臨床意義。這就意味著,概念的顆粒度(臨床細(xì)節(jié)水平)隨著層級(jí)的深度增加而變得更加詳細(xì)。

子類型關(guān)系提供了將概念相互關(guān)聯(lián)的主要語義層次結(jié)構(gòu),子類型關(guān)系使用|is a|來表達(dá)。除根概念外,所有有效概念(active concept)都與一個(gè)或多個(gè)概念具有子類型關(guān)系。每一個(gè)子類型關(guān)系都表明一個(gè)概念是另一個(gè)概念的子概念。SNOMED CT中每個(gè)頂層概念都是復(fù)雜的復(fù)合層級(jí)結(jié)構(gòu),概念通過|is a|關(guān)系與至少一個(gè)頂層概念建立關(guān)聯(lián),即所有其他概念至少是一個(gè)頂層概念的子類。隨著層級(jí)結(jié)構(gòu)的細(xì)分,概念越來越具體(圖5-8)。

圖5-8 SNOMED CT層級(jí)結(jié)構(gòu)

2.屬性關(guān)系

通過把源概念及其特征相關(guān)聯(lián),屬性關(guān)系可以對(duì)源概念進(jìn)行明確定義。概念的特征(即概念的屬性)可以通過屬性類型和屬性值來界定。

例如概念|下肢骨折|的關(guān)系定義如圖5-9所示。屬性關(guān)系中的|相關(guān)形態(tài)學(xué)(associated morpholo-gy)|和|臨床發(fā)現(xiàn)位置(finding site)|用于把源概念|下肢骨折|和目標(biāo)概念|骨折|(形態(tài)學(xué)異常)、|下肢骨結(jié)構(gòu)|分別關(guān)聯(lián)起來。

|is a|關(guān)系可以用于定義所有的概念,而屬性關(guān)系的適用性僅限于已定義的域(domain)和值集(range)。域是指那些可以作為屬性關(guān)系類型的源概念;值集是指那些可以作為屬性的目標(biāo)的概念。規(guī)范的域和值集能夠確保定義的一致性,也可用于指向附加語義關(guān)系,以提供可靠的、基于語義的復(fù)合意義檢索。

如圖5-10所示錯(cuò)誤關(guān)系示例,第一個(gè)樣例中,|身體結(jié)構(gòu)|不符合|致病因子|域的約束,不可以作為|致病因子|的域。第二個(gè)樣例,|形態(tài)學(xué)異常|不符合|致病因子|的值集約束,不能作為|致病因子|的值集。

屬性關(guān)系是對(duì)概念定義的細(xì)化,通過添加屬性關(guān)系使概念定義更加完整,通常是對(duì)頂層概念設(shè)定屬 性類型,對(duì)特定頂層概念設(shè)定的屬性類型適用于其所有子概念,SNOMED CT中包含屬性類型100余種,主要用于對(duì)以下幾個(gè)頂層概念及其子概念定義:①臨床表現(xiàn)(clinical finding);②操作(procedure);③標(biāo)本(specimen);④身體結(jié)構(gòu)(body structure);⑤藥物或生物制品(pharmaceutical/biologic product);⑥具有明確上下文關(guān)系的情況(situation with explicit context);⑦事件(event);⑧物理性實(shí)體(physical object)。

圖5-9 關(guān)系定義示例

圖5-10 錯(cuò)誤關(guān)系示例

(二)非定義關(guān)系

非定義關(guān)系用來描述源概念所“可能”擁有的“特征”或“屬性”,包括:修飾關(guān)系、時(shí)間關(guān)系和附屬關(guān)系[3]。在SNOMED CT最新的版本中,非定義關(guān)系已經(jīng)失效。

五、SNOMED CT表達(dá)式

(一)概述

SNOMED CT表達(dá)式[24]使SNOMED CT可以在記錄中捕獲更廣泛的臨床含義,并支持使用SNOMED CT表達(dá)式的軟件系統(tǒng)對(duì)不同的臨床信息進(jìn)行記錄、檢索、計(jì)算和比較。表達(dá)式是一個(gè)或多個(gè)概念標(biāo)識(shí)符的結(jié)構(gòu)化組合,用于通過特定規(guī)則表示臨床概念或臨床含義。表達(dá)臨床含義可以使用兩種不同的方式,即前組表達(dá)式和后組表達(dá)式。

前組表達(dá)式是使用單個(gè)SNOMED CT 概念對(duì)臨床含義進(jìn)行描述;后組表達(dá)式根據(jù)表達(dá)式規(guī)則,使用多個(gè)SNOMED CT概念組合來表示臨床含義。無論前組還是后組表達(dá)式均使用SNOMED CT復(fù)合語法表示,是一種輕量級(jí)語法。

后組表達(dá)式可以表述更詳細(xì)的臨床細(xì)節(jié),示例:概念|肺炎球菌肺炎|的|臨床表現(xiàn)部位|為|肺結(jié)構(gòu)|,此時(shí)如需要記錄更詳細(xì)的臨床細(xì)節(jié),|臨床發(fā)現(xiàn)部位|為|肺葉|,這時(shí)可以將|肺結(jié)構(gòu)|細(xì)化為|肺葉|,并通過后組的形式完成信息記錄(|肺炎球菌肺炎|∶臨床發(fā)現(xiàn)部位|=|肺葉|)。后組表達(dá)式大大增加了SNOMEDCT可表達(dá)的臨床細(xì)節(jié)的深度及靈活性,可以在不單獨(dú)增加概念的情況下表達(dá)每一種可能疾病包括的每一個(gè)可能特點(diǎn)。基于SNOMED CT概念模型,計(jì)算機(jī)將對(duì)來自不同人員、組織的相似的或相同的表達(dá)式進(jìn)行識(shí)別和比較。

(二)前組表達(dá)式

前組表達(dá)式表示在SNOMED CT中預(yù)先定義的單個(gè)概念的表達(dá)式。除了唯一的概念標(biāo)識(shí)符和描述之外,每個(gè)概念還具有一個(gè)正式的邏輯定義,由一組與其他概念的定義關(guān)系表示。圖5-11顯示了用于記錄|脛骨骨折|的前組表達(dá)式,它說明表達(dá)式可以用一個(gè)標(biāo)識(shí)符來表示,伴有或不伴有人類可讀術(shù)語。

圖5-11 脛骨骨折前組表達(dá)式

(三)后組表達(dá)式

包含兩個(gè)或更多概念標(biāo)識(shí)符的表達(dá)式稱為后組表達(dá)式。后組表達(dá)式結(jié)合了多個(gè)概念,并允許將更多細(xì)節(jié)添加到單個(gè)概念所表達(dá)的含義中。后組表達(dá)式不僅是概念標(biāo)識(shí)符的列表,它遵循一組規(guī)則,通過規(guī)則內(nèi)域(domain)和值集(range)定義SNOMED CT概念的方式(詳見本章第三節(jié))。

示例:“腹腔鏡緊急闌尾切除術(shù)”的后組表達(dá)式

盡管SNOMEDCT包含了概念|腹腔鏡闌尾切除|,但是也可以使用下面的后組表達(dá)式來表達(dá)這個(gè)臨床短語。·|闌尾切除術(shù)|:|優(yōu)先級(jí)|=|緊急,使用接入設(shè)備|=|腹腔鏡|

這個(gè)后組表達(dá)式與前組表達(dá)式|腹腔鏡緊急闌尾切除術(shù)|的含義完全相同。

前、后組表達(dá)式具有相同的含義,可以通過邏輯推理計(jì)算出來,因?yàn)椋?/p>

|腹腔鏡緊急闌尾切除術(shù)|是|闌尾切除術(shù)|的充分定義子類。

這兩個(gè)概念的定義屬性之間的唯一區(qū)別是增加了以下兩個(gè)屬性:

|優(yōu)先級(jí)|=|緊急|

|使用接入設(shè)備|=|腹腔鏡|

后組表達(dá)式的真正優(yōu)勢(shì)在于,即使SNOMED CT中沒有精確的前組概念,SNOMED CT也能表達(dá)臨床含義。

主站蜘蛛池模板: 板桥市| 额济纳旗| 馆陶县| 遂平县| 通城县| 五家渠市| 缙云县| 澎湖县| 厦门市| 利津县| 怀宁县| 宿松县| 金昌市| 通州市| 集贤县| 肥乡县| 上思县| 枣庄市| 怀柔区| 温宿县| 凉山| 弥渡县| 永新县| 台南县| 红安县| 高邑县| 城步| 凤冈县| 榆中县| 灵璧县| 勃利县| 竹北市| 朝阳市| 泸溪县| 简阳市| 富顺县| 清水县| 庄河市| 庄河市| 安远县| 海兴县|