官术网_书友最值得收藏!

第一節 醫學術語概述

一、醫學術語

醫學信息學領域,醫學術語對醫療信息化系統的重要性逐漸受到更多的重視。在過去的四五十年里,醫療信息化廠商在各自的系統里構建“字典”來解決對醫學術語的需求。當這種字典規模比較小的時候,問題不是很顯著;但當系統的功能和復雜性增加的時候,創建和維護統一的標準術語體系成為重中之重。例如,當電子病歷系統與醫學診斷專家系統協同工作的時候,為了實現二者的有效整合,需要自動化地將患者信息傳輸到專家系統。盡管兩個系統是由同一廠家開發的,電子病歷系統與專家系統術語體系的差別也會成為二者協同工作的障礙。

隨著大數據時代的到來,醫療健康已成為大數據應用的重要領域,醫療健康大數據可應用于疾病的輔助診斷、治療方案確定、流行病預測、藥物副作用分析、醫學臨床研究等諸多方面。在醫療數據處理過程中,各醫療機構之間甚至醫療機構內部存在嚴重的信息孤島問題,即各家醫療機構都在使用彼此不同的醫學術語體系以及不同的編碼體系。由于疾病描述的復雜性和醫生知識背景的差異,現實當中的醫生對于同一種疾病、同一種癥狀都可能采用不同的記錄方式,這樣記錄下來的醫學文檔中的醫療信息,無論是從形式上,還是從語義上,均會存在一定的歧義。在這種情況下,即使臨床信息匯聚到了一起也是難以有效聚合。概念表達缺乏語義規范,不僅為醫療大數據的整合帶來了障礙,也為醫療大數據的分析檢索,以及更高層次的醫療大數據應用帶來了障礙。在大數據時代,我們需要對醫學知識進行有效的、標準化組織,對其中的醫學信息進行有效標引,從而達到二次利用的目的。

術語(Terminology)是界定特定領域或學科中使用的概念的指稱及其定義的集合。術語是通過語音或文字來表達或限定科學概念的約定性語言符號,是思想和認識交流的工具。

術語具有以下特性:

1.專業性

術語是表達各個專業的特殊概念,所以通行范圍有限,使用的人較少。

2.科學性

術語的語義范圍準確,它不僅標記一個概念,而且使其精確,與相似的概念相區別。

3.單義性

術語與一般詞匯的最大不同點在于它的單義性,即在某一特定專業范圍內是單義的。

4.系統性

在一門科學或技術中,每個術語的地位只有在這一專業的整個概念系統中才能加以規定。

5.本地性

術語往往由本民族使用的文字構成的詞匯(包括一些詞素)構成。

醫學術語是指醫學領域使用的術語(名詞、醫學名詞),通俗講,醫學術語就是醫學領域各種醫學概念的標準化的表現形式。有了這樣的標準化表現形式,可以讓使用者(醫生或患者)在其頭腦中形成統一的認知。

經過多年的發展,有大量的醫學術語體系產生。表5-1列舉了目前國際上已經形成的一批受到廣泛認可、應用效果良好的醫學術語體系:

表5-1 多種醫學術語體系舉例

美國哥倫比亞大學James Cimino教授于1998年發表的文章[1]詳細介紹了構建醫學術語體系應該注意的12條準則。

1.內容的豐富性內容豐富度是最重要的評價因素之一,往往一款術語體系受到挑戰或者質疑也首先都是針對其內容不夠全面。

2.概念定位(concept orientation)即每個概念有且僅有一個臨床含義,且這個臨床含義也僅與一個概念相對應。

3.概念的永久性(concept permanence)當一個概念有了明確的含義,其必然的結果就是概念(即其臨床含義)本身不能隨意改變。概念的首選名稱可以不斷演變,概念也可以被設置為有效和失效,但其臨床含義是不變的。

4.無語義的概念標識符用一串數字來代表一個概念。一方面,可以節省一定的存儲空間;另一方面,當一個概念有多個同義詞時,用標識符來代表一個概念,可以方便地調整首選詞。

5.復合層級結構(polyhierarchy)即一個概念擁有多個父概念或者屬于多個分類。

6.形式化定義(formal definition)即概念表示為與詞表中其他概念的關系的集合的形式。例如肺炎球菌肺炎可以定義為“是一種”(is a)“肺炎”,且由“肺炎鏈球菌”所“引起”(caused by)。

7.回避“未分類概念”(not elsewhere classified,NEC)由于任何的詞表都不能保證涵蓋領域內所有內容,于是某些受控詞表采用未分類概念來表示無法用現有概念代表的臨床含義。使用未分類概念的問題在于,它不可能有形式化定義,同時隨著整個受控詞表的演變,“未分類概念”本身也在變化,會導致語義漂移問題。

8.多重顆粒度(multiple granularity)受控詞表的使用者在選取一個概念的時候頭腦中都會有一個特定的目的,為滿足這樣的目的,受控詞表中應該能夠擁有多種不同語義范圍的概念,從而滿足使用者的要求。

9.多重一致的視圖為滿足不同的應用需求,多種不同顆粒度的概念可以實現不同程度的聚合。

10.臨床語境(context)臨床語境與臨床含義對一個臨床過程或者臨床事件的描述都非常重要。充分挖掘和發揮電子病歷信息,需要有相應的內容來表達臨床語境。

11.適度地演進受控詞表不可避免地要隨著時間不斷演進。相應的變化需要用詳細且清晰地描述進行記錄其改變的內容和原因,從而使用者可以理解相應的變化。

12.識別冗余所謂冗余,即相同的信息可以用不同的方式進行記錄。冗余是不可避免的,例如同義詞,但需要防止相同的信息被不同的方式編碼(coded)。

醫學臨床術語系統化命名法(SNOMED CT)作為一種臨床術語,它的設計遵循了上述12條準則,本 章著重介紹SNOMED CT的基本原理。

二、SNOMED CT簡介

醫學臨床術語系統化命名法(systematized nomenclature of medicine-clinical term,SNOMED CT)是當前國際上廣為使用的規范化臨床醫學術語標準,最初由美國病理學會研制開發,2007年轉由國際醫療衛生術語標準發展組織(IHTSDO)負責維護和推廣,2017年初轉由SNOMED International負責其運營。SNOMED CT通過將臨床術語編碼化來實現全球醫療信息交換,能滿足臨床工作者、不同的利益相關者的多種多樣的需求。

(一)SNOMED CT結構框架

SNOMED CT是世界上最全面、多語言的臨床醫學術語產品,包含19個臨床領域,超過34萬個概念,在超過50個國家使用[2]。SNOMED CT的內容主要由概念、描述、關系三部分組成,并提供表達式、映射、參考集和擴展等機制以靈活的支持不同的應用需求,SNOMED CT結構框架如圖5-1所示。

1.概念

概念作為SNOMED CT的核心部分。每個SNOMED CT概念都代表一種獨特的臨床含義,并且具有唯一的數字標識符來標識。所謂臨床含義,即人們頭腦中對某一醫學概念的認知,例如左肺腫塊;標識則是對這一臨床含義的唯一代號,是一串無臨床含義的數字,主要為計算機計算和存儲目的而設立。SNOMED CT的概念均以層級結構進行組織,形成一種有向無環圖(directed acyclic graph),這樣的方式可以讓所有的概念按照其所代表的臨床含義的顆粒度大小進行組織和排列[3]。圖5-1中概念的顆粒度(代表的臨床含義范圍)從左到右逐漸變細,同時表達的臨床含義也逐漸更加精準。有關SNOMED CT概念的詳細介紹,詳見本章第二節相關內容。

2.關系

SNOMED CT中的關系是兩個概念之間的聯系,并且用計算機可以處理的方式對概念的含義進行邏輯定義[3]。早期的SNOMED CT版本中,關系類型包括如下類型。

(1)定義關系:

定義了描述概念所需的必要條件,包括如下兩種類型:①子類型關系(is-a relationship);②屬性關系(attribute relationship)。

(2)非定義關系:

定義了描述概念所需的非必要條件,包括如下三種類型:①修飾關系(qualifier relationship):包括一些修飾詞,如有關疾病輕重程度(mild、severe)、發病緩急程度(acute、subacute)等;②演變關系(historical relationship):表示概念的演進變化;③補充關系(additional relationship)。

SNOMED CT本身也是在不斷的發展和變化中,最新版的SNOMED CT官方版本中主要使用定義關系,非定義關系已經失效,這一點提醒讀者注意。有關SNOMED CT關系的詳細介紹,詳見本章第二節SNOMED CT相關內容。

圖5-1 SNOMED CT框架設計

3.描述

為了讓概念更容易理解,每一個概念都會有一套與之對應的描述(description)。在每個語言版本中,每個概念至少有兩個描述,一個(些)是完全指定名稱(fully specified name),另一個(些)是可接受名稱(acceptable name),后者解決了同義詞的問題。有關SNOMED CT關系的詳細介紹,詳見本章第二節相關內容。

4.屬性

屬性(Attribute)也可稱為關系類型(relationship type),用來代表概念含義的某一方面特征。

5.標識

標識是一個唯一的代表SNOMED CT組件(包括概念、關系和描述)的數字。標識分為短格式和長格式,見圖5-2。

圖5-2 SNOMED CT標識,包括短格式標識和長格式標識

(1)短格式:

適用于由SNOMED International維護的國際版本(international release)中的組件。條目標識是隨機產生的一串無臨床含義的數字。分區標識用來區分該組件的類型,“00”代表此組件為概念;“01”代表此組件為描述;“02”代表此組件為關系。

(2)長格式:

適用于SNOMED International以外的機構維護的版本中的組件。與短格式的區別在于長格式中增加了用于區別不同的結構的命名空間標識(namespace identifier)。長格式的分區標識不同于短格式,“10”代表此組件為概念;“11”代表此組件為描述;“12”代表此組件為關系。

無論是長格式還是短格式,最后一位都為校驗位。SNOMED CT使用Verhoeff's Dihedral Group D5校驗法,以保證系統完整地接收了這個標識。

需要強調的是,SNOMED CT作為一款臨床術語,其標識采用了“無臨床含義”的編碼方式,即無論是長格式標識,還是短格式標識,其條目標識均是一組隨機數字,與該標識所代表的臨床含義無任何關聯。分區標識僅代表該概念是哪一種類型的組件,這一點明顯區別于分類體系(如ICD)。

6.層級結構

SNOMEDCT中根概念為|SNOMED CT con c ep t |,所有其他的概念都是根概念的子類 型(subtype),即根概念是所有概念的超類型(supertype)。根概念的直接子概念叫作頂層概念(top-level concept),頂層概念是層級結構的主要分類,它以及它所屬所有的子概念形成了SNOMED CT層級結構中一 個個主要分支。如圖5-1所示,SNOMED CT一共有19個頂層概念,詳細介紹請參見本章第二節相關內容。

(二)SNOMED CT應用領域

SNOMED CT通過提供語義豐富的臨床術語來滿足各種應用需求。

1.參考術語、界面術語和本體

(1)參考術語:

是用來對某一領域的知識準確和完整地呈現,包括實體、其所代表的含義以及實體間的相互關系。每個概念都有正式的計算機可讀的定義,從而支持數據整合和檢索。

(2)界面術語:

可以進行數據的錄入,可以讓臨床醫生系統化地對患者信息標準化的錄入計算機系統,它是臨床醫生相對口語化的描述與計算機系統底層的參考術語之間的橋梁。

(3)本體:

是根據領域概念的本質和相互關系,通過構建領域概念之間的層級關系,對某一領域的知識進行結構化的組織。SNOMED CT是一種按照本體方式構建的醫學術語體系,它既可以作為參考術語,也可以作為界面術語使用[4-7]。

2.電子病歷

SNOMED CT作為術語詞典支持電子病歷后結構化處理和存儲、輔助醫生醫囑錄入、語義檢索[8-10]

3.臨床決策支持

輔助生成診斷方案、創建醫療警報如藥物過敏等供醫生臨床診斷[11-16]。

4.醫療數據互操作

SNOMED CT作為編碼系統應用于各醫療機構,促進醫療數據互操作[17-19]。

5.統計分析

基于SNOMED CT語義豐富臨床概念及多層級結構提供更準確的統計分析報告[3]

(1)個體分析:

SNOMED CT可以通過構建病史小結、決策支持和就診報告的方式對醫療個體提供數據分析方面的支持。

1)病史小結:

患者的就診通常會發生在多家醫療機構;即使在同一家機構就診,也會有多次就診、多種醫療系統/設備間數據整合的問題。SNOMED CT可以作為一種通用的參考術語,對不同的術語體系進行交叉映射;同時,SNOMED CT的復合層級結構和描述邏輯可以支持概念整合。

2)決策支持:

臨床輔助決策支持系統(CDSS)可以幫助醫生在進行個體照護或治療時,提供對醫生給出的治療或者照護方案與指南、臨床路徑等標準化的治療方案進行比較的功能,從而幫助醫生快速、高效地服務于患者。SNOMED CT可以在CDSS中發揮重要作用。

3)就診報告:

無論是在診前、診中、診后等各個環節,臨床醫生都需要向患者提供診治報告。SNOMED CT的復合層級結構及豐富的與其他術語體系的交叉映射能力,可以實現數據的“一次收集、多次復用”,從而在就診報告環節提供幫助。

(2)群體分析[3]

SNOMED CT對群體分析的支持包括:首先,憑借SNOMED CT廣泛的醫學概念的覆蓋,能夠對臨床細節進行充分描述,從而實現臨床數據的準確采集;其次,作為參考術語,實現分散數據來源的數據整合。同時,憑借其豐富的同義詞、層級結構以及基于醫學邏輯的概念定義,SNOMED CT可以支持語義搜索。

1)趨勢分析:

是一種收集一定量不同時間點的信息,去除信息中的噪聲,以期發現信息內部趨勢的分析方法。這會用到SNOMED CT的復合層級結構、概念模型以及包含關系。

2)藥物警戒性:

收集、檢測、評估、監控和預防在使用藥物過程中所發生的副作用。這會使用到復合層級結構、定義關系進行概念聚合;同時,也會與MedDRA進行相互映射。

3)臨床審計:

通過系統性回顧診療過程與相關診治標準的一致性,從而提高患者診療以及相關臨床結局。這會使用到復合層級結構、定義關系進行概念聚合,以及與其他編碼系統進行相互映射。

(3)臨床分析:

臨床分析是醫學中對藥物、設備、診斷性產品及治療方案在人體使用中的安全性和有效性的研究,可以對疾病進行預防、治療和診斷。與治療方案在臨床實踐不同的是,臨床研究主要是收集臨床證據,以擴展相關人員對新型治療或者患者管理方案的了解,從而明確治療或者管理方案的價值。

(4)語義搜索:

隨著大量的醫學文獻和臨床報告的產生,基于臨床含義的搜索變得越來越重要。自然語言處理技術的一個主要應用就是對自由文本中的信息建立索引,從而可以進行“主題相關”的搜索。其中的挑戰在于需要超越以往的關鍵詞搜索策略,讓搜索結果具有很高的敏感性和特異性。例如:“請搜索系統中所有肺部疾病的患者”或者“請顯示系統中所有心率異常的患者列表”。

(三)SNOMED CT的受益對象

SNOMED CT在醫療領域的不同應用,醫療領域的各個參與者都是受益者。

1.患者

標準化并共享個人健康檔案及電子病歷,減少重復檢查和治療,提高個人診療效果。

2.民眾

通過數據共享提高民眾疾病監測水平及疾病預防能力。

3.臨床醫生

輔助醫生臨床診斷,減少誤診情況。

4.醫療機構

優化醫療機構資源分配。

5.政府及研究機構

基于SNOMED CT提供更精確的統計分析報告及研究報告。

三、SNOMED CT與ICD

(一)ICD發展與簡介

國際疾病分類(international classification of diseases,ICD)是WHO制定的國際統一的疾病分類方法,它根據疾病的病因、病理、臨床表現和解剖位置等特性,將疾病分類,使其成為一個有序的組合,并用編碼的方法來表示的系統。ICD已有120多年的發展歷史,早在1891年為了對死亡進行統一登記,國際統計研究所組織了一個對死亡原因分類的委員會進行工作,1893年該委員會提出了一個分類方法《國際死亡原因編目》,此即為第1版。以后基本上10年修訂一次,ICD-10是現在全世界通用的版本。2018年12月,基于本體模型的ICD-11問世,我國已開始著手準備使用這一最新版本。

(二)SNOMED CT與ICD-10

表5-2 SNOMED CT與ICD-10對比

作為疾病統計、匯總及分析的重要工具,ICD-10在各個國家都起到了非常重要的作用。大數據時代,“沉睡著”的大量電子病歷中結構化和非結構化的臨床信息需要進行“帶有臨床含義的二次利用”(meaningful reuse),這需要一套具有豐富的臨床語義關系的術語體系來實現。從表5-2的對比可以看出,SNOMED CT與ICD在使用場景、使用者、概念范圍、顆粒度及分類方式方面,均有很大的不同,醫療信息化從業者在進行臨床大數據分析及利用時需要正確選擇。

續表

主站蜘蛛池模板: 桃源县| 安吉县| 新蔡县| 沁阳市| 康乐县| 张家口市| 临桂县| 贵德县| 大城县| 大安市| 汶上县| 天等县| 久治县| 澄江县| 城步| 乌海市| 铜山县| 白山市| 买车| 阿克陶县| 南陵县| 汉寿县| 大冶市| 彭阳县| 施秉县| 健康| 濮阳市| 登封市| 苍梧县| 南汇区| 壶关县| 卓尼县| 湘乡市| 和龙市| 大竹县| 江门市| 凤台县| 察雅县| 永定县| 玉溪市| 新疆|