- 結直腸癌標準數據集(2018版)
- 中山大學腫瘤防治中心 中國臨床腫瘤學會結直腸癌專家委員會
- 917字
- 2020-02-13 10:24:17
前言
結直腸癌是世界上最常見的惡性腫瘤之一,全球每年有超過60萬人死于該病 1。在中國,結直腸癌的發病率位列腫瘤發病率前5位,結直腸癌的治療已經成為我國腫瘤治療領域不容忽視的重要問題。隨著信息技術的飛速發展,醫學大數據已經在許多疾病的診斷和治療中發揮了重要作用。目前,國外已有包括美國的SEER多瘤種數據庫 2、歐洲的ACCENT 3結直腸癌數據中心等全球性的腫瘤大數據中心,這些醫學大數據平臺可以幫助醫生總結經驗,提升疾病的診治水平,達到精準治療的目的。但尚未有全國性的腫瘤學科單一病種的大數據中心。
而目前在全國治療結直腸癌的各個醫療機構里,雖然在中國90%的醫院在用,但是可及性和數據質量卻非最優 4。而不同醫院使用的商業化醫院信息系統提供者達300多家,數據結構和標準有所差異。且不同醫療系統通常也不需要交換數據。各自存儲著區域內結直腸癌患者的醫學資料,由于每個醫院的數據存儲方式各不相同,形成了一個個“信息孤島”,導致這些寶貴的醫學資料無法有效的整合利用。
在術語體系方面,雖然我國自2002年已采用了國際疾病編碼和國際手術編碼,但這兩大術語還不能覆蓋醫療記錄中所有臨床信息,而且目前較為廣泛采用的醫學系統命名法-臨床術語(SNOMED CT) 5、統一醫學語言系統(UMLS) 6、以及醫學語言、百科全書與術語命名通用架構(GALEN)等在中國并不使用。在今精準醫學飛速發展的年代,建立規范統一的標準術語體系、打破大數據時代的壁壘迫在眉睫。
CSCO結直腸癌專家委員會聯合國內結直腸癌領域領先的多家醫院,去年八月份由CSCO結直腸癌專家委員會徐瑞華教授、張蘇展教授和醫渡云技術有限公司牽頭成立“CSCO結直腸癌大數據中心”(BACC)。而通過醫渡云的數據平臺標準建設流程,將分散于不同醫院不同信息系統中的臨床信息通過數據采集、清洗、存儲、整合等步驟集成云端的數據中心。進而利用自然語言歸一技術、結構化和EMPI等先進的機器學習和人工智能技術,對結直腸癌的醫療數據進行規范集成、深度挖掘、綜合利用。
現中山大學腫瘤防治中心、CSCO結直腸癌專家委員會聯合醫渡云(北京)技術有限公司,基于相關術語規范、結直腸癌指南及專家共識等建立基于中國的結直腸癌標準數據集。為后續多項真實世界數據多中心研究筑基,共同構建及推進中國結直腸癌診療規范。
徐瑞華
2018年4月