- 結直腸癌標準數據集(2018版)
- 中山大學腫瘤防治中心 中國臨床腫瘤學會結直腸癌專家委員會
- 755字
- 2020-02-13 10:24:17
數據集說明
1.結直腸癌標準數據模塊

結直腸癌標準模塊v1.0
結直腸癌標準數據模塊參考國家電子病歷及信息化行業標準,以及最新結直腸癌領域診療指南,與中山大學腫瘤防治中心結直腸癌專家共建而成。全數據集共集成22個標準模塊,510個數據元。數據集由模塊名稱、參考標準、模塊序號、數據元名稱、值域及數據加工類型組成。其中:
數據元:每個模塊下面包含詳細的字段。如“人口學信息”數據模塊包含姓名、性別、年齡、民族等多個字段。
參考標準:主要參考國際國內術語標準如ICD10,ATC LONIC等,電子病歷規范(HL7 CDA)以及國際及國內疾病標準指南(AJCC,RECIST,NCCN,CSCO) 9-30。
值域:參考主要指南標準及兼顧結直腸癌專家實用性出發的值域作為主要的歸一標準。
數據加工:根據數據來源及數據上層加工處理,數據加工主要分三類:①分別直接映射存儲規范的數據,如檢驗數據。②需要通過結構化和歸一算法,將大段自然語言處理為標準字段和閾值,并可進行統計分析,如AJCC分期-臨床分期。③同一個患者需要根據多份病歷或多次結果,多系統來源結果及有時間邏輯的進行多種形式的關聯和復雜邏輯計算,如術后病理來源于手術系統及病理系統不同時間的換算。數據加工根據每個場地數據源情況改變,如一些表單已存在前結構化表單,后續數據加工方法則更改為直接映射。
2.數據集更新機制
CSCO結直腸癌大數據中心定期根據指南標準,結合實際數據來源,數據填充率及值域范圍進行數據集模塊及數據集進行定期更新。更新包括更新時間、更新版本、修訂內容及修訂原因。相關標準數據集及其更新版本發布于CSCO大數據中心及參與大數據中心各成員結直腸癌專病庫。
3.數據集及標準模板使用權限(版權)
版權及相關商標歸中山大學腫瘤防治中心、結直腸癌大數據中心(BACC)及醫渡云(北京)技術有限公司所有;只能用于參與大數據中心各成員結直腸癌專病庫。使用本品須上述各方同意,違者必究。