官术网_书友最值得收藏!

1.2 跨領域信息交換面臨的問題及解決方法

1.2.1 跨領域信息交換面臨的問題

跨領域信息交換的實現并不是簡單地將信息從甲傳到乙,還會涉及平臺異構、分布性、自治性、安全性等很多方面的問題,具體如下。①平臺異構問題。平臺異構表現為各業務信息系統所采用的數據庫管理系統、操作系統、網絡環境等不同,因此要求信息交換格式、交換協議具有跨平臺性。②分布性問題。業務領域信息系統往往分散地存在于不同的地理位置,需要利用網絡環境來傳輸數據,因此跨領域信息交換的性能易受到網絡的傳輸機制、性能、網絡安全等因素的影響。③自治性問題。跨領域信息交換不能妨礙原來各業務領域信息系統的運行,需要保持原信息系統的自治性,信息交換要能適應原信息系統的變化,這對信息交換的魯棒性提出了挑戰。④安全問題。由于信息系統可能歸屬于不同的組織機構,每個信息系統都具有不同的安全保障手段,在跨領域信息交換時要保證不破壞原信息系統的安全機制,實現對數據源訪問權限的隔離和控制。另外,各個業務領域數據的安全等級可能不同,數據訪問控制的粒度也不一致,各個系統用戶的權限也不同,因此需要采用靈活的安全訪問控制策略。

除上述問題以外,不同的信息系統和不同的實現人員對客觀對象的認識差異和應用需求差異,導致信息系統對處理對象的理解、描述、記錄、運用等方面的差異,不可避免地造成數據異構,主要表現為數據的語義不統一、格式不一致、編碼方式不同、數據模式也不同。

1.模式異構

模式異構主要是由于業務信息系統數據庫邏輯結構不同或者數據元的不一致造成的。①名稱異構。不同的概念采用同樣的名稱,同樣的概念采用不同的名稱,即同名異義、同義異名。例如,電子郵箱地址,可能用“E-mail”,也可能用“郵箱地址”為名稱。②實體標識異構。同樣的對象不同的標識。例如,同一個人在不同的系統中采用不同的方式標識,一個系統用“身份證號碼”標識,另一個系統用“工作證號”標識。③概念描述結構異構。同樣的概念采用不同數量的屬性來描述。例如,“人員”在不同的系統采用不同數量的屬性描述。④概念范圍異構。同樣的概念具有不同的外延范圍。例如,一個法律機構在一個數據模型中可以描述為一般的“組織機構”,而在另一個數據模型中描述為“注冊的組織機構”。⑤聚合程度異構。一個系統的數據模型采用多個屬性描述,另一個系統的數據模型聚合為一個屬性描述。例如,“單位地址”在一個數據模型中用“省份”“城市”“區”“街道”等多個屬性共同描述,而在另一個數據模型中將這幾個屬性組合為一個詞匯“詳細地址”。⑥結構異構。一個數據模型中某個實體的一系列屬性在另一個數據模型中用不同的結構組織。

2.數據表示異構

數據表示異構是指對同樣語義的數據采用多種不同的表示和描述方法。①數據值異構。同樣的值表示不同的含義,或者同樣的含義用不同的值表示。比如,“性別”可能有不同的代碼列表。②數據格式異構。同樣的數據采用不同的格式表示。比如,時間可能用“DMY”“MDY”“YMD”等不同方式,日期中的符號可能用空格、逗號、句點、撇號表示。③數據度量單位異構。數據用不同的度量單位表示。數據可能用米制計量單位度量,也可能用英制或其他計量單位度量。④數據精度異構。數據使用不同的精度表示。比如,成績等級可能用“A”“B”“C”3個等級表示,也可能用“很好”“好”“中等”“差”“很差”5個等級表示。

1.2.2 跨領域信息交換實現的基本思路

根據跨領域信息交換面臨的問題分析可知,針對跨領域信息交換中的平臺異構、分布性、自治性和安全等問題,可以采用面向服務的軟件架構、XML和安全技術解決,但是數據異構性一直是困擾人們解決信息共享的難題。

針對數據異構性問題,實現信息交換的基本方法是采用協議轉換,即將數據源協議數據包轉換為目標協議數據包。由于信息系統的業務復雜性和業務需求發展變化等因素,我們難以完全統一定義每個業務系統的信息語義,難以用固定的映射模式來完成數據的轉換。為了解決跨領域信息交換中數據異構性問題,人們提出了語義互操作方法。

語義互操作是在統一的語義環境下,利用語義技術建立不同信息系統間對數據的一致語義理解,實現自治和異構系統的互操作。語義互操作就是要解決信息系統交互過程中語義異構性的問題,也就是解決信息共享時信息的語義沖突問題,保證信息系統交互過程中信息的準確性、語義的完整性。通用的語義異構性消除策略是,建立公共的數據參考模型作為異構信息源的語義形式化模型的中間模型,完成異構信息源語義形式化模型的轉換,從而避免異構信息源點對點信息交換模式的冗余轉換,將語義異構性消除問題的解決方案復雜度從N2級轉到N級[5],如圖1-2所示。

img

圖1-2 基于語義互操作的跨領域信息交換和傳統的點對點信息交換模式對比

1.2.3 跨領域信息交換實現方法

跨領域信息交換是信息化時代各個國家和地區面臨的普遍問題。為了實現跨領域信息交換與共享,美國、歐盟、北約、日本、中國等國家和組織都提出并實施了基于語義互操作的跨領域信息交換與共享解決方案。

1.美國國家信息交換模型

美國國土安全部和司法部共同實施的國家信息交換模型(National Information Exchange Model,NIEM)[1]是實現跨領域信息交換語義互操作的典型方法。基于NIEM實現跨領域信息交換的基本思路如圖1-3所示[6],包括以下幾個主要環節。

img

圖1-3 基于NIEM實現跨領域信息交換的基本思路

(1)建立NIEM數據模型標準。

首先,對各個業務領域和部門的信息交換與共享需求進行分析,提煉出通用的數據類型[如時間(When)、地點(Where)、人物(Who)、事件(What)],形成核心數據模型;然后,各個業務領域對核心數據模型進行引用、裁剪、擴充,形成反映自身業務特點和業務領域信息共享需求的業務領域數據模型;最后,將核心數據模型、業務領域數據模型、各領域的數據編碼標準,采用開放、可擴展的XML Schema或JSON進行結構化表示,建立NIEM數據模型標準,形成信息系統相互理解和認識的“五線譜”。目前,NIEM 5.0[2]定義了3979個數據類型、12182個數據元素和90297個代碼值。

(2)建立面向應用的信息交換模型。

信息交換雙方的開發人員和終端用戶對信息交換需求進行分析,通過引用、映射NIEM數據模型,建立滿足應用需求的、交換雙方一致認可的、面向應用的信息交換模型。

(3)生成信息交換包(IEP)。

信息交換包是信息交換雙方交換的實際消息,攜帶交換的數據。信息提供者將待交換的數據根據信息交換模型生成信息交換包(Information Exchange Package,IEP),并封裝為消息,傳遞給信息接收方(信息使用者);信息接收方在接收到信息交換包后,根據信息交換規范對信息交換包中的數據進行解析,實現對數據的理解,達到信息交換的目的。

綜上所述,運用NIEM實施信息交換,每個參與系統只需要將自己的數據遵循NIEM數據模型和信息交換規范發布出來即可,這樣每個參與系統僅需要與信息交換平臺建立一個連接點,當新的參與者加入信息交換平臺時,也不需要對已有系統進行修改。另外,數據轉換接口不會像傳統的點對點信息交換模式隨著系統數量的增加而顯著增加,不需要整合各組織機構的數據庫,也不需要重構或修改已有的信息系統。

2.歐盟電子政務核心詞匯表

根據《歐盟共同條約》規定,歐盟的內部市場要保證28個成員國之間的4項自由,即商品、資本、服務和人員的自由流動。例如,各國分支機構的注冊、在另一個國家申請業務許可、得到出生證明等。隨著現代科學技術的不斷進步和世界經濟全球化的發展,在歐盟,公民、企業、政府機構跨國界的生活、工作和業務往來日益增多,各成員國之間的信息交互與聯系更加密切,歐盟4項自由的實現更加依賴于能相互自由連接、互操作的網絡技術。

日益增多的跨國界的業務活動需要跨國界的公共服務支持,要求歐盟行政機構、商業企業、公民(Administrations, Business and Citizens)之間具有高效的互交互能力,即歐盟行政機構與成員國政府行政機構之間(A2A)、各成員國政府行政機構之間(A2A),以及政府行政機構與商業企業之間(A2B)、政府行政機構與公民之間(A2C)具有高效、可靠的互操作能力,以實現高效的跨邊界無縫數據交換與共享,從而節省公共服務時間、降低公共服務成本,提高公共服務透明度和服務質量,如圖1-4所示。

img

圖1-4 歐盟互操作的類型

但是,由于各成員國行政管理過程和法律方面的不一致,以及缺乏統一的數據模型和通用參考數據等,歐盟在執行公共服務時會產生許多語義互操作沖突問題。為了解決這些沖突問題,確保歐盟行政機構、商業企業和公民之間的互操作性,歐盟委員會于2010年1月至2015年12月實施了《歐洲公共管理、企業和公民互操作方案》(Interoperability Solutions for European Public Administrations, Businesses and Citizens,ISA),于2016年1月至2020年12月實施ISA2計劃,投入1.31億歐元推進歐洲電子政務發展,重點支持電子政務領域的通用工具、通用服務和通用框架的開發,電子政務核心詞匯表是ISA和ISA2計劃的重要內容之一。

ISA2數據模型包括3個層次:核心數據模型、業務領域數據模型和信息交換模型。核心數據模型和業務領域數據模型與NIEM核心域和業務域相對應,信息交換模型類似于NIEM中的信息交換包文檔IEPD,如圖1-5所示。其中,核心數據模型即電子政務核心詞匯表(e-Government Core Vocabularies),由6類通用的、可重復和擴展的、獨立于具體業務領域的數據模型標準組成,如表1-1所示,目前2.0.1版定義了219個詞匯和18個數據類型。核心詞匯表采用基于UML的概念模型、RDFS等方法進行描述。

核心詞匯表的主要應用包括信息交換、數據交換、開放數據發布和新系統開發,其組成及應用詳見本書第9章。

img

圖1-5 核心數據模型、業務領域數據模型和信息交換模型的關系

表1-1 歐盟電子政務核心詞匯表

img

(續表)

img

3.北約聯合作戰信息交換模型

北約(NATO)多邊協作項目組(Multilateral Interoperability Program,MIP)是由24個成員國自發組織的軍事標準化機構。MIP所開發的信息模型(MIP Information Model,MIM)是指揮控制領域的一個通用的語義模型,是指揮控制領域信息交換建模的語義基礎,目標是提高北約指揮和控制信息系統(Command and Control Information Systems,C2IS)的國際互操作性。

MIM是在聯合指揮控制信息交換數據模型JC3IEDM 3.1(Joint C3 Information Exchange Data Model,JC3IEDM)基礎上發展而來的。MIM對“Object”“Action”“Metadata”等基本概念,提供了豐富的軍事語義定義和分類,包括310個業務規則、326個實體(類)、873個屬性、394個關聯關系和400個數據編碼,具有可讀性、模塊化、可擴展性、語義嚴格性和模型一致性等特點,主要實體之間的關系如圖1-6所示。

img

圖1-6 MIM主要實體之間的關系

MIM描述的內容包括戰場空間所存在的物體,包括物體的特征、狀態、位置,它們之間的相互關系、地址及其他特征,以及這些物體在戰場上的活動。經過不斷發展完善,MIM已應用于北約成員國指揮控制領域的信息交換共享中。基于MIM的信息交換原理如圖1-7所示,北約成員國指揮控制信息系統依據MIM數據模型標準將對外交換的數據映射為統一規范語義的交換數據,形成統一理解的通用作戰態勢圖,從而實現不同成員國指揮控制信息系統之間的數據交換與共享。

img

圖1-7 基于MIM的指揮控制信息系統之間的信息交換示意

4.日本多層互操作通用詞匯表

2017年5月,日本政府發布了“推動公共和私營部門數據利用的先進信息技術國家基本計劃”——日本新IT戰略。這個計劃的目的是促進數據在數據所有者之外無縫流動,以推動基于數據的新服務、創新和改革。在此之前,日本地方政府機構發布數據是任意的,按照日本新IT戰略要求,日本政府機構和地方政府必須公開發布數據以便充分利用。

多層互操作框架(Infrastructure for Multilayer Interoperability,IMI)是日本新IT戰略的一部分,作為一個面向數字政府和政府數據開放的互操作框架,為數字政府實現基于標準的術語詞匯表的信息共享和利用提供支撐環境。IMI通用詞匯表是IMI的一部分,旨在提供一種統一共享術語含義和術語之間關系的機制,提高開放數據、電子政務數據及私有數據的互操作性。IMI通用詞匯框架以美國NIEM為參考模型開發,包括核心詞匯表、領域詞匯表和應用詞匯表,如圖1-8所示。核心詞匯表主要描述基本的概念。目前,在IMI通用詞匯框架2.4.2版本中,還沒有構建領域詞匯表,主要是因為在政府內部建立一個標準化流程構建業務領域詞匯表有一定難度,將來可以在同一個業務中應用詞匯形成業務領域詞匯表。應用詞匯表是核心詞匯表和業務領域詞匯表不能涵蓋的詞匯集合。IMI通用詞匯框架(2.4.2版本)包括大約60個類詞匯、250個屬性詞匯,采用RDF、XML Schema、JSON描述語言表示。IMI通用詞匯框架的主要詞匯如表1-2所示,IMI通用詞匯組成及應用詳見本書第8章。

img

圖1-8 IMI通用詞匯框架

表1-2 IMI通用詞匯框架的主要詞匯[3]

img

5.中國國家信息交換模型

中國電子科技集團有限公司(簡稱中國電科)承擔了大量國家電子政務、智慧城市和新型基礎設施建設任務,深刻認識到跨領域信息交換是國家信息化工程的普遍需求和核心內容。為提高各領域信息系統之間的互操作能力,推動相關國家標準研究和制定,助力國家信息化建設,2019年1月中國電科啟動了中國國家信息交換模型(China Information Exchange Model,CIEM)項目[4],致力于研制符合中國國情的信息交換模型。

CIEM采用XML Schema表示,模型架構包括邏輯模型層和概念模型層,如圖1-9所示。邏輯模型層提供客觀世界的事物及概念數據化表示的規范方式;概念模型層提供數據語義的統一定義。CIEM的分層架構有利于建模任務的解耦,基于客觀的科學原理構建穩健的邏輯模型,基于演進的業務認知構建動態的邏輯模型,確保模型對業務發展的適應性。

img

圖1-9 CIEM架構

邏輯模型層由參考系、坐標系、值類型和度量單位構成。參考系是對客觀世界事物及概念數據化(測量或者記錄)時所需的參照物,如測量時間概念的協調世界時、測量位置概念的大地測量參考系等。坐標系是對客觀世界事物及概念數據化時所需的坐標系統,如笛卡兒二維坐標系、球坐標系等。值類型是表示客觀世界事物及概念數據化結果的數值類型,如整數、實數、文本等。度量單位是表示客觀世界事物及概念數據化結果的計量單位,如表示時間的秒、表示距離的米等。通過它們的標準化,CIEM概念的數據化結果的含義及表示方法被精準確定,便于信息系統對客觀世界事物的一致性理解。

概念模型層由基本元素和復合元素構成。基本元素包括可觀測量和信息元素,并通過邏輯模型層實現對客觀世界事物及概念的一致表示和描述。可觀測量是通過物理、化學或數學等方法測量后實現數據化的概念,如質量、溫度等。基本元素是通過文字記錄實現數據化的概念,如姓名、編號等。復合元素以對象(Object)和關聯關系(Association)為基本類型,采用組合、繼承、擴展等數據類型派生技術,構成了核心域數據模型和業務領域數據模型。CIEM的對象(Object)類型包括人、地、物、組織機構和文檔五大類,關聯關系(Association)類型涵蓋這五大類之間所有的兩兩關聯關系。

主站蜘蛛池模板: 资源县| 大邑县| 富宁县| 鹤庆县| 通河县| 务川| 沐川县| 会东县| 曲沃县| 庆云县| 吕梁市| 龙门县| 湟中县| 巴青县| 奇台县| 腾冲县| 莒南县| 福安市| 太白县| 河北省| 静宁县| 罗定市| 遂川县| 扬州市| 双流县| 资溪县| 东乡族自治县| 上杭县| 双桥区| 太原市| 孟连| 互助| 政和县| 通州区| 江山市| 临潭县| 林西县| 曲松县| 甘肃省| 荥经县| 玛曲县|