- 數字資源存儲、倉儲和發布的標準規范建設
- 劉翔等
- 11字
- 2020-08-14 13:47:03
2.1 數字資源長期保存模型
2.1.1 OAIS數字資源長期保存概念模型
在數字信息逐漸成為信息生產和利用的主流介質的趨勢下,數字信息資源長期保存已成為數字圖書館和其他數字信息系統的戰略問題。數字信息長期保存,需要保護數字信息本身及相關技術、方法和工具,包括:保存數字比特流,保存數字格式與處理信息,保存數字信息處理環境,保存數字信息的驗證和管理機制,保存數字信息的組織利用環境。為了有效實施數字信息長期保存,還需要建立數字信息保護責任體系及相應的選擇標準,需要研究開發具體的數字信息更新、技術仿真和數據遷移技術與系統,開發描述數字信息長期保存要求和政策的元數據。然而,數字信息的易更改性、不穩定性、對軟/硬件環境的依賴性及其載體壽命的短暫性等,對數字信息的真實性、完整性、長期可讀取和可理解性構成了嚴重威脅。對于如何有效地長期保存數字信息,國際出版界、圖書館界、檔案館界、政府組織及相關研究機構都做了不懈努力。
OAIS是美國國家航空和航天局NASA與美國太空數據系統咨詢委員會(Consultative Committee for Space Data Systems, CCSDS)聯合制定的標準。該標準旨在對資源的存取和長期保存規定基礎概念和參考框架。這個參考模型(見圖2.1)闡述了檔案信息保存功能的全過程,包括加工、檔案存儲、數據管理、訪問和發布。它同時闡述了數字化信息向新媒體及格式遷移,表述了信息的數據模型,信息保存時軟件的角色,以及檔案間數字信息的交換。參考模型確定了存檔功能的內在及外在界面,確定了這些界面的很多高級服務。

圖2.1 OAIS數字資源長期保存概念模型
OAIS體系提出了數字信息資源長期保護所涉及的步驟、功能、信息單元和管理要求。
1.OAIS數字資源長期保存功能概述
(1)接收
接收指從生產者(或者從行政管理控制下的內部要素中)接收提交信息包(submission information package, SIP),并為檔案館的內容存儲和內容管理做好準備。功能包括:接受提交信息包;確保提交信息包的質量;遵照檔案館的數據格式和文件標準創造檔案信息包(archival information package, AIP);從檔案信息包中提取“描述信息”放入檔案館的數據庫,并使之隨著“檔案存儲”和“數據管理”而更新。
(2)檔案存儲
檔案存儲指為存儲、維護和檢索檔案信息包提供服務。功能包括:從“接收實體”接收檔案信息包,并將它們添加到永久存儲庫中;管理存儲體系;更新檔案資源的存儲媒體;進行例行的或專門的錯誤檢測;提供災難恢復功能;為滿足訂購要求而提供檔案信息包供用戶存取。
(3)數據管理
數據管理指為兩類描述信息提供保管、維護和存取服務。這兩類描述信息分別是:識別和證明檔案資源的描述信息;識別和證明行政管理數據的描述信息。行政管理數據是用來管理檔案館的。功能包括:管理檔案數據庫的功能;完成數據庫的更新;對管理數據庫的數據提供咨詢并形成反饋結果,最后使這些反饋結果形成報告。
(4)行政管理
行政管理指向檔案系統的所有工作提供服務。功能包括:就提交協議與信息生產者談判;審查提交的信息,確保它們符合歸檔標準;維護系統硬件和軟件的配置管理;提供系統監督功能,如監控和改良檔案館的運作,盤點和報告檔案內容,遷移或更新檔案內容;負責制定和維護檔案標準和政策;提供用戶支持;激活存儲請求。
(5)保存計劃
為監控OAIS環境和提供建議服務,目的是確保OAIS存儲的信息能夠長期被指定用戶群存取,即使原來的計算機環境已經過時。其功能包括:為遷移當前的檔案資源而評價檔案內容,并且定期建議更新檔案信息;為檔案標準和政策提供建議;監控技術環境的變化;監控指定用戶群的服務要求和知識庫的變化;設計信息包模板并提供設計幫助和檢驗,以使這些模板專門用于“提交信息包”和“檔案信息包”的特定提交活動中;設計詳細的遷移計劃、軟件原型和檢驗計劃,以實現“行政管理”的遷移目標。
2.OAIS數字資源長期保存信息模型
內容信息是OAIS作為最初保存目標的信息,它由內容數據對象和表征信息組成。內容數據對象包括物理對象和數字對象。物理對象是一種實實在在的、可以看得見的物體,它傳達了一種值得保存和分發的信息,且該信息能夠單獨使用。數字對象是由一組比特序列所組成的對象。
表征信息的目的就是要將比特流轉變成更有意義的信息。表征信息實現這一目的的方法是描述格式、數據結構概念,哪種格式或哪種數據結構用在了比特序列中,由此,使得諸如字符、數字、像素、數組、表格等更有意義。它由結構信息和語義信息組成。
除了內容信息外,檔案信息必須包含那種能在不確定的時期內,隨著時間的推移而理解內容信息的信息。具有這種功能的特殊的信息對象,合起來就被稱為“保存描述信息”。保存描述信息包括如圖2.2所示的幾類信息。

圖2.2 OAIS信息模型
(1)參考信息
參考信息是識別內容信息的信息。它確定一個或更多的機制,為內容信息提供指定的標識符。它還向外部系統(如分類系統、參考系統和注冊登記系統)提供標識符,使它們清楚地查閱特定的內容信息。在OAIS參考模型中,除了少數參考信息外,大部分的參考信息都將復制到封裝描述中,以方便用戶存取自己感興趣的內容信息。
(2)背景信息
背景信息是說明內容信息與它所處環境之間關系的信息,包括:為什么要創建內容信息,它與現存于其他地方的內容信息對象有什么樣的關系等。
(3)來源信息
來源信息是說明內容信息歷史的信息,包括:內容信息的起源或來源,內容信息產生以來所發生的任何變化,內容信息產生以來有些什么樣的人保管過它。
(4)固化信息
固化信息主要用于檢測數據的完整性,或證實關鍵碼,或檢驗關鍵碼,以保證特殊的內容信息對象免于被不明不白地改動。針對具體的內容對象,固化信息為之提供特殊編碼和錯誤偵察方案。固化信息并不包括完整性維護機制,是由OAIS的基礎服務部門提供的。
(5)封裝信息
封裝信息是一種實際存在的或邏輯存在的信息,它將信息包中的組成部分捆綁或聯系在一起,并在具體的媒體上形成一個可識別的實體。
(6)描述信息
描述信息是用來幫助用戶查找、分析并定購其感興趣的信息的。它通常來源于內容信息和保存的描述信息。
OAIS是一個包括人員組織、系統、存檔數據的整體,它的責任是保存信息并且為指定的團體提供服務。由于這個參考模型能夠對記錄進行精密的篩選、合理的歸檔、長久的保存與更新,同時該模型還符合ISO國標,從而為數字信息的長期保存提供了最基本的功能描述,以及一個共同的術語和概念框架。