- CADAL數字圖書館知識標準規范及應用研究
- 劉柏嵩
- 998字
- 2020-02-26 16:05:23
第3章 知識元抽取
隨著互聯網的飛速發展,人們每天創造著海量的信息。現有的知識組織方式組織的是知識的載體——文獻,而非知識本身,只能保證檢出的文獻含有所需知識,并不能揭示這些知識之間的聯系,即不能檢索出潛在的知識。在數字圖書館信息檢索的服務系統中,可以通過標題、關鍵詞、作者、內容分類特征等元數據進行關聯檢索,然而我們從檢索出來的結果中并不能直接得到要解決問題的知識,即不能全面、快速、準確地為用戶提供解決問題的知識信息。對于學術研究者而言,從海量文獻中查找其研究領域相關文獻的過程已讓他們顯得比較疲憊,若是再從搜取的文獻中繼續篩選出對其學術研究有幫助的知識,則需繼續花費大量精力。因此,從信息檢索的角度來看,知識信息的基本單位急需由以文獻為單元演變到以知識元為單元,從而使得知識元的抽取工作成為非常有意義的事情。
通過從文本中抽取知識元,使文本知識的控制單元深入知識元和知識元間的鏈接與共享,實現文本知識的增值轉化,是信息服務向知識服務過渡的一種有效方法。對于海量的學術資源,若知識的控制單元由文獻深化到知識元,把文獻分解為一個個獨立的知識元,這樣一方面便于存儲與查找,用戶可以直接查找知識元,以創造新的知識,并加速知識的創新,另一方面將會揭示文獻中包含的知識元及相關領域之間的鏈接關系,從而產生新的知識單元,實現知識的增值轉化,同樣能加速知識創新的速度。知識元的研究,對推動人類對知識的利用以及對新知識的創造的進程有著至關重要的作用。另外,海量學術資源的知識元研究,為知識管理中處理知識方法的研究開辟了新思路。知識管理就是通過對確定有效的知識單元進行處理以達到知識服務、知識發現和知識創新的目的。知識元作為知識單元的組成個體單元,以此學術文獻就可表示為一個知識單元,其知識結構涉及多個知識元,這樣對學術資源的處理對象將由文獻深入知識元,更有助于推動處理、組織、發現及利用學術資源知識的方式的轉變,如知識表示、信息檢索及學科標引等,可以更有效地對知識單元進行處理。同時通過知識元鏈接,可實現對文獻信息深層次的挖掘,將信息的組織深入知識層次,對知識管理、知識服務產生深刻的影響。圍繞知識元進行的相關研究工作,對實現人類知識的有效組織、有效閱讀、有效使用具有一定的理論意義和實踐意義。
總而言之,結合學術資源開展研究知識元的工作意義重大,而知識元抽取作為研究學術資源知識元的基礎工作,同樣具有很重要的意義。