2.2.4 網(wǎng)絡信息分類
1.網(wǎng)絡信息分類的原則
網(wǎng)絡信息資源的分類體系是根據(jù)網(wǎng)絡信息以及用戶的檢索需要而設置的,與紙質(zhì)文獻信息相比,網(wǎng)絡信息分類有其不同的原則。
(1)直觀性。網(wǎng)絡信息是網(wǎng)站為了用戶的檢索而設立的,其類目設置不宜層次過多,必須體現(xiàn)信息分類的直觀性,讓用戶對其結構一目了然。
(2)實用性。網(wǎng)絡是面對用戶的信息集合,所用的類名一般使用用戶熟知的自然語言,類目層次少,結構簡單易記,以便快速查找。
2.網(wǎng)絡信息分類法的構建
經(jīng)過近20年的發(fā)展,國內(nèi)外互聯(lián)網(wǎng)在網(wǎng)絡信息分類構建方面取得了一定的經(jīng)驗,主要有:
(1)按需設類,突出重點,便于瀏覽。網(wǎng)站圍繞用戶的使用習慣而設立類目,對于與主題無關的欄目則刪除或不立。網(wǎng)站對于欄目的設立并不完全根據(jù)紙質(zhì)文獻信息類目層次的設置邏輯,而更多根據(jù)信息量和訪問頻率。網(wǎng)站始終強調(diào)把最有價值的內(nèi)容放到突出位置,把訪問頻率最高的欄目置于最醒目位置。
(2)以傳統(tǒng)分類主題為基礎,構建多維分類體系。在傳統(tǒng)文獻信息分類法基礎上,根據(jù)用戶瀏覽習慣,建立多維分類模式。比如,為了突出重點類目,可以在多個母類下重復出現(xiàn)這一重點類目,一個母類也可以采用多種標準進行劃分。這一做法正是互聯(lián)網(wǎng)本身超鏈接優(yōu)勢的體現(xiàn)——用戶可以從多個入口訪問。
(3)分類主題一體化,網(wǎng)絡信息分類的著眼點是用戶的信息利用需求,因此在類目設置上必須考慮信息分類法與主題詞表的結合,體現(xiàn)分類主題一體化的融合趨勢。
3.網(wǎng)站分類實例
(1)Yahoo!雅虎是最著名的網(wǎng)絡分類網(wǎng)站,創(chuàng)建于1994年,對其后創(chuàng)建的網(wǎng)站在信息組織上有較大的影響,成為各大門戶網(wǎng)的效仿對象。雅虎的信息分類并非一成不變,早期收錄較多的學術信息,而目前則側(cè)重于娛樂和生活方面,主頁上的信息按主題分為19個類目:news、sports、finance、weather、autos、fantasy、shopping、makers、parenting、health、style、beauty、politics、movies、travel、tech、TV、celebrity、games。
(2)網(wǎng)易,也是一個分類主題一體化的網(wǎng)站,設有新聞、財經(jīng)、科技等18個類目,每個類目下又設有眾多的子類目。
當前人工智能研究領域研究重點之一是將人工智能研究領域中的文本自動分類技術應用于信息資源管理。目前,對文本進行自動分類的技術不斷成熟,如基于《中圖法》分類體系下的文本自動分類,其基本做法是,建立基于《中圖法》的專家知識系統(tǒng),包括《中圖法》庫、《漢語主題詞表》庫、分類號主題詞對應庫、同義詞庫、關鍵詞庫以及人工標引詞庫等若干數(shù)據(jù)庫或者其中一部分,應用文本自動分類技術,通過對原始數(shù)據(jù)的有效整理,找出關鍵詞、主題詞和分類號之間隱含的概念關系,形成分類類目與標引詞串的對應款目,自動生成分類號。