官术网_书友最值得收藏!

第1章 知識發現與KDD

1.1 知識與知識發現

1.1.1 知識

人類從工業社會向知識社會演進的同時,政治經濟中心從“生產”轉向“發現、發明和創新”。知識正在成為創新的核心,知識創新成為知識經濟發展最主要的動力源泉。知識經濟對物質文明發展能夠發揮巨大的推動作用,可以依靠無形資產的投入來實現可持續發展,推動全球經濟一體化的進程。

在信息科學中,信息是根據表示數據所用的約定,賦予數據的意義。數據是事物、概念或指令的一種形式化表現形式,以適用于人工或自然的方式進行通信、解釋或處理。而信息是數據所表達的客觀事實,是數據內含的社會意義。數據是信息的載體,信息是數據的內容。數據與具體的介質和編碼方法有關。20 世紀40 年代,香農(Shannon)對信息的數學本質進行了研究,提出了著名的 Shannon 信息論。他用熵的概念來研究信息的容量,采用比特作為度量信息的單位。其信息熵的研究成果至今仍在信息科學的研究中發揮著重要作用。

信息經過加工和改造形成知識。知識是人類在實踐的基礎上產生又經過實踐檢驗的對客觀實際的可靠反映,是人腦創新的成果,是人類智慧的結晶。智慧是人類文明的源泉,是推動歷史發展的永恒動力,是生產力諸多要素的核心。

關于知識的定義,我國傳統文化中早已有相關記錄。《論語》中“知”出現過 116 次;王充《論衡》中講到“知為力”,是人類第一次明確指出“知識就是力量”。

而在國外,據經濟學家汪丁丁考證,“知識”一詞來自于希臘語“gnoo(Knowledge)”。自從古希臘開始,西方哲學史上就開始了以知識定義的認識論爭辯。顯然,知識是一個極其常用但又難以準確定義的詞匯。其中若干典型的知識定義如下:

定義1

知識包括一些事實、信念、觀點、觀念、判斷、期望、方法論與實用知識等。此觀點強調知識在心智模式內的組成要素。

定義2

知識是一種被確認的信念,通過知識持有者和接收者的信念模式和約束來創造、組織和傳遞,在傳遞知識的同時也傳遞一整套文化系統和相關的背景系統。知識是從不相關或相關的信息中變化、重構、創造而得的,比信息或數據更廣、更深、更豐富。此觀點強調知識與背景,以及知識與信息的關系。

定義3

知識是人類對數據及信息的一種邏輯推理(reasoning),它可以提升人類的工作、決策、問題解決及學習的績效。此觀點強調知識的形成過程及指導決策與行為的用途。

定義4

知識是相關的、可行動化的信息,它至少部分基于經驗;知識是信息的一個子集,是主觀的,和有意識的行為有關,擁用經驗中的隱性成分。該定義也主要是從信息與知識的關系角度來分析的。

定義5

達文波特和普魯薩克(Davenport&Prusak)整合了知識的形態、組成元素、主要作用和存儲的主題等元素,從以下幾個方面描述了知識的定義。

(1)知識的形態:知識是一個流動、動態的混合體,隨著刺激和學習隨時改變更新。

(2)組成元素:組成元素包括經驗、價值觀、情景信息和專業洞察力。

(3)主要功能:它提供一個參考結構來評估和整合新刺激所產生的信息與經驗,形成新的結構(學習)并可以指導決策和行為。

(4)存儲主體:它由知者(knower)的心智產生并被利用。在組織內不僅存在于文件與知識庫中,也存在于例行的工作、流程、實踐與文化中。

以上關于知識的定義中,多是從不同角度對知識的描述性界定,無法獲得一致的理解和認同。關于知識的概念,韋伯斯特(Webster)詞典和經濟合作與發展組織(OECD)給出的兩個定義比較權威,受到廣泛引用。

韋伯斯特詞典中定義知識是通過實踐、研究、聯系或調查獲得的關于事物的事實和狀態的認識,是對科學、藝術或技術的理解,是人類獲得的關于真理和原理的認識的總和。知識是人類積累的關于自然和社會的認識和經驗的總和。

OECD 為了有利于經濟分析,將廣義的知識按內容分為如下四種:知識是什么的知識,又稱為事實知識(know-what),或者稱為“知事”,它包括事實、描述和信息;知道為什么的知識,又稱為原理知識(know-why),也稱為“知因”;知道怎么做某事的知識,又稱技能知識(know-how),也稱“知竅”,它是一個關于如何行動的知識;知道什么人有什么知識的知識,又稱人力知識(know-who),也稱“知人”。一般來說,前兩類知識即事實知識和原理知識,是可以表述出來的知識,屬于顯性知識;后兩類知識,即技能知識和人力知識很難完全用文字明確表述,屬于隱性知識。

知識具有下列特征:

(1)客觀性。雖然知識是人腦對信息的加工成果,但這些成果是客觀的,人類對自然、社會、思維規律的認識是客觀的,這些規律的運行是不以人的意志為轉移的。

(2)相對性。人類對自然、社會、思維規律的認識必須有一個過程。在一段時間內認為正確的東西,經過變革,可能發生變化。因此,知識作為對客觀事物的認識和反映,也處于變化中,具有相對性。

(3)進化性。人類在認識客觀世界和主觀世界的過程中,不斷在真理的長河中加入新的內容,知識不斷更新,例如對物質結構的認識,對基因的認識等。

(4)依附性。知識有載體,載體分層次。離開載體的知識是無法存在的,隨著載體的消失,知識也跟著消失。

(5)可重用性。在使用過程中知識可以反復使用。當然,要根據具體情況作具體分析,靈活應用知識。

(6)共享性。基礎研究一般由政府進行投資,所得到的科學知識具有共享性;但最新的技術知識受到知識產權法保護,使用者只有支付一定的費用,才能獲得這種知識的使用權。知識產權的保護對發展技術和知識經濟是非常重要的。

主站蜘蛛池模板: 威宁| 大石桥市| 天水市| 当阳市| 南通市| 南宫市| 云安县| 盐山县| 阳东县| 清河县| 霍山县| 洞头县| 华坪县| 兴安盟| 京山县| 清涧县| 溆浦县| 临泽县| 明光市| 枣阳市| 隆子县| 行唐县| 报价| 天台县| 宁津县| 姜堰市| 襄汾县| 吕梁市| 安多县| 长寿区| 女性| 杨浦区| 汤原县| 昂仁县| 肇东市| 加查县| 上虞市| 岗巴县| 石台县| 富源县| 阿巴嘎旗|