- 高維聚類知識發(fā)現(xiàn)關鍵技術研究及應用
- 陳建斌著
- 9字
- 2018-12-27 17:34:47
第1章 知識發(fā)現(xiàn)與KDD
1.1 知識與知識發(fā)現(xiàn)
1.1.1 知識
人類從工業(yè)社會向知識社會演進的同時,政治經(jīng)濟中心從“生產”轉向“發(fā)現(xiàn)、發(fā)明和創(chuàng)新”。知識正在成為創(chuàng)新的核心,知識創(chuàng)新成為知識經(jīng)濟發(fā)展最主要的動力源泉。知識經(jīng)濟對物質文明發(fā)展能夠發(fā)揮巨大的推動作用,可以依靠無形資產的投入來實現(xiàn)可持續(xù)發(fā)展,推動全球經(jīng)濟一體化的進程。
在信息科學中,信息是根據(jù)表示數(shù)據(jù)所用的約定,賦予數(shù)據(jù)的意義。數(shù)據(jù)是事物、概念或指令的一種形式化表現(xiàn)形式,以適用于人工或自然的方式進行通信、解釋或處理。而信息是數(shù)據(jù)所表達的客觀事實,是數(shù)據(jù)內含的社會意義。數(shù)據(jù)是信息的載體,信息是數(shù)據(jù)的內容。數(shù)據(jù)與具體的介質和編碼方法有關。20 世紀40 年代,香農(Shannon)對信息的數(shù)學本質進行了研究,提出了著名的 Shannon 信息論。他用熵的概念來研究信息的容量,采用比特作為度量信息的單位。其信息熵的研究成果至今仍在信息科學的研究中發(fā)揮著重要作用。
信息經(jīng)過加工和改造形成知識。知識是人類在實踐的基礎上產生又經(jīng)過實踐檢驗的對客觀實際的可靠反映,是人腦創(chuàng)新的成果,是人類智慧的結晶。智慧是人類文明的源泉,是推動歷史發(fā)展的永恒動力,是生產力諸多要素的核心。
關于知識的定義,我國傳統(tǒng)文化中早已有相關記錄。《論語》中“知”出現(xiàn)過 116 次;王充《論衡》中講到“知為力”,是人類第一次明確指出“知識就是力量”。
而在國外,據(jù)經(jīng)濟學家汪丁丁考證,“知識”一詞來自于希臘語“gnoo(Knowledge)”。自從古希臘開始,西方哲學史上就開始了以知識定義的認識論爭辯。顯然,知識是一個極其常用但又難以準確定義的詞匯。其中若干典型的知識定義如下:
定義1
知識包括一些事實、信念、觀點、觀念、判斷、期望、方法論與實用知識等。此觀點強調知識在心智模式內的組成要素。
定義2
知識是一種被確認的信念,通過知識持有者和接收者的信念模式和約束來創(chuàng)造、組織和傳遞,在傳遞知識的同時也傳遞一整套文化系統(tǒng)和相關的背景系統(tǒng)。知識是從不相關或相關的信息中變化、重構、創(chuàng)造而得的,比信息或數(shù)據(jù)更廣、更深、更豐富。此觀點強調知識與背景,以及知識與信息的關系。
定義3
知識是人類對數(shù)據(jù)及信息的一種邏輯推理(reasoning),它可以提升人類的工作、決策、問題解決及學習的績效。此觀點強調知識的形成過程及指導決策與行為的用途。
定義4
知識是相關的、可行動化的信息,它至少部分基于經(jīng)驗;知識是信息的一個子集,是主觀的,和有意識的行為有關,擁用經(jīng)驗中的隱性成分。該定義也主要是從信息與知識的關系角度來分析的。
定義5
達文波特和普魯薩克(Davenport&Prusak)整合了知識的形態(tài)、組成元素、主要作用和存儲的主題等元素,從以下幾個方面描述了知識的定義。
(1)知識的形態(tài):知識是一個流動、動態(tài)的混合體,隨著刺激和學習隨時改變更新。
(2)組成元素:組成元素包括經(jīng)驗、價值觀、情景信息和專業(yè)洞察力。
(3)主要功能:它提供一個參考結構來評估和整合新刺激所產生的信息與經(jīng)驗,形成新的結構(學習)并可以指導決策和行為。
(4)存儲主體:它由知者(knower)的心智產生并被利用。在組織內不僅存在于文件與知識庫中,也存在于例行的工作、流程、實踐與文化中。
以上關于知識的定義中,多是從不同角度對知識的描述性界定,無法獲得一致的理解和認同。關于知識的概念,韋伯斯特(Webster)詞典和經(jīng)濟合作與發(fā)展組織(OECD)給出的兩個定義比較權威,受到廣泛引用。
韋伯斯特詞典中定義知識是通過實踐、研究、聯(lián)系或調查獲得的關于事物的事實和狀態(tài)的認識,是對科學、藝術或技術的理解,是人類獲得的關于真理和原理的認識的總和。知識是人類積累的關于自然和社會的認識和經(jīng)驗的總和。
OECD 為了有利于經(jīng)濟分析,將廣義的知識按內容分為如下四種:知識是什么的知識,又稱為事實知識(know-what),或者稱為“知事”,它包括事實、描述和信息;知道為什么的知識,又稱為原理知識(know-why),也稱為“知因”;知道怎么做某事的知識,又稱技能知識(know-how),也稱“知竅”,它是一個關于如何行動的知識;知道什么人有什么知識的知識,又稱人力知識(know-who),也稱“知人”。一般來說,前兩類知識即事實知識和原理知識,是可以表述出來的知識,屬于顯性知識;后兩類知識,即技能知識和人力知識很難完全用文字明確表述,屬于隱性知識。
知識具有下列特征:
(1)客觀性。雖然知識是人腦對信息的加工成果,但這些成果是客觀的,人類對自然、社會、思維規(guī)律的認識是客觀的,這些規(guī)律的運行是不以人的意志為轉移的。
(2)相對性。人類對自然、社會、思維規(guī)律的認識必須有一個過程。在一段時間內認為正確的東西,經(jīng)過變革,可能發(fā)生變化。因此,知識作為對客觀事物的認識和反映,也處于變化中,具有相對性。
(3)進化性。人類在認識客觀世界和主觀世界的過程中,不斷在真理的長河中加入新的內容,知識不斷更新,例如對物質結構的認識,對基因的認識等。
(4)依附性。知識有載體,載體分層次。離開載體的知識是無法存在的,隨著載體的消失,知識也跟著消失。
(5)可重用性。在使用過程中知識可以反復使用。當然,要根據(jù)具體情況作具體分析,靈活應用知識。
(6)共享性。基礎研究一般由政府進行投資,所得到的科學知識具有共享性;但最新的技術知識受到知識產權法保護,使用者只有支付一定的費用,才能獲得這種知識的使用權。知識產權的保護對發(fā)展技術和知識經(jīng)濟是非常重要的。
- Learning Apache Cassandra(Second Edition)
- 大數(shù)據(jù)技術入門(第2版)
- ROS機器人編程與SLAM算法解析指南
- 工業(yè)機器人現(xiàn)場編程(FANUC)
- INSTANT Autodesk Revit 2013 Customization with .NET How-to
- 統(tǒng)計挖掘與機器學習:大數(shù)據(jù)預測建模和分析技術(原書第3版)
- SQL Server數(shù)據(jù)庫應用基礎(第2版)
- WOW!Photoshop CS6完全自學寶典
- 步步驚“芯”
- 計算機應用基礎實訓(職業(yè)模塊)
- 新一代人工智能與語音識別
- FreeCAD [How-to]
- 計算機應用基礎學習指導與練習(Windows XP+Office 2003)
- Flash CS5二維動畫設計與制作
- Mastering Microsoft Dynamics 365 Customer Engagement