- 高維聚類(lèi)知識(shí)發(fā)現(xiàn)關(guān)鍵技術(shù)研究及應(yīng)用
- 陳建斌著
- 8字
- 2018-12-27 17:34:48
第1章 知識(shí)發(fā)現(xiàn)與KDD
1.1 知識(shí)與知識(shí)發(fā)現(xiàn)
1.1.1 知識(shí)
人類(lèi)從工業(yè)社會(huì)向知識(shí)社會(huì)演進(jìn)的同時(shí),政治經(jīng)濟(jì)中心從“生產(chǎn)”轉(zhuǎn)向“發(fā)現(xiàn)、發(fā)明和創(chuàng)新”。知識(shí)正在成為創(chuàng)新的核心,知識(shí)創(chuàng)新成為知識(shí)經(jīng)濟(jì)發(fā)展最主要的動(dòng)力源泉。知識(shí)經(jīng)濟(jì)對(duì)物質(zhì)文明發(fā)展能夠發(fā)揮巨大的推動(dòng)作用,可以依靠無(wú)形資產(chǎn)的投入來(lái)實(shí)現(xiàn)可持續(xù)發(fā)展,推動(dòng)全球經(jīng)濟(jì)一體化的進(jìn)程。
在信息科學(xué)中,信息是根據(jù)表示數(shù)據(jù)所用的約定,賦予數(shù)據(jù)的意義。數(shù)據(jù)是事物、概念或指令的一種形式化表現(xiàn)形式,以適用于人工或自然的方式進(jìn)行通信、解釋或處理。而信息是數(shù)據(jù)所表達(dá)的客觀(guān)事實(shí),是數(shù)據(jù)內(nèi)含的社會(huì)意義。數(shù)據(jù)是信息的載體,信息是數(shù)據(jù)的內(nèi)容。數(shù)據(jù)與具體的介質(zhì)和編碼方法有關(guān)。20 世紀(jì)40 年代,香農(nóng)(Shannon)對(duì)信息的數(shù)學(xué)本質(zhì)進(jìn)行了研究,提出了著名的 Shannon 信息論。他用熵的概念來(lái)研究信息的容量,采用比特作為度量信息的單位。其信息熵的研究成果至今仍在信息科學(xué)的研究中發(fā)揮著重要作用。
信息經(jīng)過(guò)加工和改造形成知識(shí)。知識(shí)是人類(lèi)在實(shí)踐的基礎(chǔ)上產(chǎn)生又經(jīng)過(guò)實(shí)踐檢驗(yàn)的對(duì)客觀(guān)實(shí)際的可靠反映,是人腦創(chuàng)新的成果,是人類(lèi)智慧的結(jié)晶。智慧是人類(lèi)文明的源泉,是推動(dòng)歷史發(fā)展的永恒動(dòng)力,是生產(chǎn)力諸多要素的核心。
關(guān)于知識(shí)的定義,我國(guó)傳統(tǒng)文化中早已有相關(guān)記錄。《論語(yǔ)》中“知”出現(xiàn)過(guò) 116 次;王充《論衡》中講到“知為力”,是人類(lèi)第一次明確指出“知識(shí)就是力量”。
而在國(guó)外,據(jù)經(jīng)濟(jì)學(xué)家汪丁丁考證,“知識(shí)”一詞來(lái)自于希臘語(yǔ)“gnoo(Knowledge)”。自從古希臘開(kāi)始,西方哲學(xué)史上就開(kāi)始了以知識(shí)定義的認(rèn)識(shí)論爭(zhēng)辯。顯然,知識(shí)是一個(gè)極其常用但又難以準(zhǔn)確定義的詞匯。其中若干典型的知識(shí)定義如下:
定義1
知識(shí)包括一些事實(shí)、信念、觀(guān)點(diǎn)、觀(guān)念、判斷、期望、方法論與實(shí)用知識(shí)等。此觀(guān)點(diǎn)強(qiáng)調(diào)知識(shí)在心智模式內(nèi)的組成要素。
定義2
知識(shí)是一種被確認(rèn)的信念,通過(guò)知識(shí)持有者和接收者的信念模式和約束來(lái)創(chuàng)造、組織和傳遞,在傳遞知識(shí)的同時(shí)也傳遞一整套文化系統(tǒng)和相關(guān)的背景系統(tǒng)。知識(shí)是從不相關(guān)或相關(guān)的信息中變化、重構(gòu)、創(chuàng)造而得的,比信息或數(shù)據(jù)更廣、更深、更豐富。此觀(guān)點(diǎn)強(qiáng)調(diào)知識(shí)與背景,以及知識(shí)與信息的關(guān)系。
定義3
知識(shí)是人類(lèi)對(duì)數(shù)據(jù)及信息的一種邏輯推理(reasoning),它可以提升人類(lèi)的工作、決策、問(wèn)題解決及學(xué)習(xí)的績(jī)效。此觀(guān)點(diǎn)強(qiáng)調(diào)知識(shí)的形成過(guò)程及指導(dǎo)決策與行為的用途。
定義4
知識(shí)是相關(guān)的、可行動(dòng)化的信息,它至少部分基于經(jīng)驗(yàn);知識(shí)是信息的一個(gè)子集,是主觀(guān)的,和有意識(shí)的行為有關(guān),擁用經(jīng)驗(yàn)中的隱性成分。該定義也主要是從信息與知識(shí)的關(guān)系角度來(lái)分析的。
定義5
達(dá)文波特和普魯薩克(Davenport&Prusak)整合了知識(shí)的形態(tài)、組成元素、主要作用和存儲(chǔ)的主題等元素,從以下幾個(gè)方面描述了知識(shí)的定義。
(1)知識(shí)的形態(tài):知識(shí)是一個(gè)流動(dòng)、動(dòng)態(tài)的混合體,隨著刺激和學(xué)習(xí)隨時(shí)改變更新。
(2)組成元素:組成元素包括經(jīng)驗(yàn)、價(jià)值觀(guān)、情景信息和專(zhuān)業(yè)洞察力。
(3)主要功能:它提供一個(gè)參考結(jié)構(gòu)來(lái)評(píng)估和整合新刺激所產(chǎn)生的信息與經(jīng)驗(yàn),形成新的結(jié)構(gòu)(學(xué)習(xí))并可以指導(dǎo)決策和行為。
(4)存儲(chǔ)主體:它由知者(knower)的心智產(chǎn)生并被利用。在組織內(nèi)不僅存在于文件與知識(shí)庫(kù)中,也存在于例行的工作、流程、實(shí)踐與文化中。
以上關(guān)于知識(shí)的定義中,多是從不同角度對(duì)知識(shí)的描述性界定,無(wú)法獲得一致的理解和認(rèn)同。關(guān)于知識(shí)的概念,韋伯斯特(Webster)詞典和經(jīng)濟(jì)合作與發(fā)展組織(OECD)給出的兩個(gè)定義比較權(quán)威,受到廣泛引用。
韋伯斯特詞典中定義知識(shí)是通過(guò)實(shí)踐、研究、聯(lián)系或調(diào)查獲得的關(guān)于事物的事實(shí)和狀態(tài)的認(rèn)識(shí),是對(duì)科學(xué)、藝術(shù)或技術(shù)的理解,是人類(lèi)獲得的關(guān)于真理和原理的認(rèn)識(shí)的總和。知識(shí)是人類(lèi)積累的關(guān)于自然和社會(huì)的認(rèn)識(shí)和經(jīng)驗(yàn)的總和。
OECD 為了有利于經(jīng)濟(jì)分析,將廣義的知識(shí)按內(nèi)容分為如下四種:知識(shí)是什么的知識(shí),又稱(chēng)為事實(shí)知識(shí)(know-what),或者稱(chēng)為“知事”,它包括事實(shí)、描述和信息;知道為什么的知識(shí),又稱(chēng)為原理知識(shí)(know-why),也稱(chēng)為“知因”;知道怎么做某事的知識(shí),又稱(chēng)技能知識(shí)(know-how),也稱(chēng)“知竅”,它是一個(gè)關(guān)于如何行動(dòng)的知識(shí);知道什么人有什么知識(shí)的知識(shí),又稱(chēng)人力知識(shí)(know-who),也稱(chēng)“知人”。一般來(lái)說(shuō),前兩類(lèi)知識(shí)即事實(shí)知識(shí)和原理知識(shí),是可以表述出來(lái)的知識(shí),屬于顯性知識(shí);后兩類(lèi)知識(shí),即技能知識(shí)和人力知識(shí)很難完全用文字明確表述,屬于隱性知識(shí)。
知識(shí)具有下列特征:
(1)客觀(guān)性。雖然知識(shí)是人腦對(duì)信息的加工成果,但這些成果是客觀(guān)的,人類(lèi)對(duì)自然、社會(huì)、思維規(guī)律的認(rèn)識(shí)是客觀(guān)的,這些規(guī)律的運(yùn)行是不以人的意志為轉(zhuǎn)移的。
(2)相對(duì)性。人類(lèi)對(duì)自然、社會(huì)、思維規(guī)律的認(rèn)識(shí)必須有一個(gè)過(guò)程。在一段時(shí)間內(nèi)認(rèn)為正確的東西,經(jīng)過(guò)變革,可能發(fā)生變化。因此,知識(shí)作為對(duì)客觀(guān)事物的認(rèn)識(shí)和反映,也處于變化中,具有相對(duì)性。
(3)進(jìn)化性。人類(lèi)在認(rèn)識(shí)客觀(guān)世界和主觀(guān)世界的過(guò)程中,不斷在真理的長(zhǎng)河中加入新的內(nèi)容,知識(shí)不斷更新,例如對(duì)物質(zhì)結(jié)構(gòu)的認(rèn)識(shí),對(duì)基因的認(rèn)識(shí)等。
(4)依附性。知識(shí)有載體,載體分層次。離開(kāi)載體的知識(shí)是無(wú)法存在的,隨著載體的消失,知識(shí)也跟著消失。
(5)可重用性。在使用過(guò)程中知識(shí)可以反復(fù)使用。當(dāng)然,要根據(jù)具體情況作具體分析,靈活應(yīng)用知識(shí)。
(6)共享性。基礎(chǔ)研究一般由政府進(jìn)行投資,所得到的科學(xué)知識(shí)具有共享性;但最新的技術(shù)知識(shí)受到知識(shí)產(chǎn)權(quán)法保護(hù),使用者只有支付一定的費(fèi)用,才能獲得這種知識(shí)的使用權(quán)。知識(shí)產(chǎn)權(quán)的保護(hù)對(duì)發(fā)展技術(shù)和知識(shí)經(jīng)濟(jì)是非常重要的。
- 大數(shù)據(jù)導(dǎo)論:思維、技術(shù)與應(yīng)用
- 大學(xué)計(jì)算機(jī)信息技術(shù)導(dǎo)論
- 自動(dòng)控制工程設(shè)計(jì)入門(mén)
- 智能傳感器技術(shù)與應(yīng)用
- TestStand工業(yè)自動(dòng)化測(cè)試管理(典藏版)
- 圖形圖像處理(Photoshop)
- 流處理器研究與設(shè)計(jì)
- STM32嵌入式微控制器快速上手
- 基于32位ColdFire構(gòu)建嵌入式系統(tǒng)
- 液壓機(jī)智能故障診斷方法集成技術(shù)
- 從零開(kāi)始學(xué)Java Web開(kāi)發(fā)
- 筆記本電腦維修之電路分析基礎(chǔ)
- Hadoop Beginner's Guide
- 企業(yè)級(jí)Web開(kāi)發(fā)實(shí)戰(zhàn)
- 巧學(xué)活用Photoshop