- 醫(yī)藥信息處理與分析
- 晏峻峰 占艷
- 3107字
- 2019-09-10 14:50:09
1.1 信息的概念及相關(guān)知識
1.1.1 信息的概念
信息是自然界和人類社會的一個重要范疇,也是客觀存在的一種基本現(xiàn)象。一般意義下信息的概念是指消息、情報,是互相交流中要傳遞的某種內(nèi)容,與知識、見聞、通知、情報、事實、數(shù)據(jù)等概念在某些場合中常會交叉互用。通信意義上的信息是指在通信的任何可逆的重新編碼或翻譯中那些保持不變的東西。在通信技術(shù)領(lǐng)域,1948年,香農(nóng)在《貝爾系統(tǒng)技術(shù)雜志》上發(fā)表的“通信的數(shù)學(xué)理論”一文中提出“信息是使(通信系統(tǒng)中)不確定程度減小的量”。“不確定程度”指通信系統(tǒng)中未收到有關(guān)信源信號的狀態(tài),在收到信號后,系統(tǒng)的有序程度增加,不確定程度減少。情報科學(xué)領(lǐng)域常用數(shù)據(jù)(Data)、信息(Information)和知識(Knowledge)這一組概念來表達(dá)情報領(lǐng)域中傳輸?shù)膬?nèi)容。美國的情報學(xué)家麥克唐納認(rèn)為:“信息是特定情況下評價未經(jīng)評價的數(shù)據(jù)的東西,知識是在一般使用過程中評價這種數(shù)據(jù)的東西”。而現(xiàn)代哲學(xué)認(rèn)為,信息是與物質(zhì)和能量并存的一種自然現(xiàn)象,是物質(zhì)和意識存在方式的表現(xiàn),同時也是物質(zhì)和意識的橋梁。宇宙間一切事物都處于相互聯(lián)系、相互作用之中,信息就是對事物之間相互聯(lián)系、相互作用的狀態(tài)的描述;從微觀世界到宏觀世界,從無機(jī)世界到有機(jī)世界,從植物到動物,從機(jī)器到人,都能產(chǎn)生信息,也能接收信息。正因為如此,信息成為了許多學(xué)科的研究對象,不同領(lǐng)域的學(xué)者都從不同的角度來研究信息。
1.1.2 信息的基本特征
信息是不同于物質(zhì)和能量的一種特殊的資源,它具有可存儲性、可傳遞性、可加工性、共享性、時效性和可替代性六大基本特征。
(1)可存儲性。信息借助載體可在一定條件下存儲起來。信息的可存儲性為信息的積累、加工和不同場合下的應(yīng)用提供了可能。
(2)可傳遞性。傳遞是信息存在的基本狀態(tài)之一,信息傳遞的基本要求是速度快。傳遞具有動態(tài)性和方向性特征。信息的傳遞依賴于物質(zhì)媒介。信息的傳遞必然伴隨著物質(zhì)或能量的傳遞,并且須消耗一定的能量。傳遞的基本方式有物質(zhì)的傳遞和能量的傳遞兩大類。物質(zhì)傳遞較為顯見,如運輸、交通等。而能量的傳遞則不易察覺,如陽光照耀,多米諾骨牌等。信息傳遞的方式是多種多樣的。按照流向的不同,可以有單向傳遞、反饋傳遞和雙向傳遞三種方式。按信息傳遞時信息量的集中程序不同,有集中和連續(xù)兩種方式。按信息傳遞范圍或與環(huán)境關(guān)系的不同,可有內(nèi)部傳遞和外部傳遞兩種方式。
(3)可加工性。信息可以通過一定的手段進(jìn)行加工,如擴(kuò)充、壓縮、分解、綜合、抽取、排序等。加工的方法和目的反映信息接收者獲取和利用信息的特定需求。加工后的信息是反映信息源和接收者之間相互聯(lián)系、相互作用的更為重要和更加規(guī)律化的因素。應(yīng)當(dāng)注意的是,信息的內(nèi)容是語法、語義和語用三者的統(tǒng)一體。信息在加工過程中要注意保證上述三者的統(tǒng)一,以免造成信息的失真,即原始信息(加工前的信息)的有些內(nèi)容丟失或被歪曲。
(4)共享性。一個信息源的信息可以為多個信息接收者享用。一般情況下增加享用者不會使原有享用者失去部分或全部信息。一些特殊的信息和特殊形式的信息在共享上存在明顯的障礙,但并不影響信息共享性這一本質(zhì)屬性。有的信息涉及商業(yè)的、政治的、軍事的秘密,擴(kuò)大對這類信息的享有者范圍,可能影響某些享用者對這類信息的利用,但不會改變信息本身的內(nèi)容。這是信息不同于物質(zhì)和能量的一個本質(zhì)特征。共享性指接收者在獲得全部的信息的同時而不會減少信息的信息量(指記憶信源,如文獻(xiàn)等)。并且,數(shù)個接收者可以獲得同一信源發(fā)出的同樣的信息。
(5)時效性。信息的時效性表現(xiàn)是多種多樣的。例如,信息的滯后性是表明客觀事物總是在前,認(rèn)識總是在后,人類獲得信息總是滯后的。例如,各種星體信息,即使是以光速傳播,在人類接收到時,也是滯后的,也正是這種滯后性,使人們可以了解到不同歷史時期的星體特征。超前性是指人類在把握各種規(guī)律的前提下,能夠?qū)Πl(fā)展中的事物進(jìn)行預(yù)測。此外,信息在一定時間內(nèi)相對說來會變成過時的信息,尤其是經(jīng)濟(jì)信息的有效期非常短。例如,國際金融市場信息的時滯一般不應(yīng)超過6小時,否則,過了時限的信息,再詳盡也只是昨日的黃花,非但無用,反而會使人做出錯誤的決定。大多數(shù)經(jīng)濟(jì)活動過程都很短暫,如國際股票交易市場的變化往往發(fā)生在幾秒鐘內(nèi)。但某些信息的時效性卻表現(xiàn)在越古老的信息越有價值,如考古研究等。任何信息從信息源傳播到接收者都要經(jīng)過一定的時間。信息接收者所得到的與自己有關(guān)的信息源的狀況的信息都是反映信息源已經(jīng)出現(xiàn)的狀況。時滯的大小與載體運動特性和通道的性質(zhì)有關(guān)。(技術(shù)性強(qiáng))信息的傳輸、加工與利用都必須考慮這種時滯效應(yīng),特別對于需要實時或及時處理與利用的信息,必須通過合理選用載體與通道來把這種時滯控制在允許的范圍內(nèi)。
(6)可替代性。人的任何行為,都可以概括為一個不斷從外界獲取信息,對信息進(jìn)行處理,并在這個基礎(chǔ)上,通過一定的物質(zhì)和能量,對事物進(jìn)行調(diào)整、控制和組織行動的過程。因此,信息具有替代性。它可以替代資本、勞動力或其他有形的物質(zhì)。最簡單的事實是把信息編成程序,輸入計算機(jī),就可以在工廠、礦山、交通運輸、商業(yè)、醫(yī)療乃至家庭等各個領(lǐng)域代替人的勞動。信息可以在不同的層次上,在不同的狀態(tài)之間和不同的信號系統(tǒng)之間進(jìn)行轉(zhuǎn)換。如自然語言和機(jī)器語言的轉(zhuǎn)化屬于不同的層次之間的轉(zhuǎn)換;不同狀態(tài):光電信號轉(zhuǎn)換,電聲轉(zhuǎn)換;不同的信號系統(tǒng):不同的語種,方言等。可替代性的作用是使得信息能以不同的方式存儲和傳遞,使信息的處理有可能得以實現(xiàn),也使得各種交流方式得以存在。
1.1.3 信息、數(shù)據(jù)與知識的關(guān)系
數(shù)據(jù)是事實或觀察的結(jié)果,它是對客觀事件的記錄和可以鑒別的符號。數(shù)據(jù)不僅指狹義上的數(shù)字,還可以是具有一定意義的文字、字母、數(shù)字符號的組合、圖形、圖像、視頻、音頻等,是客觀事物的屬性、數(shù)量、位置及其相互關(guān)系的抽象表示,是對客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號或這些物理符號的組合。例如,“0、1、2…”“心、肝、脾、肺、腎”“病人的病歷記錄、CT掃描片子”等都是數(shù)據(jù)。數(shù)據(jù)的表現(xiàn)形式還不能完全表達(dá)其內(nèi)容,需要經(jīng)過解釋,數(shù)據(jù)和關(guān)于數(shù)據(jù)的解釋是不可分的。例如,“75”是一個數(shù)據(jù),可以是某人的成績,也可以是其體重,還可以是汽車的速度。數(shù)據(jù)的解釋是指對數(shù)據(jù)含義的說明,數(shù)據(jù)的含義稱為數(shù)據(jù)的語義,數(shù)據(jù)與其語義是不可分的。數(shù)據(jù)都有其屬性和客觀值,如“年齡25歲”,其“年齡”是數(shù)據(jù)的屬性名稱,“25歲”是數(shù)據(jù)的客觀值。因此說數(shù)據(jù)是對客觀事物的屬性、數(shù)量、位置及其相互關(guān)系的一種抽象的描述,數(shù)據(jù)是事物原始性狀的記載,沒有經(jīng)過任何加工處理,數(shù)據(jù)是雜亂的,但它是真實的、可靠的,并且具有累積的價值。數(shù)據(jù)是信息的表達(dá)載體,信息是數(shù)據(jù)的內(nèi)涵,是形與質(zhì)的關(guān)系。知識是經(jīng)人為組織的可理解的系統(tǒng)信息,與信息不屬同一范疇。知識是相對的,因人而異,因時而異,因地而異,屬于意識范疇,具有主觀的特征。而信息是絕對的,是客觀的。信息是構(gòu)成知識的基本要素,沒有信息就沒有知識可言。信息可以通過信息儀器設(shè)備獲取;而知識則必須通過學(xué)習(xí)獲得。
信息與數(shù)據(jù)、知識密切相關(guān),是在不同層次上對事物的認(rèn)識。要從數(shù)據(jù)中獲得認(rèn)知,需要對摻有大量雜質(zhì)的數(shù)據(jù)進(jìn)行清洗,以形成干凈的數(shù)據(jù)。干凈的數(shù)據(jù)也意味著數(shù)據(jù)的質(zhì)量高,干擾少,從數(shù)據(jù)中獲取的信息價值高,所形成的認(rèn)知更具應(yīng)用意義。由圖 1-1 數(shù)據(jù)、信息與知識的關(guān)系中可見,數(shù)據(jù)與信息、信息與知識均互為蘊(yùn)含關(guān)系,能夠有效開展信息分析。在開展醫(yī)藥相關(guān)科研活動中,經(jīng)常會做一些諸如:數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)據(jù)挖掘等工作,本質(zhì)上就是對數(shù)據(jù)、信息、知識之間關(guān)系的探索,均屬于信息處理與分析,因此,本書中,沒有特別聲明時,對信息處理與數(shù)據(jù)處理、信息分析與知識發(fā)現(xiàn)概念不做嚴(yán)格區(qū)分。

圖1-1 數(shù)據(jù)、信息與知識的關(guān)系圖
- 問學(xué):思勉青年學(xué)術(shù)集刊(第2輯)
- 文獻(xiàn)保護(hù)中英雙解詞語手冊
- 公共文化館治理研究(2015年):四川省文化館“十三五”規(guī)劃重大課題調(diào)研成果集
- 國外圖書館動漫資源建設(shè)與服務(wù)
- 公益 創(chuàng)新 服務(wù)
- 醫(yī)學(xué)文獻(xiàn)管理
- 北京大學(xué)中國古文獻(xiàn)研究中心集刊·第十四輯
- 圖書情報專業(yè)碩士培養(yǎng)研究與實踐
- 大數(shù)據(jù)環(huán)境下高校圖書館知識服務(wù)模式研究
- 中國古典文獻(xiàn)學(xué)(東北師范大學(xué)文學(xué)院學(xué)術(shù)史文庫)
- 高校圖書館學(xué)科服務(wù)研究
- 檔案資源社會化:檔案資源結(jié)構(gòu)的歷史性變化
- 崇文集四編:中央文史研究館館員文選(全二冊)(精裝)
- 知人者智:人物志讀本
- 基于大數(shù)據(jù)時代的圖書情報管理與服務(wù)研究