官术网_书友最值得收藏!

2.2 云運算與詞計算[16]

傳統(tǒng)意義上,“計算”僅涉及數(shù)與符號的運算。近30年來,計算一詞的含義大大豐富了,在很多地方,計算機科學(xué)系(Computer Department)被改成了計算科學(xué)系(Department of Computing),人們把圖像處理、規(guī)劃和優(yōu)化、輔助決策、知識發(fā)現(xiàn)等都看作計算。然而,人類在進行思考、判斷、推理時主要是以語言為載體的,人類更擅長利用概念、語言值進行計算與推理。而語言通常具有很粗的“粒度”,如“軟件可靠性很高”,其中“很高”這個詞就比較籠統(tǒng),也就是說其粒度很粗。

1965年,美國自動控制專家扎德提出模糊集合的概念后,出現(xiàn)了許多模糊集運算和模糊數(shù)運算的方法。1996年,扎德又進一步提出了“詞計算”(Computing with Words)的思想。詞計算就是用概念、語言值或者單詞取代數(shù)值進行計算和推理的方法,它更強調(diào)自然語言在人類智能中的作用,更強調(diào)概念、語言值和單詞中不確定性的處理方法。

狹義的詞計算是指利用通常意義的數(shù)學(xué)概念和運算,諸如加、減、乘、除等構(gòu)造的帶有不確定或模糊值的詞計算的數(shù)學(xué)體系,借助模糊邏輯概念和經(jīng)典的群、環(huán)、域代數(shù)結(jié)構(gòu),構(gòu)造出以詞為定義域的類似結(jié)構(gòu)。廣義的模糊詞計算統(tǒng)指用詞進行推理,用詞構(gòu)建原型系統(tǒng)和編程等等。

扎德提出的詞計算主要是基于模糊集合處理不確定性,云模型作為定性概念與定量表示之間的不確定轉(zhuǎn)換模型,是表示自然語言值的隨機性、模糊性及其關(guān)聯(lián)性的一種方法。因此,探討基于云模型的詞計算,是很自然的一個研究方向。

基于云的詞計算,包括代數(shù)運算、邏輯運算和語氣運算。云運算的結(jié)果可以看作是某個不同粒度的新詞,也就是一個子概念或者復(fù)合概念。

下面先介紹云的三類基本運算法則。

2.2.1 代數(shù)運算

給定屬于同一個論域U上的云C1Ex1,En1,He1)、C2Ex2,En2,He2),令C1C2代數(shù)運算的結(jié)果為CEx,En,He),C1C2之間的代數(shù)運算可以定義如下。

加法

減法

乘法

除法

特別地,當(dāng)其中一個云的熵和超熵均為0時,其代數(shù)運算則成為云與精確數(shù)值的運算。即對于任意實數(shù)k、云CEx,En,He),有

k±CEx,En,He)=Ck±Ex,En,He),

k×CEx,En,He)=Ck×Ex, |kEn, |kHe)。

云的代數(shù)運算具有如下性質(zhì)。

(1)云的加法、乘法運算滿足交換律和結(jié)合律。

交換律:A+B=B+A,AB=BA

結(jié)合律:(A+B)+C=A+(B+C),(ABC=ABC)。

(2)通常,云的代數(shù)運算會使不確定度增加。但是,云與精確數(shù)值的加減運算沒有改變不確定度。由此性質(zhì)可知:A+B=C不能推出C-B=A;由AB=C不能推出C/B=A

2.2.2 邏輯運算

給定論域U上的云AExA,EnA,HeA)、BExB,EnB,HeB),就傳統(tǒng)意義上的相等、包含、與、或、非等邏輯運算而言,AB之間的邏輯運算可以作如下定義。

(1)AB相等:

A=B?(ExA=ExB)Λ(EnA=EnB)Λ(HeA=HeB)。

(2)A包含B

A?B?[(ExA-3EnA)≤(ExB-3EnB)]Λ[(ExB+3EnB)≤(ExA+3EnA)]。

(3)A“與”B,存在以下3種情況。

如果ExA-ExB≥3(EnA+EnB),那么運算結(jié)果為空。

如果ExA-ExB<3(EnA+EnB),而且AB 互不包含,ExAExB,那么運算結(jié)果為

如果A?B或者B?A,那么運算結(jié)果為

(4)A“或”B:如果AB?,且ExAExB,那么運算結(jié)果為

(5)A的“非”:存在以下兩種情況。

如果A是一個半云,那么,運算結(jié)果也是一個半云,即

如果A是一個全云,那么,運算結(jié)果由兩個半云組成,即

上述云運算可推廣到任意多個云的邏輯運算。

云的邏輯運算具有下列性質(zhì)。

冪等律:AA=A,AA=A

交換律:AB=BA,AB=BA

結(jié)合律:(AB)∪C=A∪(BC),(AB)∩C=A∩(BC)。

吸收律:(AB)∪A=A,(AB)∩A=A

分配律:A∩(BC)=(AB)∪(AC),A∪(BC)=(AB)∩(AC)。

兩極律:AU=U,AU=A,A?=A,A?=?

互補律:-A=A

云的邏輯運算不滿足排中律,即:A-AU,A-A?

以上邏輯運算只是在同一論域范疇上進行的,對于不同論域之間的邏輯運算,可以借用語言值對應(yīng)的概念來完成,將“與”、“或”等也看作是概念,諸如建立“軟與”、“軟或”的云模型,實現(xiàn)軟運算。

2.2.3 語氣運算

語氣運算用以表達對語言值的肯定程度,分為強化語氣和弱化語氣兩種運算。基本思想是,強化語氣使語言值的熵和超熵減小,弱化語氣使語言值的熵和超熵增大。

給定論域U中的云CEx,En,He),令C′Ex′,En′,H′e)為語氣運算的結(jié)果,則可以定義:

強化語氣

弱化語氣

其中,0<k<1,k可以采用諸如黃金分割律等的方法來確定。

一個語言值,經(jīng)過強化運算后再進行弱化運算,能夠恢復(fù)到原來的語言值。云的語氣運算可以連續(xù)運算多次,生成一系列不同語氣的語言值。

需要指出的是,云運算的定義與具體的應(yīng)用是緊密聯(lián)系的,上述定義的云運算法則在某些應(yīng)用中可能合適,但針對其它的應(yīng)用領(lǐng)域,可能需要引入新的定義法則。

2.2.4 云變換

給定論域中某個數(shù)據(jù)屬性X的頻率分布函數(shù)fx),根據(jù)X的屬性值頻率的實際分布情況,自動生成若干粒度不同的云CExi,Eni,Hei)的疊加,每個云代表一個離散的、定性的概念,這種從連續(xù)的數(shù)值區(qū)間到離散的概念的轉(zhuǎn)換過程,稱為云變換[16]。其數(shù)學(xué)表達式為

式中:ai為幅度系數(shù);n為變換后生成離散概念的個數(shù)。

從數(shù)據(jù)挖掘的角度看,云變換就是從某一屬性的實際數(shù)據(jù)分布中抽取概念的過程,是從定量表示到定性描述的轉(zhuǎn)換,是一個概念歸納學(xué)習(xí)的過程。很顯然,利用云模型可以將數(shù)量型屬性的定義域劃分為多個由云模型表征的概念。具體云變換算法請參考文獻[16]。

盡管通過云變換能夠較好地擬合原始數(shù)據(jù)分布,但由于沒有考慮云模型之間的關(guān)系,得到的云模型集較為粗糙。通常會出現(xiàn)下列兩種特殊情況:(1)云模型之間的交疊關(guān)系過于復(fù)雜,有些云模型之間的距離過近,所表達的定性概念非常近似;(2)云模型之間過于稀疏,甚至出現(xiàn)概念“真空地帶”。所以,對原子云模型集進一步做歸整處理是不可缺少的。歸整操作包含兩部分內(nèi)容,分別解決上述兩個問題:其一是通過加權(quán)軟或合并距離過近的原子云模型;其二是生成加權(quán)浮動云彌補概念“真空地帶”。由此,可以得到基于云模型的泛概念樹葉結(jié)點集的自動生成算法。

值得注意的是,通過歸整后得到的原子云模型集已不能完全精確地表示原始數(shù)據(jù)分布。然而,云變換要求原子概念集能夠反映數(shù)據(jù)的分布,而不可能絕對地表示其分布。而且,重要的不是論域上某一點對某一原子概念的隸屬程度,而是它對集合中各原子概念的隸屬程度之間的關(guān)系,是根據(jù)數(shù)據(jù)分布得到的整個原子概念集對整個論域空間的軟劃分。因此,歸整后的原子云模型集合乎人的思維情理,可以被接受和應(yīng)用。對連續(xù)數(shù)據(jù),首先求得各數(shù)據(jù)點的頻數(shù),然后對其分布進行云變換,使之成為多個大小不同的云的疊加,就可以把數(shù)據(jù)轉(zhuǎn)換為概念[126]

2.2.5 虛擬云[11]

云模型的最小單位是基云,對應(yīng)于自然語言中最基本的語言值——語言原子,或思維的基本單位——原子概念。虛擬云(Virtual cloud)是按照某種應(yīng)用目標(biāo),對各個基云的數(shù)字特征進行計算,將得到的結(jié)果作為新的數(shù)字特征所構(gòu)造的云。例如,語言變量C可由原子概念定義為:C{C1Ex1,En1,He1),C2Ex2,En2,He2),…,CnExn,Enn,Hen)},這是對相應(yīng)論域空間軟劃分的實現(xiàn)。語言原子分布于整個論域空間中,表示某個概念的基云在整個論域空間中自由浮動,映射了論域空間中存在的任意語言原子。虛擬云主要分為浮動云、綜合云、分解云和幾何云。此外,根據(jù)云的代數(shù)運算、邏輯運算或語氣運算結(jié)果得到的新云,也可以看作虛擬云的一種。基于云模型的各種虛擬云技術(shù)是表示和處理連續(xù)型數(shù)據(jù)與定性知識的有效工具。

2.2.5.1 浮動云

浮動云(Floating cloud)是在已知兩朵云的數(shù)字特征前提下,根據(jù)線性缺省假設(shè)生成的一朵給定期望值的新云。浮動云的期望值是用戶根據(jù)具體要求事先指定的,具有一定的靈活性,熵和超熵可由兩朵已知云的數(shù)字特征計算求得。

假設(shè)在論域空間中存在兩朵基云C1Ex1,En1,He1)和C2Ex2,En2,He2),且Ex1Ex2,則位于論域中(Ex1,Ex2)區(qū)間內(nèi)任意位置Ex=u的浮動云,其數(shù)字特征可以定義為兩朵基云的數(shù)字特征的距離加權(quán)和,計算公式為

從上述公式可以看出,浮動云越靠近C1,受C1的影響越大,受C2的影響越小,反之亦然。浮動云在論域空間中主要解決概念或規(guī)則的稀疏問題。利用浮動云,可以在未被給定語言值覆蓋的空白區(qū)域自動生成虛擬語言值,用于知識表達和歸納;在未被給定規(guī)則覆蓋的區(qū)域生成虛擬規(guī)則,進行缺省推理。

2.2.5.2 綜合云

綜合云(Synthesized cloud)用于將兩朵或多朵相同類型的子云進行綜合,生成一朵新的高層概念的父云。其本質(zhì)為提升概念,將兩個或兩個以上的同類型語言值綜合為一個更廣義的概念語言值。一般地,綜合云的熵大于基云的熵,覆蓋了論域空間的更大范圍,綜合云對應(yīng)的語言變量表示更一般性的概念,適用于概念數(shù)的概念層次爬升。在實際應(yīng)用中兩朵基云不能相距太遠,否則就失去了綜合的意義。

作為父云的綜合云,其數(shù)字特征可以根據(jù)所有子云的數(shù)字特征計算求得。假設(shè)在論域中存在n個同類型的基云{C1Ex1,En1,He1),C2Ex2,En2,He2),…,CnExn,Enn,Hen)},則由C1,C2, …,Cn可以生成一個同類型的綜合云C,C覆蓋了C1,C2, …,Cn所覆蓋的所有范圍。C的數(shù)字特征

2.2.5.3 分解云

分解云(Resolved cloud)是把一個云分解形成若干個子云(Subcloud)。在語言原子分布的數(shù)域空間中,高層次概念可被分解為若干個低層次概念,構(gòu)成概念樹。概念樹的各層次都對應(yīng)若干個語言變量,每個語言變量對應(yīng)一個云對象。例如,“距離不遠不近”就可分解為“距離不遠”和“距離不近”兩個概念。分解云適用于概念樹層次間概念的細化操作。

2.2.5.4 幾何云

幾何云(Geometric cloud)根據(jù)云模型的已知局部特性,采用幾何數(shù)學(xué)擬合法生成一個涵蓋它的完整的新云。它和逆向云發(fā)生器的區(qū)別在于,幾何云只是根據(jù)局部特性生成虛擬云,對云滴的數(shù)目、分布和精度要求都不高;而逆向云發(fā)生器是由某參數(shù)未知的云模型的云滴來估計其數(shù)字特征,需要較多的、精度較高的云滴。如果僅僅已知兩個云滴(x1,μ1)和(x2,μ2),則用公式

直接計算得到幾何云的數(shù)字特征。

主站蜘蛛池模板: 沙田区| 清镇市| 武隆县| 天台县| 土默特左旗| 方城县| 科技| 南和县| 台中县| 贵定县| 都匀市| 通榆县| 瓮安县| 大庆市| 西昌市| 广南县| 桃江县| 湘潭市| 陆河县| 绥宁县| 黑河市| 扶余县| 化州市| 乌兰浩特市| 浦东新区| 江孜县| 新丰县| 公主岭市| 涟水县| 葫芦岛市| 扎兰屯市| 武隆县| 麻城市| 大城县| 华坪县| 蓬莱市| 山丹县| 金山区| 皋兰县| 道真| 永泰县|