官术网_书友最值得收藏!

2.3 有限時間Nash博弈

2.3.1 問題描述

本節(jié)研究有限時間時滯隨機(jī)系統(tǒng)的線性二次Nash微分博弈問題。簡單起見,我們假設(shè)布朗運(yùn)動為一維的,且只考慮兩個博弈參與人,n個博弈參與人的情形可類似地得到。

受控系統(tǒng)為

這里φC([-τ,0];Rn)為確定性函數(shù),滿足wt為一維標(biāo)準(zhǔn)布朗運(yùn)動;vit是取值于UiFt-可測的變量,表示博弈人i的決策控制變量,為非空凸集,i=1,2;τ>0為給定的有限的時間延遲;At,?t,B1t,B2t,Ct,D1t,D2t為具有適當(dāng)維數(shù)的Ft-適應(yīng)的矩陣值有界過程。

J1[v1(·),v2(·)],J2[v1(·),v2(·)]來表示博弈人i,i=1,2各自對應(yīng)的性能指標(biāo)泛函

其中GiFT-可測非負(fù)有界對稱矩陣,QitFt-適應(yīng)的非負(fù)有界矩陣值過程,RitFt-適應(yīng)的正的有界矩陣值過程且(Rit-1也有界,i=1,2。

我們的問題是尋找容許控制[u1(·),u2(·)],使得下述不等式成立

J1[u1(·),u2(·)]≤J1[v1(·),u2(·)],J2[u1(·),u2(·)]≤J2[u1(·),v2(·)].這樣的[u1(·),u2(·)]稱為博弈問題的Nash均衡點(diǎn)。

2.3.2 主要結(jié)論

定理2.3 [u1(·),u2(·)]為上述博弈問題(2.26)和(2.27)的一個Nash均衡點(diǎn),當(dāng)且僅當(dāng)[u1(·),u2(·)]取下述形式

其中(P1tΛ1t)和(P2tΛ2t)為如下推廣的隨機(jī)Riccati方程的解

其中。

證明:由Nash均衡點(diǎn)的定義及定理2.1,我們可知[u1(·),u2(·)]是博弈問題的一個Nash均衡點(diǎn)等價于ui(·)為如下控制問題的最優(yōu)策略

指標(biāo)泛函為

其中j=1,2,ji。

注意到指標(biāo)泛函(2.31)在形式上與定理2.1中的J[v(·)]是一致的,將定理2.1中的,得

uit=[Rit+(DitΤPitDit]-1[(BitΤPit+(DitΤPitCit+(DitΤΛit]xtt∈[0,T].

式中的Cit=Ct+Djtujt。定理2.3證畢?!?/p>

推廣的隨機(jī)Riccati方程(2.29)的解是一個二元組(Pit,Λit),Λit的出現(xiàn)則保證了狀態(tài)方程(2.26)的系數(shù)矩陣At,?tBt,CtDt為隨機(jī)過程時得到一個Ft-適應(yīng)解。而當(dāng)各系數(shù)矩陣都是確定性的,則有如下的確定性Riccati方程

推論2.1 假設(shè)所有的系數(shù)矩陣At,?tBt,Ct,Dt都是確定性的,則用式(2.32)替代式(2.29)后定理2.3仍然成立。此外,

是博弈問題(2.26)和(2.27)的一個Nash均衡點(diǎn)。

注2.3 推廣的隨機(jī)Riccati方程(2.29)看起來非常復(fù)雜,其解的存在唯一性不易得到。但是,如果它有唯一解,則博弈問題(2.26)和(2.27)也有唯一的Nash均衡點(diǎn)。

主站蜘蛛池模板: 陆良县| 巴里| 高淳县| 莱芜市| 琼中| 西平县| 盈江县| 蕉岭县| 东乡族自治县| 莱西市| 麻城市| 遂宁市| 木里| 惠水县| 乌拉特后旗| 南岸区| 威海市| 康保县| 安西县| 中江县| 翁源县| 会昌县| 松潘县| 衡东县| 阜阳市| 香港| 涡阳县| 治多县| 扶沟县| 开原市| 谢通门县| 保定市| 洛阳市| 伊宁县| 泸定县| 墨竹工卡县| 太保市| 吐鲁番市| 神农架林区| 天水市| 凤凰县|