- 時滯隨機(jī)系統(tǒng)的微分博弈理論及應(yīng)用
- 朱懷念
- 898字
- 2019-10-18 16:28:03
2.3 有限時間Nash博弈
2.3.1 問題描述
本節(jié)研究有限時間時滯隨機(jī)系統(tǒng)的線性二次Nash微分博弈問題。簡單起見,我們假設(shè)布朗運(yùn)動為一維的,且只考慮兩個博弈參與人,n個博弈參與人的情形可類似地得到。
受控系統(tǒng)為
這里φ∈C([-τ,0];Rn)為確定性函數(shù),滿足;wt為一維標(biāo)準(zhǔn)布朗運(yùn)動;vit是取值于Ui的Ft-可測的變量,表示博弈人i的決策控制變量,
為非空凸集,i=1,2;τ>0為給定的有限的時間延遲;At,?t,B1t,B2t,Ct,D1t,D2t為具有適當(dāng)維數(shù)的Ft-適應(yīng)的矩陣值有界過程。
以J1[v1(·),v2(·)],J2[v1(·),v2(·)]來表示博弈人i,i=1,2各自對應(yīng)的性能指標(biāo)泛函
其中Gi為FT-可測非負(fù)有界對稱矩陣,Qit為Ft-適應(yīng)的非負(fù)有界矩陣值過程,Rit為Ft-適應(yīng)的正的有界矩陣值過程且(Rit)-1也有界,i=1,2。
我們的問題是尋找容許控制[u1(·),u2(·)],使得下述不等式成立
J1[u1(·),u2(·)]≤J1[v1(·),u2(·)],J2[u1(·),u2(·)]≤J2[u1(·),v2(·)].這樣的[u1(·),u2(·)]稱為博弈問題的Nash均衡點(diǎn)。
2.3.2 主要結(jié)論
定理2.3 [u1(·),u2(·)]為上述博弈問題(2.26)和(2.27)的一個Nash均衡點(diǎn),當(dāng)且僅當(dāng)[u1(·),u2(·)]取下述形式
其中(P1t,Λ1t)和(P2t,Λ2t)為如下推廣的隨機(jī)Riccati方程的解
其中。
證明:由Nash均衡點(diǎn)的定義及定理2.1,我們可知[u1(·),u2(·)]是博弈問題的一個Nash均衡點(diǎn)等價于ui(·)為如下控制問題的最優(yōu)策略
指標(biāo)泛函為
其中j=1,2,j≠i。
注意到指標(biāo)泛函(2.31)在形式上與定理2.1中的J[v(·)]是一致的,將定理2.1中的,得
uit=[Rit+(Dit)ΤPitDit]-1[(Bit)ΤPit+(Dit)ΤPitCit+(Dit)ΤΛit]xt,t∈[0,T].
式中的Cit=Ct+Djtujt。定理2.3證畢?!?/p>
推廣的隨機(jī)Riccati方程(2.29)的解是一個二元組(Pit,Λit),Λit的出現(xiàn)則保證了狀態(tài)方程(2.26)的系數(shù)矩陣At,?t,Bt,Ct,Dt為隨機(jī)過程時得到一個Ft-適應(yīng)解。而當(dāng)各系數(shù)矩陣都是確定性的,則有如下的確定性Riccati方程
推論2.1 假設(shè)所有的系數(shù)矩陣At,?t,Bt,Ct,Dt都是確定性的,則用式(2.32)替代式(2.29)后定理2.3仍然成立。此外,
是博弈問題(2.26)和(2.27)的一個Nash均衡點(diǎn)。
注2.3 推廣的隨機(jī)Riccati方程(2.29)看起來非常復(fù)雜,其解的存在唯一性不易得到。但是,如果它有唯一解,則博弈問題(2.26)和(2.27)也有唯一的Nash均衡點(diǎn)。
- 實(shí)用運(yùn)籌學(xué):案例、方法及應(yīng)用
- Hands-On Blockchain Development in 7 Days
- 線性代數(shù)及其應(yīng)用(原書第6版)
- 數(shù)學(xué)可以很有趣:科學(xué)新悅讀文叢(套裝全5冊)
- GMAT批判性推理:邏輯分類精講
- 文化偉人代表作圖釋書系:算術(shù)研究
- 數(shù)學(xué)與決策:數(shù)學(xué)教你做決定
- 無言的宇宙
- 愛情數(shù)學(xué)(TED 思想的力量系列)
- 神機(jī)妙算:一本關(guān)于算法的閑書
- 2016年管理類專業(yè)學(xué)位聯(lián)考綜合能力考試 數(shù)學(xué)考點(diǎn)歸納與真題解析
- 這才是好讀的數(shù)學(xué)史
- 自然哲學(xué)的數(shù)學(xué)原理(漢譯世界學(xué)術(shù)名著叢書)
- 第四屆(2018)北京高校數(shù)學(xué)微課程教學(xué)設(shè)計競賽優(yōu)秀作品與教改論文集錦
- Improving your C# Skills