- 時(shí)滯隨機(jī)系統(tǒng)的微分博弈理論及應(yīng)用
- 朱懷念
- 753字
- 2019-10-18 16:28:04
2.5 時(shí)滯線性隨機(jī)系統(tǒng)的零和博弈
在兩人Nash博弈中,當(dāng)一方的收益等于另一方的損失時(shí),我們稱該類博弈為零和博弈,此時(shí)兩個(gè)博弈人的性能指標(biāo)之和為零,用數(shù)學(xué)表達(dá)式描述即為J1[v(·)]=-J2[v(·)]。本節(jié)即研究具有此種收益結(jié)構(gòu)的時(shí)滯線性隨機(jī)系統(tǒng)的微分博弈問(wèn)題。
2.5.1 問(wèn)題描述
考慮下式描述的博弈系統(tǒng):
其中φ∈C([-τ,0];Rn)為確定性函數(shù),滿足;wt為一維標(biāo)準(zhǔn)布朗運(yùn)動(dòng);vit是取值于Ui的Ft-可測(cè)的變量,表示博弈人i的決策控制變量,
為非空凸集,i=1,2,v(·)=[v1(·),v2(·)];τ>0為給定的有限的時(shí)間延遲;At,?t,B1t,B2t,D0t,D1t,D2t為具有適當(dāng)維數(shù)的確定性矩陣;G為確定性對(duì)稱矩陣,Qt為非負(fù)的確定性矩陣,Rit為正的確定性矩陣,i=1,2。
我們的問(wèn)題是尋找容許控制[u1(·),u2(·)],使得下述不等式成立J[u1(·),v2(·)]≤J[u1(·),u2(·)]≤J[v1(·),u2(·)].
這樣的[u1(·),u2(·)]稱為博弈問(wèn)題的一個(gè)鞍點(diǎn)。
2.5.2 主要結(jié)論
首先引入下述包含對(duì)稱矩陣Pt,0≤t≤T的推廣的廣義Riccati方程
其中,
定理2.5 具有如下形式
的[u1(·),u2(·)]是博弈問(wèn)題(2.46)的一個(gè)鞍點(diǎn),當(dāng)且僅當(dāng)上述推廣的廣義Riccati方程(2.47)存在解Pt,0≤t≤T。
證明:定義哈密爾頓函數(shù):
根據(jù)最大值原理知
即
其中(yt,zt)是下述伴隨方程的解
由式(2.50)得最優(yōu)控制
于是得到下述隨機(jī)哈密爾頓系統(tǒng)
令
其中Pt=PΤt∈Rn×n是確定性函數(shù)矩陣。
對(duì)yt=Ptxt應(yīng)用It?公式,得
比較式(2.55)中擴(kuò)散項(xiàng)的系數(shù),得
將式(2.54)和(2.56)代入式(2.52)并經(jīng)過(guò)簡(jiǎn)單的計(jì)算得
為符號(hào)上的簡(jiǎn)便,引入下列記號(hào):
在上述記號(hào)下,式(2.55)可以化簡(jiǎn)為
式(2.57)可以簡(jiǎn)記為
由式(2.57)可得式(2.48)。
將式(2.48)代回式(2.58),從而得到式(2.47),證畢。□
注2.4 本節(jié)只研究了有限時(shí)間時(shí)滯隨機(jī)系統(tǒng)的兩人零和博弈問(wèn)題,對(duì)于無(wú)限時(shí)間的零和博弈,相關(guān)結(jié)論可參考無(wú)限時(shí)間Nash博弈的結(jié)論推出。
- 數(shù)學(xué)不簡(jiǎn)單:從《最強(qiáng)大腦》發(fā)現(xiàn)思維樂(lè)趣
- 感官的盛宴:數(shù)學(xué)之眼看藝術(shù)(萬(wàn)物皆數(shù)學(xué))
- 武俠數(shù)學(xué)
- 神奇的數(shù)學(xué)(二)
- 小數(shù)學(xué)家應(yīng)該知道的數(shù)學(xué)故事
- 有限自動(dòng)機(jī)理論
- Origin 9.0科技繪圖與數(shù)據(jù)分析超級(jí)學(xué)習(xí)手冊(cè)
- 數(shù)學(xué)也可以這樣學(xué):自然、空間和時(shí)間里的數(shù)學(xué)
- 數(shù)學(xué)實(shí)驗(yàn)教程
- 文化偉人代表作圖釋書系:算術(shù)研究
- 數(shù)獨(dú)游戲全集
- 越玩越聰明的印度數(shù)學(xué)和孫子算經(jīng)
- 硅谷工程師爸爸的超強(qiáng)數(shù)學(xué)思維課:激發(fā)孩子的數(shù)感天賦
- Hands-On IoT Solutions with Blockchain
- 2頁(yè)紙圖解數(shù)學(xué):以極聰明的方式,讓你三步讀懂?dāng)?shù)學(xué)