官术网_书友最值得收藏!

2.5 時(shí)滯線性隨機(jī)系統(tǒng)的零和博弈

在兩人Nash博弈中,當(dāng)一方的收益等于另一方的損失時(shí),我們稱該類博弈為零和博弈,此時(shí)兩個(gè)博弈人的性能指標(biāo)之和為零,用數(shù)學(xué)表達(dá)式描述即為J1[v(·)]=-J2[v(·)]。本節(jié)即研究具有此種收益結(jié)構(gòu)的時(shí)滯線性隨機(jī)系統(tǒng)的微分博弈問(wèn)題。

2.5.1 問(wèn)題描述

考慮下式描述的博弈系統(tǒng):

其中φC([-τ,0];Rn)為確定性函數(shù),滿足wt為一維標(biāo)準(zhǔn)布朗運(yùn)動(dòng);vit是取值于UiFt-可測(cè)的變量,表示博弈人i的決策控制變量,為非空凸集,i=1,2,v(·)=[v1(·),v2(·)];τ>0為給定的有限的時(shí)間延遲;At?tB1tB2tD0tD1tD2t為具有適當(dāng)維數(shù)的確定性矩陣;G為確定性對(duì)稱矩陣,Qt為非負(fù)的確定性矩陣,Rit為正的確定性矩陣,i=1,2。

我們的問(wèn)題是尋找容許控制[u1(·),u2(·)],使得下述不等式成立J[u1(·),v2(·)]≤J[u1(·),u2(·)]≤J[v1(·),u2(·)].

這樣的[u1(·),u2(·)]稱為博弈問(wèn)題的一個(gè)鞍點(diǎn)。

2.5.2 主要結(jié)論

首先引入下述包含對(duì)稱矩陣Pt,0≤tT的推廣的廣義Riccati方程

其中

定理2.5 具有如下形式

的[u1(·),u2(·)]是博弈問(wèn)題(2.46)的一個(gè)鞍點(diǎn),當(dāng)且僅當(dāng)上述推廣的廣義Riccati方程(2.47)存在解Pt,0≤tT

證明:定義哈密爾頓函數(shù)

根據(jù)最大值原理知

其中(ytzt)是下述伴隨方程的解

由式(2.50)得最優(yōu)控制

于是得到下述隨機(jī)哈密爾頓系統(tǒng)

其中Pt=PΤtRn×n是確定性函數(shù)矩陣。

對(duì)yt=Ptxt應(yīng)用It?公式,得

比較式(2.55)中擴(kuò)散項(xiàng)的系數(shù),得

將式(2.54)和(2.56)代入式(2.52)并經(jīng)過(guò)簡(jiǎn)單的計(jì)算得

為符號(hào)上的簡(jiǎn)便,引入下列記號(hào):

在上述記號(hào)下,式(2.55)可以化簡(jiǎn)為

式(2.57)可以簡(jiǎn)記為

由式(2.57)可得式(2.48)。

將式(2.48)代回式(2.58),從而得到式(2.47),證畢。□

注2.4 本節(jié)只研究了有限時(shí)間時(shí)滯隨機(jī)系統(tǒng)的兩人零和博弈問(wèn)題,對(duì)于無(wú)限時(shí)間的零和博弈,相關(guān)結(jié)論可參考無(wú)限時(shí)間Nash博弈的結(jié)論推出。

主站蜘蛛池模板: 改则县| 伊通| 哈巴河县| 高台县| 莱西市| 堆龙德庆县| 石门县| 长治市| 牡丹江市| 涟水县| 铜鼓县| 曲松县| 礼泉县| 龙里县| 宜良县| 民乐县| 观塘区| 台东市| 伊吾县| 五常市| 平潭县| 石狮市| 宣化县| 寻甸| 临朐县| 甘南县| 开江县| 阿拉善盟| 平泉县| 昌都县| 天长市| 乃东县| 绥滨县| 微山县| 三都| 渝中区| 普陀区| 腾冲县| 吴桥县| 上林县| 建德市|