- 時(shí)滯隨機(jī)系統(tǒng)的微分博弈理論及應(yīng)用
- 朱懷念
- 2018字
- 2019-10-18 16:28:00
前言
自1965年Rufus Isaacs出版了第一部微分博弈專著Differential Games以來,無論其理論還是應(yīng)用研究都得到了很大的發(fā)展。今天,微分博弈已經(jīng)廣泛應(yīng)用于生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計(jì)算機(jī)科學(xué)和軍事戰(zhàn)略等諸多領(lǐng)域,成為科學(xué)有效的決策工具。本書以工程和經(jīng)濟(jì)金融領(lǐng)域中廣泛使用的時(shí)滯隨機(jī)系統(tǒng)為研究對(duì)象,在已有時(shí)滯系統(tǒng)最優(yōu)控制理論和微分博弈理論的基礎(chǔ)上,利用動(dòng)態(tài)優(yōu)化理論中的最大值原理、配方法等,系統(tǒng)研究時(shí)滯隨機(jī)系統(tǒng)的微分博弈問題,并給出其在隨機(jī)H2/H∞控制和數(shù)理金融中的應(yīng)用分析。
全書共分9章。
第1章是緒論。主要介紹了本選題的研究背景和意義,回顧了國內(nèi)外學(xué)者在時(shí)滯隨機(jī)系統(tǒng)微分博弈理論及應(yīng)用研究方面的相關(guān)成果。
第2章研究了擴(kuò)散項(xiàng)中包含狀態(tài)和控制的時(shí)滯線性隨機(jī)系統(tǒng)的Nash微分博弈問題。首先,回顧了時(shí)滯線性隨機(jī)系統(tǒng)二次控制問題的相關(guān)結(jié)論,然后在此基礎(chǔ)上,建立了時(shí)滯線性隨機(jī)系統(tǒng)的兩人Nash微分博弈模型。借助隨機(jī)最大值原理給出了均衡策略的存在條件,得到了均衡策略的顯式表達(dá),拓展了已有的Nash隨機(jī)微分博弈的研究成果。
第3章研究了時(shí)滯線性隨機(jī)系統(tǒng)的Stackelberg博弈問題。首先,針對(duì)系統(tǒng)中不存在時(shí)滯的情形,借助隨機(jī)最大值原理研究了無時(shí)滯動(dòng)態(tài)系統(tǒng)的Stackelberg博弈問題。然后在此基礎(chǔ)上,采用類似的方法研究了時(shí)滯線性隨機(jī)系統(tǒng)的Stackelberg博弈問題,得到了均衡策略的存在條件,給出了均衡策略的顯式表達(dá),拓展了已有關(guān)于Stackelberg隨機(jī)微分博弈的研究成果。
第4章考慮了時(shí)滯線性隨機(jī)系統(tǒng)微分博弈的Pareto策略問題。首先,針對(duì)無時(shí)滯博弈的Pareto策略問題,借助配方法,得到了連續(xù)時(shí)間系統(tǒng)和離散時(shí)間系統(tǒng)Pareto策略存在的條件和顯式表達(dá)。然后,利用此方法研究帶時(shí)滯博弈的Pareto策略問題,推導(dǎo)證明了Pareto策略存在的條件等價(jià)于矩陣不等式存在解,同時(shí)得到了Pareto策略的顯式解和最優(yōu)值函數(shù)的一個(gè)上界。
第5章基于Nash博弈方法研究了時(shí)滯線性隨機(jī)系統(tǒng)的H2/H∞混合魯棒控制問題。借助于時(shí)滯線性隨機(jī)系統(tǒng)Nash博弈的結(jié)果,將控制策略設(shè)計(jì)者視為博弈的一方記為博弈人P1,將隨機(jī)性干擾視為博弈的另一方記為“自然博弈人”P2,從而將魯棒控制問題轉(zhuǎn)化為兩人博弈問題,即博弈人P1如何在預(yù)期到“自然人”P2的各種干擾策略情況下設(shè)計(jì)自己的策略,既實(shí)現(xiàn)與“自然人”的均衡又使自己的目標(biāo)最優(yōu)。解決了噪聲同時(shí)依賴于狀態(tài)、控制和干擾的時(shí)滯線性隨機(jī)系統(tǒng)的混合H2/H∞控制問題,證明了控制器的存在性,并借助正倒向隨機(jī)微分方程給出了反饋控制策略的解析表達(dá)。
第6章研究了廣義時(shí)滯線性隨機(jī)系統(tǒng)的多人Nash微分博弈問題。首先,針對(duì)無時(shí)滯情形下的廣義線性隨機(jī)系統(tǒng),討論了其在有限時(shí)間和無限時(shí)間域內(nèi)的N人Nash微分博弈問題,借助一組推廣的耦合Riccati方程得到了Nash均衡策略存在的充分條件,即耦合Riccati方程如果存在解,Nash均衡策略就存在,同時(shí)給出了Nash均衡策略的顯式表達(dá)。然后,將相關(guān)結(jié)果拓展至廣義時(shí)滯線性隨機(jī)系統(tǒng)的多人Nash微分博弈問題中,得到了Nash均衡策略的存在條件等價(jià)于一組矩陣不等式存在解。最后,將所得到的廣義時(shí)滯線性隨機(jī)系統(tǒng)的多人Nash微分博弈結(jié)果應(yīng)用于隨機(jī)H2/H∞控制中,得到了隨機(jī)H2/H∞控制的存在條件和顯式表示。
第7章考慮了時(shí)滯非線性隨機(jī)系統(tǒng)的Nash微分博弈問題。針對(duì)一類噪聲依賴于狀態(tài)和控制的時(shí)滯非線性隨機(jī)系統(tǒng),研究了無限時(shí)間域內(nèi)的兩人Nash微分博弈問題,借助四個(gè)耦合的Hamilton-Jacobi方程組(HJEs)得到了Nash均衡策略存在的充分條件,即耦合HJEs如果存在解,Nash均衡策略就存在,同時(shí)給出了Nash均衡策略的顯式表達(dá)。最后,通過一個(gè)數(shù)值算例驗(yàn)證了所得結(jié)論的有效性。
第8章在第7章的基礎(chǔ)上研究了一類噪聲依賴于狀態(tài)、控制和干擾的無限時(shí)間域內(nèi)的時(shí)滯非線性隨機(jī)系統(tǒng)混合H2/H∞控制問題。首先,借助于四個(gè)耦合的Hamilton-Jacobi方程組得到了帶時(shí)滯的非線性隨機(jī)系統(tǒng)H2/H∞控制存在的充分性條件。然后,基于T-S模糊模型給出了噪聲依賴狀態(tài)和控制的時(shí)滯非線性隨機(jī)系統(tǒng)H2/H∞控制器的設(shè)計(jì)方案??刂破鞯脑O(shè)計(jì)可通過求解一組線性矩陣不等式獲得,從而避開了求解耦合HJEs的困難。最后,數(shù)值仿真算例驗(yàn)證了結(jié)論的有效性。
第9章基于博弈分析的方法研究了數(shù)理金融中的投資組合選擇問題及生產(chǎn)和消費(fèi)選擇問題。針對(duì)投資組合選擇問題,將自然看成博弈的“虛擬”對(duì)手,在投資者與自然之間構(gòu)建了一個(gè)兩人零和隨機(jī)微分博弈模型,投資者選擇一個(gè)投資策略最大化其終止時(shí)刻財(cái)富期望效用,而市場選擇一個(gè)概率測度代表的投資環(huán)境最小化投資者的最大化終止時(shí)刻期望財(cái)富效用。利用最大值原理得到了投資者的最優(yōu)投資策略的顯式解。針對(duì)生產(chǎn)和消費(fèi)選擇問題,構(gòu)建了雇主和雇員之間的一個(gè)兩人非零和微分博弈模型,消費(fèi)策略c(·)和努力水平v(·)分別是兩個(gè)博弈參與人的控制策略,兩個(gè)博弈參與人分別選擇c(·)和v(·)最大化效用函數(shù)J1[c(·),v(·)]和J2[c(·),v(·)],利用隨機(jī)最大值原理獲得了兩個(gè)博弈參與人的最優(yōu)策略。
最后是結(jié)論與展望,對(duì)本書的主要結(jié)論進(jìn)行了總結(jié),并提出了未來研究方向。
本書是作者對(duì)時(shí)滯隨機(jī)系統(tǒng)微分博弈理論及應(yīng)用問題研究的初步嘗試和探索,由于作者的知識(shí)水平和研究能力的限制,書中一定存在不少疏忽及不妥之處,敬請(qǐng)讀者批評(píng)指正。
- 西去東來:沿絲綢之路數(shù)學(xué)知識(shí)的傳播與交流
- 奇妙數(shù)學(xué)史:數(shù)字與生活
- 一定要懂博弈論
- 數(shù)學(xué)實(shí)驗(yàn)教程
- 數(shù)學(xué)的力量
- 數(shù)學(xué)與決策:數(shù)學(xué)教你做決定
- 愛情數(shù)學(xué)(TED 思想的力量系列)
- 神機(jī)妙算:一本關(guān)于算法的閑書
- 數(shù)學(xué)多大點(diǎn)事兒
- 概率論與數(shù)理統(tǒng)計(jì)
- 說不盡的圓周率
- 實(shí)用高等數(shù)學(xué)
- ANSYS 15.0有限元分析從入門到精通 (清華社視頻大講堂大系)
- 數(shù)學(xué)家、間諜與黑客:密碼與解碼(萬物皆數(shù)學(xué))
- 在動(dòng)手實(shí)驗(yàn)中學(xué)習(xí)科學(xué)與數(shù)學(xué)