官术网_书友最值得收藏!

1.2 國內外研究現狀綜述

1.2.1 國內外研究現狀分析

(1)時滯隨機系統理論研究方面:控制理論中存在一個重要的基礎性問題,那就是穩定性研究。針對時滯系統的穩定性,許多學者進行了深入的研究。Mao等[46,47]、Chen等[48]、吳立剛等[49]利用矩陣范數、模型變換以及自由加權矩陣等方法,研究了一般的時滯隨機系統的均方指數穩定性問題。由于近年關于時滯隨機系統涉及許多自然和社會科學領域,其研究成果非常多,不可能在有限的篇幅內一一列舉,而與本書研究密切相關的主要是時滯隨機系統的最優控制問題(即單人博弈問題)及其對應問題的數值仿真算法問題,因此我們對文獻的分析主要集中在這兩個方面。在時滯隨機系統最優控制的理論研究方面:Kolmanovsky和Maizenberg首次運用變分法研究了時滯隨機系統的LQR(linear quadratic regulatory)問題[50];接著Kolmanovsky和Maizenberg運用“probabilistic delay averaging”方法研究了具有時變狀態時滯的隨機線性系統的最優控制,得到了獨立于延時值(the delay value)形式的最優控制策略[51];Basin和Rodriguez-Gonzalez利用最大值原理討論了具有狀態延遲、控制延遲以及狀態和控制都延遲的時變連續時滯隨機系統的最優控制問題[41,42];Zhang等利用對偶法研究了多重輸入延遲的離散系統的LQR問題,同時利用無限維系統理論和頻域/時域分析法研究了多重輸入延遲的連續系統的LQR問題[52];Song等研究了輸入延遲的離散線性系統的LQR問題,通過將LQR問題轉換為Hilbert空間中相應倒向隨機模型的優化問題,借助于動態規劃方法獲得了系統的最優解[53];上述的研究成果都是針對時滯線性系統取得的,Elsanosi等[54]、Larssen[55]、?ksendal和Sulem[56]、G?llmann等[57]利用Pontryagin最大值或Bellman動態規劃原理研究了時滯非線性系統的最優控制問題;這里值得特別提出的是,山東大學的彭實戈院士和其學生楊哲博士在參考文獻[43]中引入了一類新型的被稱為超前倒向隨機微分方程(Anticipated backward stochastic differential equations,超前BSDE),該方程與時滯隨機微分方程存在著一種對偶關系,通過對偶方法可以獲得時滯隨機系統的最大值原理;Chen和Wu在參考文獻[43]的基礎上,研究了狀態、控制都延遲的時滯隨機系統最優控制問題的最大值原理,得到了最優控制存在的充分必要條件,進一步給出了其在生產消費最優選擇問題中的應用[44]。在時滯隨機微分方程的數值仿真方面:Buckwar利用一步法(one-step methods)研究了時滯隨機微分方程的數值求解算法,同時給出了數值仿真算例驗證了算法的有效性[58];Mao和Sabanis在假設時滯隨機微分方程滿足局部Lipschitz條件下用Euler-Maruyama法給出了其數值求解算法[59];Karimi利用Haar小波技術給出了時滯系統有限時域線性最優控制策略的數值求解算法[60];Wang利用廣義的分塊脈沖函數和勒讓德多項式技術研究了包含逆向時間函數的線性時滯系統,借助線性二次最優控制的相關結果給出了最優控制近似解的數值算法[61];Haddadi等運用分塊脈沖函數和伯努利多項式的相關性質,研究了具有二次型性能指標泛函的線性時變時滯系統的最優控制問題,得到了控制策略的數值解法,并通過數值算例驗證了結論的正確性[62]

可見關于時滯隨機系統最優控制問題及其數值求解已經取得了比較豐富的成果,這為研究時滯隨機系統微分博弈奠定了堅實基礎。但目前關于時滯隨機系統的微分博弈理論研究成果較少,因此特提出本書的研究。

(2)動態系統博弈理論研究方面:博弈理論的研究也已取得較豐富的成果,與本書有關的,主要是有狀態方程作為約束的微分博弈理論,它主要包括零和博弈的鞍點均衡理論、非零和博弈的Nash均衡理論、Stackelberg均衡理論以及激勵(Incentive)策略理論。針對正常系統(特別是正常線性系統),Basar和Olsder在專著中系統地總結了常微分方程和隨機微分方程描述的動態非合作微分博弈理論及其應用成果(見參考文獻[1]及其所引文獻);Engwerda較系統地研究了如何處理由微分博弈而衍生出的Riccati方程等問題的數學技巧及對應均衡解的數值算法[63,64];隨后,Engwerda討論了奇異線性系統微分博弈問題的開環和反饋Nash均衡解問題[65,66];Dockner等介紹了非合作微分博弈及其在經濟與管理科學中的應用[19];Erickson系統地介紹了廣告競爭微分博弈模型[20],其中特別詳細地介紹了Lanchester,Vidale-Wolfe等模型;J?rgensen和Zaccour則主要研究了市場營銷中的微分博弈問題[21],介紹了微分博弈在定價、廣告、營銷渠道等領域中的應用;Yeung和Petrosyan系統地介紹了合作微分博弈理論及其在資源與環境經濟學中的應用[67];有關微分博弈近些年的最新發展及熱點研究方向見最新的兩篇文獻綜述J?rgensen和Zaccour[68]與Buckdahn等[69]。在國內,張嗣瀛院士的專著《微分對策》[70]和李登峰的專著《微分對策及其應用》[71]可能是這方面最早的讀物,但這兩本書的重點是分析微分對策在典型的軍事、控制問題上的應用,幾乎沒有涉及在經濟與管理科學中的應用。雍炯敏教授在關于具有轉換與脈沖策略的兩人零和微分對策等方面發表過很有影響的論文[72],曾獲得美國數學評論主編Berkovitz的高度評價。國內在微分博弈理論研究方面還有山東大學的李娟和吳臻在隨機微分對策、重慶大學的張榮在基于自抗擾控制理論的微分對策均衡解、青島大學的高紅偉在動態合作對策、中南大學的年曉紅在多體合作與對抗的微分對策、北航的周銳在利用神經網絡計算微分對策、東北大學的宋崇輝在微分對策的數值解、復旦大學的許亞善在基于反饋策略的微分對策理論、中科院自動化所的魏慶來在零和微分對策等方面取得了值得關注的研究進展,部分研究成果發表在頗有影響的國際期刊上。在微分對策的應用方面,國內也已經有越來越多學者將微分博弈應用于期權定價、投資組合選擇、漁業資源配置、廣告競爭以及供應鏈、寡頭競爭、具有網絡外部性的動態定價等領域的研究中(見參考文獻[73]及其所引文獻)。綜觀國內外學者的研究成果可以發現:利用常微分方程和隨機微分方程描述的LQ微分博弈取得較多高水平成果,而時滯隨機系統的LQ微分博弈的成果則并不多見。

(3)時滯隨機系統魯棒控制理論研究方面:魯棒控制是人們處理不確定性的基本方法之一。目前對線性系統的魯棒控制理論已經進行了廣泛的研究,取得了較豐富的成果,成果涉及了定常和時變系統、連續和離散及采樣系統、時滯系統和互聯系統等[74]。魯棒控制從性能上可分為:H2魯棒控制、H魯棒控制、H2/H混合魯棒控制。常使用的方法有頻域設計方法[75,76]、Lyapunov方法(含LMI法)[77,78]、博弈論方法[22~29]。與本書相關的主要是博弈論方法,利用博弈論方法研究魯棒性能控制器的開拓工作首先由Dorato等人于20世紀60年代給出[79],由于需要求解微分極小極大問題,故沒有引起人們足夠重視。隨著博弈理論和計算技術的發展,從1990年起,這種設計思想被當作魯棒設計的有力武器,其基本思想是將相應的魯棒控制問題轉化為鞍點均衡問題或Nash均衡問題,利用現有的線性系統博弈理論進行分析求解。代表性的工作有Basar和Limebeer等人的研究,Limebeer等人在研究線性系統的H魯棒控制和混合H2/H魯棒控制時,將其轉化為兩人博弈問題,通過求解鞍點均衡策略或Nash均衡策略得到了系統的最優魯棒控制策略[22,23];Basar用博弈論方法詳細討論了線性系統魯棒控制問題[80];接著,Chen和Zhang利用隨機Nash博弈的相關結果將確定性線性系統的混合H2/H控制推廣到了It?線性隨機系統[24];Savkin[81]和Amato[82]等還用微分博弈的最大最小極值方法研究了不確定系統的魯棒H控制;Amato和Pironti則研究了不確定時滯系統的H控制問題[83]。但總體而言,對時滯隨機系統魯棒控制問題的研究,由于時滯系統所固有的時滯特性所帶來的本質上的困難,同時也由于時滯隨機系統沒有形成像線性系統那樣簡單且易于實現的博弈均衡策略理論,時滯隨機系統的魯棒控制理論研究還不夠深入,成果也不夠豐富;特別是用博弈論方法研究時滯隨機系統各種性能魯棒控制的結果還不夠完善。

(4)時滯隨機系統應用領域方面的研究:時滯系統在工程領域的應用是比較多的,如電路信號系統、化工循環系統和電力系統等等[30,37]。而本項目主要關注其在社會經濟領域內的應用,比較集中的應用領域有以下幾點。①金融保險中風險資產定價問題(詳見所依賴的社會經濟問題之二);Zimbidis和Haberman研究了時滯和反饋對保險定價過程的綜合影響。把時滯因子看作自由參數,得到了穩定性條件和反饋因子的優化條件,并且使用控制論的工具,得到了時滯因子的一個臨界值,大于此值穩定性就和反饋因子的選擇無關[14]。針對價格呈現幾何Brown運動的資產,Grassia考慮了市場時滯和投資反饋的影響,改進了基本的Brown運動模型,研究了金融市場中的時滯、反饋和遏制現象。當投資反饋足夠大時,資本市場的動力學從緩慢的隨機游動變為快變不穩定性態。但是投資者出于自身利益考慮,會放棄即將崩潰的市場,或者涌向繁榮的市場而使之飽和,使得不穩定的失控性態受到遏制,這種遏制將足以保證資產價格在一段時期內有界[35]。②多部門固定資產投入產出模型(詳細描述見社會經濟需求分析中的①)[4~6]。③在動態商業周期分析領域,周路軍在幾類商業周期擴展模型的基礎上,考慮到商業周期模型中存在時間延滯(資本積累方程中存在時滯或稅收收入中存在時滯,時滯有可能是離散的固定時滯也有可能是指數分布時滯),通過運用Routh-Hurwith規則、穩定性切換定理、Horp分岔理論等探討了時滯對經濟系統的影響[84]等通過引入一個時滯τ進入Kaldor商業周期模型中分析了Kaldor-Kalecki模型[85];De Cesare和Sportelli探索了收入時滯的影響,通過形成時滯微分方程,證明了正則性經濟周期的存在[86];Fanti和Manfredi[87]基于IS-LM加速數模型,探索了稅收收入中指數分布時滯對經濟的動態影響;Zhou和Li研究了資本積累和投資過程中存在時滯效應時的IS-LM模型,證明了時滯是導致均衡點失去或獲得局部穩定及Horp分岔的原因[88,89]

1.2.2 國內外研究發展趨勢分析

上述國內外學者在該領域的相關研究成果呈現以下幾個特點和發展趨勢。

特點1:對社會經濟系統中實際問題的描述和建模由以前的一般隨機系統模型,更多地呈現出用更接近現實的時滯隨機系統建模。

特點2:時滯隨機系統的LQ最優控制問題(即對應系統的單人微分博弈Nash均衡問題)已經取得比較豐富的結果。但對應系統的多人LQ微分博弈理論則還沒有成熟而系統化的成果。

趨勢2:時滯隨機系統的魯棒控制研究是當前尚需研究的重要領域,而用博弈論方法研究魯棒控制問題已成為重要的方法之一,從而用時滯隨機系統的博弈理論研究相應系統的魯棒控制問題是新的研究方向。

主站蜘蛛池模板: 开阳县| 昌乐县| 宿州市| 张家界市| 宁蒗| 阿鲁科尔沁旗| 怀柔区| 星座| 梨树县| 房产| 拜城县| 德格县| 嘉鱼县| 高州市| 伊宁县| 长岭县| 原阳县| 手游| 城固县| 汕尾市| 祁连县| 紫阳县| 黄浦区| 广元市| 饶河县| 华坪县| 阳原县| 四川省| 贵阳市| 新乡市| 德州市| 绥化市| 基隆市| 东平县| 大城县| 桦甸市| 柞水县| 澄迈县| 岐山县| 沭阳县| 太白县|