官术网_书友最值得收藏!

1.1 研究背景與意義

從系統理論的觀點看,任何實際系統的過去狀態不可避免地要對當前的狀態產生影響,即系統的演化趨勢不僅依賴于系統當前的狀態,也依賴于過去某一時刻或若干時刻的狀態,這類系統稱為時滯系統,有時也稱為泛函微分系統,英文文獻中多稱為Time-Delay Systems或Systems with Aftereffect。21世紀以來,許多學科中提出了大量的時滯系統問題,如電路信號系統、核物理學、生態系統、遺傳問題、化工循環系統、流行病學、動物與植物的循環系統。社會科學方面主要是各種經濟時滯現象的描述,如產品營銷問題、國民財富分配理論、資本主義周期性經濟危機、物流調度、工業管理等等。因此研究時滯系統,或者說是泛函微分系統就有了其深刻的理論和實際意義。

作者在完成國家自然科學基金和廣東省自然科學基金的過程中,獲得了確定性動態系統和隨機系統微分博弈理論的部分結果,同時在研究線性Markov切換系統動態經濟模型結構特征與控制時,發現像期權定價、多部門動態投入產出模型這樣的實際經濟系統模型,借助時滯隨機系統模型來描述更能準確反映經濟系統的動態特性。同時,鑒于微分博弈理論具有廣闊的應用前景,特提出本書的研究內容,希望借此完成如下科學問題的研究。

科學問題:

正常隨機線性系統的微分博弈理論時滯隨機系統的微分博弈理論。

亦即本書研究的科學問題是:式(1.1)描述的狀態和控制均存在時滯的隨機系統的微分博弈理論。

其中wt是定義在完備概率空間(Ω,F,{Ft}0≤t∈TP)上的d-維標準布朗運動,為給定函數;ui(·)是取值于UiFt-可測的控制變量,表示博弈人i的決策控制變量,為非空凸集,i=1,2;τ>0為給定的有限的時間延遲,φt、ξt和ηt為確定性函數,滿足

Ji[u1(·),u2(·)]表示博弈人i∈{1,2}的性能指標泛函:

其中ΦiRnRi=1,2為給定的函數。

所謂的微分博弈問題是:博弈人i∈{1,2}如何在滿足狀態方程(1.1)的約束條件下選擇自己的決策控制變量ui(·),使各自的性能指標函數Ji[u1(·),u2(·)]達到最優[1]

顯然,如果只有一個博弈人(即單人博弈),則博弈問題退化為時滯隨機系統的最優控制問題,即在如下狀態方程

的約束下,尋找最優控制策略u1*(·),使性能指標泛函J[u1(·)]達到最優。因此,時滯隨機系統的最優控制理論是時滯隨機系統微分博弈理論的特例。

而當τ=0,即系統中的狀態變量和控制變量不存在時滯時,式(1.1)退化為一般意義下的It?隨機系統,即

因此,從這個意義來說,It?隨機系統的微分博弈理論是時滯隨機系統微分博弈理論的特例,時滯隨機系統是It?隨機系統的自然推廣。

而當σ(·,·,·,·,·,·)=0時,式(1.1)變為下述確定性(deterministic)時滯系統

顯然,時滯隨機系統(1.1)可以看作是deterministic時滯系統(1.4)的推廣,相當于在系統(1.4)中加了隨機擾動項σ(·,·,·,·,·,·)dwt。因此,deterministic時滯系統微分博弈理論是時滯隨機系統微分博弈理論的特例。

因此,本書的研究既有繼承又有創新發展,是有理論意義的。

同時,時滯隨機系統微分博弈理論還有重要的實際應用價值,下面從本書擬研究問題的科學需求、社會經濟需求兩個方面進一步分析本選題的依據和意義。社會經濟需求是指對該學科有所依賴的社會經濟問題的需求;科學需求是指學科自身知識體系完善的內在需求[2](如圖1.1所示)。

圖1.1 研究問題的科學發展需求分析兩維體系

1.社會經濟需求分析

(1)所依賴的社會經濟問題之一:多部門動態投入產出分析模型。1965年,Leontief提出了離散的動態投入產出模型[3]

其中Xk)=[x1k),x2k),…xnk)]T,而xik)是第i部門第k年總產出量;yk)是第k年最終消費量(不包括投資)向量;A是生產系數矩陣;B是投資系數矩陣。模型(1.5)的提出依賴于兩個假設:①各部門從投資開始到投產沒有時間上的延遲,二者同時開始;②投資是一次性的,即所有投資產品,包括建筑工程、機器設備、流動資金等在工程開始時同時投入,沒有時間上的先后之分。這與實際經濟活動顯然是不相符的。為此,必須研究考慮時滯效應下的投入產出模型,何堃研究了規劃期為m年,具有多年時滯因素的投入產出模型[4]

其中z表示所有投資產品中最大的時滯數;Bk+ll)為第k年,時滯為l年(lz)的投資產品的n階投資系數矩陣。模型(1.6)即為含時滯的動態投入產出模型,它能較準確地刻畫國家(或地區、部門)經濟的生產、積累和消耗之間的關系,因而可以更好地進行經濟預測和制定中長期規劃。

此外,付雪和陳錫康綜合考慮了人力資本和物資資本具有多年時滯的特點,建立了多年時滯教育經濟投入占用產出模型和人力資本投入產出模型[5,6]

因此,通過本書的研究可以分析當投資品投入與產出具有時滯時,各部門的最優投資均衡策略(鞍點均衡、Nash均衡等),為動態投入產出分析提供新理論和新方法。

(2)所依賴的社會經濟問題之二:金融工程的期權定價問題、資本投資和保險定價等問題[7~14]。20世紀70年代早期,Black和Scholes利用幾何布朗運動wt)模擬期權標的風險資產在t時刻的價格St),即

其中μσ為給定常數,分別表示風險資產的預期收益率和波動率,wt)為一維標準布朗運動,反映金融市場的變化。盡管Black和Scholes利用式(1.7)給出了幾乎完美的期權定價公式,但大量實踐表明使用Black-Scholes公式并不能精確預測期權價格,這也促使許多學者對該模型進行改進,其中一種改進就是建立動態模型來考慮過去的事件對現在和將來的影響,即假設期權的價格不僅僅與當前的信息有關,過去的信息也應當會影響到期權的價格。于是,期權標的風險資產的價格St)可以用一個時滯隨機微分方程(Stochastic Delay Differential Equation)來描述:

其中μab為正常數,δ=maxabg:R→R是一個連續函數,φt)為確定性實值函數。目前已有部分學者利用隨機分析的方法討論模型(1.8),如Anh和Inoue、Kazmerchuka等考慮了股票價格在擴散項具有時滯的期權定價[10~12],Arriojas等、Chang和Youree研究了股票價格在漂移項和擴散項都具有時滯情形下的期權定價[7,13]。但是,他們在分析處理該問題時都會遇到一個困難:要給出由模型(1.8)所衍生出的各種形式的定價偏微分方程的解,這無疑增加了分析問題的難度。

作者認為,為了避免求解時滯隨機系統(1.8)所衍生出的各種偏微分方程的困難,應將期權定價過程視為一個博弈過程,博弈人1為定價者,其決策控制變量為其投資策略;博弈人2即擬人化的風險市場隨機干擾“代理人”,該“代理人”的決策控制變量為描述隨機擾動的布朗運動過程w(·)。而時滯隨機系統(1.8)所表示的正好是博弈雙方的狀態演化過程。這樣就可以利用時滯隨機系統的非合作微分博弈理論進行研究。比如:若在上述模型(1.8)中假設ut)和Vt)分別表示在t時刻持有某標的資產的價值和投資者的財富,則期權套期保值問題就是:如何在博弈人2(市場干擾“代理人”)的最大隨機波動干擾下,尋找自融資證券組合套期保值策略u(·),使終期證券組合的價值VT)盡可能接近期權的到期支付F[ST)][7]。因此,它是一個典型的時滯隨機系統的鞍點均衡策略問題。研究表明:投資消費和保險定價問題也可以在一定條件下轉化為時滯隨機系統魯棒控制問題[8,9,14]。因此,社會經濟的實際問題研究需要用時滯隨機系統微分博弈理論。

(3)所依賴的社會經濟問題之三:廣告模型(Advertising models)。基于數學模型的最優廣告投入的研究始于1957年Vidale和Wolfe提出的廣告銷售反應模型(VW模型)[15]和1962年Nerlove和Arrow提出的廣告的資本股模型(NA模型)[16],經過50多年的發展,這方面研究已取得了豐碩的成果,并且有些已成為企業確定最優廣告投入的依據。但實證研究表明這些成果與經驗數據項的符合程度不盡人意。為此部分學者考慮了廣告支出與商譽資本增值之間存在時間滯后情形下的最優廣告投入問題,典型的工作見Gozzi和Marinelli等[17,18]。他們的研究考慮了單個商品的廣告模型,設ys),0≤sT表示商譽水平,z表示廣告支出,則有

其中w(·)是定義在完備概率空間上的布朗運動,a0≤0是一個常數值的衰減系數,b0≥0是一個常數值的廣告效果因子,a1(·)表示遺忘時間的分布函數,b1(·)表示商譽水平y(·)和廣告支出z(·)之間時間滯后的密度函數,η0表示廣告開始時的商譽水平,η(·)和δ(·)分別表示商譽水平和廣告支出在零時刻以前的歷史值。注意到當a1(·),b1(·)和σ都等于0時,方程(1.9)就退化為經典的NA模型。對于經典的NA模型,已有部分學者利用微分博弈的方法來研究并成功運用到市場實踐中(見參考文獻[19~21]及其所引文獻)。據作者搜集查閱的文獻資料所知,對于考慮時滯效應下的廣告模型,利用最優控制來進行研究的成果已經出現,利用微分博弈來進行研究的還未見報道,而在微分博弈的理論框架下研究廣告模型能揭示出一般模型表示中可能遺漏的重要結論,進而使得很多在經典最優控制框架下難以圓滿解釋的問題,在微分博弈的理論框架下可以得到更加系統、客觀的回答[19]。因而通過本書的研究,能夠為廣告模型提供更加貼近現實的結果,從而為企業決策提供更為精確的依據。

(4)所依賴的社會經濟問題之四:魯棒控制問題。針對式(1.1)所描述的時滯隨機系統的魯棒控制問題,基于博弈論方法設計魯棒控制器的基本思想是:將控制策略設計者視為博弈的一方即博弈人1,將隨機性(或不確定性)干擾視為博弈的另一方即擬人化的“干擾代理人”,從而將魯棒控制問題轉化為兩人博弈問題,即博弈人1如何在預期到“干擾代理人”的各種干擾策略情況下設計自己的策略,既實現與“干擾代理人”的均衡又使自己的目標最優。通過將不同性能要求的魯棒控制問題轉化為各種類型的鞍點均衡問題或Nash均衡問題,再由微分博弈理論的鞍點均衡策略或Nash均衡策略即可得到魯棒控制策略。這種用博弈論方法研究魯棒控制問題的思路已經在確定系統的魯棒控制研究中取得了巨大成功,如Limebeer等分別給出了線性時變系統的H魯棒控制、混合H2/H魯棒控制器設計的博弈論方法[22,23];臺灣清華大學的陳博現(Chen Bor-Sen)教授和山東科技大學的張維海(Zhang Weihai)教授用博弈論方法首次將確定系統的混合H2/H控制問題的結果推廣到噪聲依賴狀態的隨機系統中,證明了有限(無限)時域隨機H2/H控制的存在性等價于一個耦合的廣義微分(代數)Riccati方程的可解性[24];Huang等利用博弈論的方法將噪聲依賴于狀態的線性隨機系統的混合H2/H控制推廣到帶Markov跳變參數的線性隨機系統混合H2/H控制上[25];筆者也在系統研究線性Markov切換系統隨機微分博弈的基礎上,利用相關結果研究了線性Markov切換系統的H魯棒控制、混合H2/H魯棒控制問題[26~29]。但就筆者所查到的資料而言,用博弈論方法研究時滯隨機系統各種性能魯棒控制的結果較少且還不完善。因此作者確信,只要研究出一套完整的時滯隨機系統微分博弈理論,就有可能獲得時滯隨機系統魯棒控制問題的新方法、新結果。

1.科學需求分析

(1)從正常隨機系統到時滯隨機系統的內在需求分析:雖然愛因斯坦(A.Einstein)、柯爾莫戈洛夫(A.N.Kolmogorov)、維納(N.Wiener)和伊藤清(K.It?)等科學家建立的隨機系統的相關理論已經能較好地描述現實世界中的許多系統,但更現實的情況是眾多實際系統的狀態或多或少都與系統的歷史相關,或者說系統的歷史會影響其現狀和將來的發展,這些現象稱為時滯現象。時滯現象大量存在于自然科學與社會科學中,如通信系統[30]、神經網絡[31,32]、生物和人口系統[33,34]、經濟金融[35]、化工循環系統[36]、城市交通管理系統和工業生產管理等[37]。為了準確地刻畫這些系統的動態特性,需要用時滯隨機系統來描述。目前有關隨機系統的非合作博弈理論已經取得了豐富的研究成果,而且成功用于研究隨機系統的魯棒控制問題,因此需要研究時滯隨機系統的微分博弈理論。

(2)從博弈理論自身知識體系完善性的內在需求分析:隨機系統的非合作博弈理論,已經有了較系統的理論體系,而對時滯隨機系統的非合作博弈理論,學者們的研究相對較少,僅日本廣島大學的Mukaidani教授等研究了狀態時滯的隨機線性系統和隨機弱耦合線性系統的Nash均衡存在的條件,利用線性矩陣不等式(LMI)技術給出了均衡策略的狀態反饋解[38~40],但工程實際中存在著大量控制時滯的隨機系統。因此,從博弈理論自身知識體系完善性的內在需求出發,需要對時滯隨機系統的微分博弈理論進行系統研究。

目前國內外學者已經在時滯隨機系統的最優控制問題(即單人博弈問題)等方面展開了廣泛研究并取得了豐富成果[41~45,50~57]。因此,研究時滯隨機系統的微分博弈理論是必要的也是可行的,同時也是有理論意義和現實應用價值的。

主站蜘蛛池模板: 梁河县| 鸡泽县| 商都县| 勐海县| 筠连县| 泰安市| 苍梧县| 洞口县| 梨树县| 榆社县| 比如县| 天台县| 大新县| 永靖县| 吉水县| 亳州市| 民权县| 天津市| 黔西| 宜阳县| 民和| 桐城市| 柳河县| 英超| 合水县| 太白县| 商都县| 涿鹿县| 大埔区| 和静县| 兰坪| 龙海市| 永修县| 山阴县| 定日县| 鹤峰县| 买车| 西华县| 塔城市| 衡阳县| 阳西县|