- 博弈論與數(shù)據(jù)安全
- 田有亮 張鐸
- 561字
- 2023-08-23 12:52:55
1.3 序貫均衡
納什均衡的原始定義適用于具有完全信息的靜態(tài)博弈,在不完美信息的動態(tài)博弈下可能存在不可置信的威脅。序貫均衡是對納什均衡的嚴(yán)格而有影響力的改進(jìn),能夠剔除不可置信的威脅,甚至被認(rèn)為是對完美貝葉斯均衡的再精煉。
在博弈G 中,參與者 pi的信念βi表示對于每個信息集Iij上的具體節(jié)點x∈Iij ,該參與者對其在該節(jié)點的概率判斷為βi(x)=Pr[x|Iij]。信念系統(tǒng)表示每個參與者信念的集合,意味著參與者對處于信息集上的具體非終止節(jié)點的概率分布判斷,即參與者對于其他參與者歷史行為的判斷。參與者在非終止節(jié)點x的期望效用
表示該參與者從節(jié)點x到每個終止節(jié)點的概率與效用乘積之和,其中,ui(e)表示參與者在每個終止節(jié)點的效用,Pr[e|s,x]表示參與者到達(dá)終止節(jié)點的概率,s表示策略組合。
表示該參與者在屬于該信息集Iij上的每個非終止節(jié)點的期望效用之和。
在博弈G中,給定策略組合s和信念系統(tǒng)β。如果對于任意參與者pi,有?si'≠si,ui((si',s-i),β,Iij)≤ui(s,β,Iij),則稱s=(si,s-i)在信息集Iij上是理性的。如果s=(si,s-i)在任意信息集Iij∈I上都是理性的,則稱(s,β)是序貫理性的。如果存在一個完全混合策略組合序列收斂于s,以及通過貝葉斯法則得到的信念序列(
收斂于β,則稱(s,β)是序貫一致的。(s,β)是序貫均衡的,當(dāng)且僅當(dāng)其是序貫理性且序貫一致的。也就是說,序貫均衡要求參與者的效用不止在整個博弈中是最優(yōu)的,同時在每個信息集上都是最優(yōu)的。
- Securing Blockchain Networks like Ethereum and Hyperledger Fabric
- 工業(yè)互聯(lián)網(wǎng)安全防護(hù)與展望
- 黑客攻防與電腦安全從新手到高手(微視頻+火力升級版)
- 網(wǎng)絡(luò)運(yùn)維親歷記 (網(wǎng)絡(luò)運(yùn)維紀(jì)實文學(xué))
- ARM匯編與逆向工程:藍(lán)狐卷·基礎(chǔ)知識
- 從0到1:CTFer成長之路
- 云原生安全技術(shù)實踐指南
- 網(wǎng)絡(luò)安全設(shè)計、配置與管理大全
- Web安全之深度學(xué)習(xí)實戰(zhàn)
- 人工智能安全(精裝版)
- 網(wǎng)絡(luò)安全實戰(zhàn)詳解(企業(yè)專供版)
- 物聯(lián)網(wǎng)信息安全技術(shù)
- Securing Network Infrastructure
- Practical Internet of Things Security
- 一本書讀透金融科技安全