官术网_书友最值得收藏!

1.3 序貫均衡

納什均衡的原始定義適用于具有完全信息的靜態(tài)博弈,在不完美信息的動態(tài)博弈下可能存在不可置信的威脅。序貫均衡是對納什均衡的嚴(yán)格而有影響力的改進(jìn),能夠剔除不可置信的威脅,甚至被認(rèn)為是對完美貝葉斯均衡的再精煉。

在博弈G 中,參與者 pi的信念βi表示對于每個信息集Iij上的具體節(jié)點xIij ,該參與者對其在該節(jié)點的概率判斷為βi(x)=Pr[x|Iij]。信念系統(tǒng)表示每個參與者信念的集合,意味著參與者對處于信息集上的具體非終止節(jié)點的概率分布判斷,即參與者對于其他參與者歷史行為的判斷。參與者在非終止節(jié)點x的期望效用表示該參與者從節(jié)點x到每個終止節(jié)點的概率與效用乘積之和,其中,ui(e)表示參與者在每個終止節(jié)點的效用,Pr[e|s,x]表示參與者到達(dá)終止節(jié)點的概率,s表示策略組合。表示該參與者在屬于該信息集Iij上的每個非終止節(jié)點的期望效用之和。

在博弈G中,給定策略組合s和信念系統(tǒng)β。如果對于任意參與者pi,有?si'si,ui((si',s-i),β,Iij)≤ui(s,β,Iij),則稱s=(si,s-i)在信息集Iij上是理性的。如果s=(si,s-i)在任意信息集IijI上都是理性的,則稱(s,β)是序貫理性的。如果存在一個完全混合策略組合序列收斂于s,以及通過貝葉斯法則得到的信念序列(收斂于β,則稱(s,β)是序貫一致的。(s,β)是序貫均衡的,當(dāng)且僅當(dāng)其是序貫理性且序貫一致的。也就是說,序貫均衡要求參與者的效用不止在整個博弈中是最優(yōu)的,同時在每個信息集上都是最優(yōu)的。

主站蜘蛛池模板: 博白县| 柞水县| 临漳县| 竹溪县| 丽江市| 昌都县| 渝北区| 东乡族自治县| 永顺县| 浠水县| 弋阳县| 海阳市| 海伦市| 卓资县| 平遥县| 乳源| 湘西| 景德镇市| 左权县| 区。| 民和| 阿拉尔市| 定安县| 洞头县| 中卫市| 盱眙县| 邯郸县| 阳东县| 罗城| 无锡市| 郧西县| 阿鲁科尔沁旗| 土默特左旗| 浦北县| 彭山县| 当阳市| 九龙县| 宿松县| 郸城县| 名山县| 双柏县|