也就是开司和利根川玩的那个国王-市民-奴隶的卡牌游戏
一、首先考虑剧中的设定
假设双方有n张民牌
王方:王 民 ... 民
奴方:奴 民 ... 民
设
a[n]: 王方胜利的概率
1-a[n]: 奴方胜利的概率
第一局双方出牌的概率
王方
p[n]:出王的概率 1-p[n]:出民的概率
奴方
q[n]:出奴的概率 1-q[n]:出民的概率
有一个地方我没懂,双方的卡牌可以收回去吗?
如果双方都出民,那民肯定是要收掉的,不然一直出民,游戏就永远不会结束了
但如果一方出的不是民呢?例如双方出王-民
1、双方都能保留自己的牌。那双方可以一直出王或奴,牌就不会损耗;就算这一张牌输了,但是可以一直拖下去,游戏永不完结,就没有意义了
2、王方的王可以保留,奴方的民损耗掉(像是军棋)
3、双方的牌都损耗掉,只是给王方+1分
其实23两种情况的最后结果没有区别
四种情况:
p[n]q[n]: 王-奴,奴方胜利
因为接下来奴方可以一直出民,把王方的民全部兑掉即可
如果奴方可以保存这张奴,那最后还能剩一个奴
p[n](1-q[n]): 王-民,王方胜利
因为接下来王方可以一直出民,把奴方的民全部兑掉即可
如果王方可以保存这张王,那最后还能剩一个王+民
(1-p[n])q[n]: 民-奴,王方胜利
因为接下来王方可以一直出民,把奴方的民全部兑掉即可
如果王方可以保存这张民,那最后还能剩一个王
如果王方可以保存这张民,那还可以改成一直出王,把奴方的民全部吃掉,最后全部牌都能存活
(1-p[n])(1-q[n]): 民-民,双方的牌抵消掉,转移成双方n-1张民牌的情况
a[n-1]: 王方胜利
1-a[n-1]: 奴方胜利
特别地,如果n=0(递推的初始情况)
双方0张民
王方:王
奴方:奴
此时
a[0] = 0: 王方胜利
1-a[0] = 1: 奴方胜利
出牌概率:
王方:p[0] = 1
奴方:q[0] = 1
总结:
递推起始条件
a[0] = 0
p[0] = 1
q[0] = 1
递推式:
a[n] = p[n](1-q[n]) + (1-p[n])q[n] + (1-p[n])(1-q[n])a[n-1]
设王方期望收益:赢了收获W,输了赔付S
e[n] = a[n]W - (1-a[n])S
设奴方期望收益:赢了收获S,输了赔付W
(1-a[n])S - a[n]W
零和博弈,-e[n]
(其实不妨假设W=1)
纳什均衡:
王方收益对q[n]求导,结果为0:当王方这样选择时,奴方没有调整策略的倾向
(-p[n] + (1-p[n]) - (1-p[n])a[n-1]) W
+ (-p[n] + (1-p[n]) - (1-p[n])a[n-1]) S
= (1 - 2p[n] - a[n-1] + p[n]a[n-1]) W
+ (1 - 2p[n] - a[n-1] + p[n]a[n-1]) S
= (1 - 2p[n] - a[n-1] + p[n]a[n-1]) (W+S)
= 0
得到:p[n] = (1-a[n-1]) / (2-a[n-1])
1-p[n] = 1 / (2-a[n-1])
奴方收益对p[n]求导,结果为0:当奴方这样选择时,王方没有调整策略的倾向
与王方的式子完全对称,所以q[n] = p[n]
再代入递推式:
a[n]
= p[n](1-q[n]) + (1-p[n])q[n] + (1-p[n])(1-q[n])a[n-1]
= 2 (1-a[n-1]) (2-a[n-1])^2 + a[n-1] / (2-a[n-1])^2
= 1 / (2-a[n-1])
则1-a[n] = (1-a[n-1]) / (2-a[n-1])
1 / (1-a[n]) = (2-a[n-1]) / (1-a[n-1]) = 1 + 1 / (1-a[n-1])
解得
1 / (1-a[n]) = n+1
a[n] = n/(n+1)
p[n] = 1-a[n-1] / (2-a[n-1]) = 1-(n-1)/n / 2-(n-1)/n = 1/n / 1+1/n = 1 / n+1
即:纳什均衡策略是双方完全随机出牌
那么就等价于:双方一次性把n+1张牌排好顺序全部出出来,然后一起开牌
如果王和奴在同一顺位,那么奴方胜利
否则,王方胜利
结果是一样的:其实从一开始就这么考虑的话,最简单
王方期望收益:赢了收获W=1,输了赔付S
a[n]W - (1-a[n])S = n/(n+1) W - 1/(n+1) S
需要S是W的n倍
剧中n=4
第一步以1/5的概率出王/奴,第二步1/4,第三步1/3,第四步1/2,第五步1/1
王方胜率是4/5,奴方是1/5
需要S是W的4倍,才公平
现在S是W的5倍,所以开司占便宜
不过,其实一边赌的是钱,一边赌的是耳朵,完全不同,其实也很难说这是几赔几
二、考虑剧中的设定的变种:假如双方每出一张牌就进行一轮结算呢?
之一、假如双方的牌都能保留自己的牌
那么张数就没有多少意义了,相当于石头剪子布,一方只能出石头(民)+布(王),一方只能出石头(民)+剪刀(奴)
王方:p的概率出王,1-p的概率出民
奴方:q的概率出奴,1-q的概率出民
四种情况:
pq: 王-奴,奴方收益 S - e,王方收益 -S + e
p(1-q): 王-民,王方收益 W + e
(1-p)q: 民-奴,王方收益 W + e
(1-p)(1-q): 民-民,王方收益 0 + e
e = pq(-S+e) + p(1-q)(W+e) + (1-p)q(W+e) + (1-p)(1-q)e
0 = pq(-S) + p(1-q)W + (1-p)qW
= -pqS + (p+q-2pq)W
e都被约掉了?
的确,王方每次收益应该是恒正,叠加起来会接近于无穷
那么只玩一轮才对,那就是
e = pq(-S) + p(1-q)W + (1-p)qW
无论是一轮还是无穷轮,两者的纳什均衡是一样的:
王方收益对q求导,结果为0:当王方这样选择时,奴方没有调整策略的倾向
0 = -pS + (1-2p)W
p = W / (S+2W)
同理 q = W / (S+2W)
e = -W^2 S / (S+2W)^2 + W (2W / (S+2W) - 2W^2 / (S+2W)^2)
e / W^2 = -S / (S+2W)^2 +(2 / (S+2W) - 2W / (S+2W)^2)
e * (S+2W)^2 / W^2 = -S + (2 (S+2W) - 2W) = S+2W
e = W^2 / (S+2W) > 0 恒成立
S需要尽可能大,使得e趋近于0,才比较公平
不过此时,p = q = W / (S+2W)也会趋近于0,即双方几乎都只出民
的确,王方一直出民,至少可以立于不败之地
之二、如果双方都出民,则收掉;否则都保留
四种情况:
p[n]q[n]: 王-奴,奴方收益 S - e[n],王方收益 -S + e[n]
p[n](1-q[n]): 王-民,王方收益 W + e[n]
(1-p[n])q[n]: 民-奴,王方收益 W + e[n]
(1-p[n])(1-q[n]): 民-民,双方的牌抵消掉,转移成双方n-1张民牌的情况,王方收益 0 + e[n-1]
之三、胜方保留自己的牌(军棋模式)
1、如果第一轮是民-奴,那么接下来王方当然一直出王,把奴方的民全部吃掉,每一轮都能赢
2、如果第一轮是王-奴,奴方接下来必须一直兑民,因为再出奴就是白送
3、如果第一轮是王-民,那么接下来王方如果采用兑民战术,就可以保证收益大于0,但不够高
如果接下来还想出王再多吃民,收益可能更高,但王也可能被奴吃回去,比赛回到平局
之四、双方的牌都消耗掉
四种情况:
p[n]q[n]: 王-奴,奴方收益 S - e[n-1],王方收益 -S + e[n-1]
p[n](1-q[n]): 王-民,王方收益 W + e[n-1]
(1-p[n])q[n]: 民-奴,王方收益 W + e[n-1]
(1-p[n])(1-q[n]): 民-民,双方的牌抵消掉,转移成双方n-1张民牌的情况,王方收益 0 + e[n-1]
之二三四的情况,以后再算吧