KeyTo9_Fans 发表于 2024-6-5 22:45:57

n人选数博弈的最佳策略

n个人参与选数游戏,游戏规则如下:

每个人私底下秘密地选择一个正整数,选好后同时公开,然后按照下列规则判定胜负:

哪个人的数是唯一的,那个人就赢了,收益为(n-1),其他人都是输,收益均为(-1)(例如,若3个人分别选了1、3、1,则选3的赢,选1的输)

如果有多个数都是唯一的,则在这些唯一的数中,选了最小值者赢,收益为(n-1),其他人都是输,收益均为(-1)(例如,若4个人分别选了1、1、2、3,则选2的赢,选1、3的输)

如果所有的数都不唯一,则为平局,每个人的收益均为0(例如,若4个人分别选了1、1、2、2,则本局为平局)

假设参与者都是独立做出决定的(没有串通行为),而且这个游戏要重复N局(N趋于无穷大),每个人都希望自己N局的总收益最大

求这个博弈的纳什均衡策略。

#####

对于n=2和n=3的简单情况,我已经做出来了,答案如下:

当n=2时,我方以1的概率选1即可保持不败:若对方选1,则双方打平;若对方不选1,则我方获胜。无论哪种情况,我方都是不败的

因此,是n=2时的纳什均衡策略

当n=3时,三方的纳什均衡策略是以1/2的概率选1、以1/4的概率选2、以1/8的概率选3、以1/16的概率选4、以1/32的概率选5、……、依次类推直到无穷

此时,可以证明:任意一方单方面地改变他的策略,他都无法获得更高的收益(实际上,无论他选什么数,只要其余两方的策略保持不变,那么他的期望收益都是0)

因此,是n=3时的纳什均衡策略

当n>3时,我还没开始做,我感觉这个博弈的纳什均衡策略应该是一个很有趣的数列,于是发出此贴,召唤坛友们一起来解答此题。

lihpb00 发表于 2024-6-9 19:48:44

应该把问题简化点,把正整数的定义域限制为不超过总人数。

KeyTo9_Fans 发表于 2024-6-9 20:49:40

假设n个人都只能在{1,2,3,...,m}中任选一个数,其余规则不变,那么可以证明:

当n=3、m=2时,三方的纳什均衡策略是以1/2的概率选1、以1/2的概率选2

当n=3、m=3时,三方的纳什均衡策略是以1/2的概率选1、以1/4的概率选2、以1/4的概率选3

当n=3、m=4时,三方的纳什均衡策略是以1/2的概率选1、以1/4的概率选2、以1/8的概率选3、以1/8的概率选4

……

当n=3、m=k时,三方的纳什均衡策略是以1/2的概率选1、以1/4的概率选2、以1/8的概率选3、……、以1/2^(k-1)的概率选(k-1)、以1/2^(k-1)的概率选k

#####

如果你有精力,可以求解一下n=4、m=4的情况

KeyTo9_Fans 发表于 2024-6-18 23:23:50

假设n个人都只能在{1,2,3,...,m}中任选一个数,其余规则不变,那么可以证明:

当n=4、m=2时,四个玩家的纳什均衡策略是以1/2的概率选1、以1/2的概率选2

当n=4、m=3时,四个玩家的纳什均衡策略是以1/2的概率选1、以1/2的概率选2、以0的概率选3

当n=4、m=4时,四个玩家的纳什均衡策略是以1/2的概率选1、以1/2的概率选2、以0的概率选3、以0的概率选4

……

当n=4、m=k时,四个玩家的纳什均衡策略是以1/2的概率选1、以1/2的概率选2、以0的概率选3、……、以0的概率选(k-1)、以0的概率选k

因此,是n=4时的纳什均衡策略

#####

到目前为止,n=2、n=3、n=4都求解完了,我还是没找到规律

可能还需要解出n=5、n=6的纳什均衡策略,才有可能找到规律

KeyTo9_Fans 发表于 2024-6-19 10:29:47

n=5的纳什均衡策略是

n=6的纳什均衡策略是

n=7的纳什均衡策略是

n=8的纳什均衡策略是

n=9的纳什均衡策略是

n=10的纳什均衡策略是

n=11的纳什均衡策略是

n=12的纳什均衡策略是

n=13的纳什均衡策略是

n=14的纳什均衡策略是

n=15的纳什均衡策略是

n=16的纳什均衡策略是

n=17的纳什均衡策略是

n=18的纳什均衡策略是

……

n=100的纳什均衡策略写出来太长了,把中括号里的数值画成条形图,结果如下图所示:



这些纳什均衡策略好像是一些高次方程的根,目前我只解出了上面这些数值解

解析解太复杂了,留给科技发达的后人去解吧

KeyTo9_Fans 发表于 2024-6-19 17:50:30

.·.·.问4个玩家为什么不选3(.·.·.的贴子可能被删除了),回复如下:

4个玩家,如果有3个玩家以1/2的概率选1、以1/2的概率选2,有1个玩家(你)选3,

那么当所选的4个数(排序后)是
1 1 1 3 时,你赢3分,赢的概率是1/8,
2 2 2 3 时,你赢3分,赢的概率是1/8,
1 1 2 3 时,你输1分,输的概率是3/8,
1 2 2 3 时,你输1分,输的概率是3/8,

所以你选3会以2/8的概率赢3分,以6/8的概率输1分,收益的期望值是3*(2/8)+(-1)*(6/8)=0,不赢也不输
页: [1]
查看完整版本: n人选数博弈的最佳策略