最佳的下注策略(3)
KeyTo9、KeyTo9_Fans、Fans_Fans三个人一起玩赌博游戏。假设他们三个人都绝顶聪明。
游戏开始时,系统给每个人随机一个$RP$值。
三个人的$RP$值都均匀分布在$$区间,且相互独立。
然后系统再随机找一个人当庄家。
三个人当庄家的概率均为$1/3$。
除庄家外,其余两人在桌面上各下$1$块钱。
然后从庄家开始轮流叫注。
往顺时针方向轮流和逆时针方向轮流的概率均为$50%$,由系统随机决定。
叫注时可选择加注、跟注或者放弃。
第一轮三个人均有一次叫注机会。
如果有人加注,则还需等另外两人做决定。
为了讨论方便,加注额只能是正有理数。
如果选择放弃,则相当于放弃已经下过的注额。
如果只剩一个人没有放弃,则桌面上的钱全部给没有放弃的人。
一旦跟注完毕,即除了放弃者,其余的人下注额相等,则公开他们的$RP$值。
$RP$值最大的人赢得桌面上的钱。
每个人都是首先最大化自己的利益。
当存在多种方案使自己的利益最大且相等时,
Fans_Fans最大化KeyTo9_Fans的利益;
KeyTo9_Fans最大化KeyTo9的利益;
KeyTo9最大化Fans_Fans的利益。
问题$1$:讨论庄家的优势。
庄家平均每局可以赢多少钱?
问题$2$:讨论结盟的优势。
当存在多种方案使自己的利益最大且相等时,
Fans_Fans最大化KeyTo9_Fans的利益;
KeyTo9_Fans最大化Fans_Fans的利益;
KeyTo9最大化Fans_Fans的利益。
KeyTo9平均每局输多少钱?
问题$3$:讨论交互信息的作用。
KeyTo9_Fans和Fans_Fans可以互相看$RP$值,并事先讨论好各自的下注策略。
KeyTo9平均每局输多少钱?
(这个问题相当于$2$人博弈了,其中一人控制$2$个玩家。)
问题$4$:讨论信息安全的问题。
同问题$2$的结盟倾向。
KeyTo9_Fans和Fans_Fans不能互相看$RP$值,但他们通过下注额来暗示对方。
如Fans的$RP$值为$0.8765...$,轮到Fans叫注,Fans加注$1.0000...8765...$,这样就通过无关紧要的小数尾数来暗示了自己的$RP$值。
但此游戏要进行$N$轮,$N->\infty$。
所以KeyTo9很快就发现了这一规律,于是平均每局的输钱数与问题$2$相同。
KeyTo9_Fans和Fans_Fans是否存在一个暗示策略,使得KeyTo9永远都发现不了,最终平均每局输钱数与问题$3$相同?
#####
我对问题$4$比较感兴趣。
建议撇开前$3$个问题,直接讨论问题$4$。 版主好像在讨论德州扑克的问题 是的,楼主想把这个问题的结论用到德州扑克上。
问题$3$里说,KeyTo9_Fans和Fans_Fans可以互相看$RP$值,
在德州扑克里就是$2$人通过某种秘密的方式把自己的牌告诉对方,然后联合起来对付其他人,
这种行为称为“通牌”,是一种作弊行为,一经发现,就要被处罚。
而问题$4$里说,KeyTo9_Fans和Fans_Fans不能互相看$RP$值,但他们通过下注额来暗示对方,
这是规则允许的,因为筹码摆在桌上,是公开的信息,大家都能看到,所以并不存在“私下串通”的作弊行为。
于是问题来了:
随着游戏无限地进行下去,KeyTo9会收集到越来越多的【下注额,$RP$值】数据,
如果KeyTo9_Fans和Fans_Fans的暗示策略过于简单,
KeyTo9很快就可以根据收集到的数据推测出KeyTo9_Fans和Fans_Fans的暗示策略,
于是便知道了KeyTo9_Fans和Fans_Fans的$RP$值,于是稳赚不赔。
于是KeyTo9_Fans和Fans_Fans只好放弃暗示,以问题$2$的策略继续游戏。
KeyTo9_Fans和Fans_Fans是否存在一个暗示策略,使得KeyTo9永远都无法根据收集到的数据推测出来呢?
#####
遗憾的是,楼主试过各种暗示策略,没有一个是永远不被识破的。
本质上,暗示策略就是一个从【$RP$值】到【下注额】的函数,
既然KeyTo9_Fans和Fans_Fans可以通过下注额互相暗示对方自己的$RP$值,
这个函数肯定可以用一串文字和符号(简称“字符串”)来定义。
假设一共有$10000$种字符,那么:
长度为$1$的“字符串”最多可以定义$10000$个不同的函数,
长度为$2$的“字符串”最多可以定义$100000000$个不同的函数,
长度为$3$的“字符串”最多可以定义$1000000000000$个不同的函数,
……
总之,不管长度为几,能定义的函数个数是有限的。
KeyTo9首先假设长度为$1$,一共有$10000$个函数,
然后用收集到的数据来排除这些函数(对于每个函数来说,只要有$1$个数据点对不上,这个函数就可以排除),直到只剩下$1$个函数为止。
如果所有的函数都被排除了,就说明【长度为$1$】的假设是错误的,
于是KeyTo9假设长度为$2$,一共有$100000000$个函数,
然后用收集到的数据来排除这些函数,直到只剩下$1$个函数为止。
如果所有的函数都被排除了,就说明【长度为$2$】的假设是错误的,
于是KeyTo9假设长度为$3$,一共有$1000000000000$个函数,依次类推。
于是只要KeyTo9收集到的数据点足够多,
那么无论长度为几,KeyTo9最终都能把KeyTo9_Fans和Fans_Fans所用的函数“大致确定下来”。
为了解释“大致确定下来”的含义,我们考虑以下问题:
是否存在$2$个不同的函数,KeyTo9永远都无法区分呢?
由于$RP$值是系统随机给定的,如果KeyTo9收集任意多的数据点都无法区分这$2$个函数,
就说明这$2$个函数至少在$$的密集子集【注$1$】上的函数值相同,
也就是这$2$个函数最多在$$的稀疏子集【注$2$】上的函数值不同而已。
于是“大致确定下来”的意思就是系统随机给定一个$RP$值,KeyTo9知道该$RP$值对应的函数值的概率是$1$。
注$1$:如果集合$S$是$$的一个密集子集,那么系统随机给定的$RP$值属于$S$的概率是$1$。
注$2$:如果集合$S$是$$的一个稀疏子集,那么系统随机给定的$RP$值属于$S$的概率是$0$。
#####
以上讨论的是确定的函数,对于随机函数,以上讨论略作修改即可,结论是:
无论如何暗示,只要KeyTo9收集足够多的数据点,那么当系统随机给定一个$RP$值时,KeyTo9知道【该$RP$值对应的函数值在下注额的密集子集上的概率分布】的概率是$1$。
于是问题$4$已经解决,接下来可以讨论前$3$个问题了。
页:
[1]