最佳的下注策略(3)

KeyTo9_Fans 发表于 2010-4-11 11:51:37

KeyTo9、KeyTo9_Fans、Fans_Fans三个人一起玩赌博游戏。

假设他们三个人都绝顶聪明。

游戏开始时，系统给每个人随机一个$RP$值。

三个人的$RP$值都均匀分布在$$区间，且相互独立。

然后系统再随机找一个人当庄家。

三个人当庄家的概率均为$1/3$。

除庄家外，其余两人在桌面上各下$1$块钱。

然后从庄家开始轮流叫注。

往顺时针方向轮流和逆时针方向轮流的概率均为$50%$，由系统随机决定。

叫注时可选择加注、跟注或者放弃。

第一轮三个人均有一次叫注机会。

如果有人加注，则还需等另外两人做决定。

为了讨论方便，加注额只能是正有理数。

如果选择放弃，则相当于放弃已经下过的注额。

如果只剩一个人没有放弃，则桌面上的钱全部给没有放弃的人。

一旦跟注完毕，即除了放弃者，其余的人下注额相等，则公开他们的$RP$值。

$RP$值最大的人赢得桌面上的钱。

每个人都是首先最大化自己的利益。

当存在多种方案使自己的利益最大且相等时，

Fans_Fans最大化KeyTo9_Fans的利益；

KeyTo9_Fans最大化KeyTo9的利益；

KeyTo9最大化Fans_Fans的利益。

问题$1$：讨论庄家的优势。

庄家平均每局可以赢多少钱？

问题$2$：讨论结盟的优势。

当存在多种方案使自己的利益最大且相等时，

Fans_Fans最大化KeyTo9_Fans的利益；

KeyTo9_Fans最大化Fans_Fans的利益；

KeyTo9最大化Fans_Fans的利益。

KeyTo9平均每局输多少钱？

问题$3$：讨论交互信息的作用。

KeyTo9_Fans和Fans_Fans可以互相看$RP$值，并事先讨论好各自的下注策略。

KeyTo9平均每局输多少钱？

（这个问题相当于$2$人博弈了，其中一人控制$2$个玩家。）

问题$4$：讨论信息安全的问题。

同问题$2$的结盟倾向。

KeyTo9_Fans和Fans_Fans不能互相看$RP$值，但他们通过下注额来暗示对方。

如Fans的$RP$值为$0.8765...$，轮到Fans叫注，Fans加注$1.0000...8765...$，这样就通过无关紧要的小数尾数来暗示了自己的$RP$值。

但此游戏要进行$N$轮，$N->\infty$。

所以KeyTo9很快就发现了这一规律，于是平均每局的输钱数与问题$2$相同。

KeyTo9_Fans和Fans_Fans是否存在一个暗示策略，使得KeyTo9永远都发现不了，最终平均每局输钱数与问题$3$相同？

#####

我对问题$4$比较感兴趣。

建议撇开前$3$个问题，直接讨论问题$4$。

醉月听花 发表于 2012-9-26 08:24:09

版主好像在讨论德州扑克的问题

KeyTo9_Fans 发表于 2015-10-16 17:59:26

是的，楼主想把这个问题的结论用到德州扑克上。

问题$3$里说，KeyTo9_Fans和Fans_Fans可以互相看$RP$值，

在德州扑克里就是$2$人通过某种秘密的方式把自己的牌告诉对方，然后联合起来对付其他人，

这种行为称为“通牌”，是一种作弊行为，一经发现，就要被处罚。

而问题$4$里说，KeyTo9_Fans和Fans_Fans不能互相看$RP$值，但他们通过下注额来暗示对方，

这是规则允许的，因为筹码摆在桌上，是公开的信息，大家都能看到，所以并不存在“私下串通”的作弊行为。

于是问题来了：

随着游戏无限地进行下去，KeyTo9会收集到越来越多的【下注额，$RP$值】数据，

如果KeyTo9_Fans和Fans_Fans的暗示策略过于简单，

KeyTo9很快就可以根据收集到的数据推测出KeyTo9_Fans和Fans_Fans的暗示策略，

于是便知道了KeyTo9_Fans和Fans_Fans的$RP$值，于是稳赚不赔。

于是KeyTo9_Fans和Fans_Fans只好放弃暗示，以问题$2$的策略继续游戏。

KeyTo9_Fans和Fans_Fans是否存在一个暗示策略，使得KeyTo9永远都无法根据收集到的数据推测出来呢？

#####

遗憾的是，楼主试过各种暗示策略，没有一个是永远不被识破的。

本质上，暗示策略就是一个从【$RP$值】到【下注额】的函数，

既然KeyTo9_Fans和Fans_Fans可以通过下注额互相暗示对方自己的$RP$值，

这个函数肯定可以用一串文字和符号（简称“字符串”）来定义。

假设一共有$10000$种字符，那么：

长度为$1$的“字符串”最多可以定义$10000$个不同的函数，

长度为$2$的“字符串”最多可以定义$100000000$个不同的函数，

长度为$3$的“字符串”最多可以定义$1000000000000$个不同的函数，

……

总之，不管长度为几，能定义的函数个数是有限的。

KeyTo9首先假设长度为$1$，一共有$10000$个函数，

然后用收集到的数据来排除这些函数（对于每个函数来说，只要有$1$个数据点对不上，这个函数就可以排除），直到只剩下$1$个函数为止。

如果所有的函数都被排除了，就说明【长度为$1$】的假设是错误的，

于是KeyTo9假设长度为$2$，一共有$100000000$个函数，

然后用收集到的数据来排除这些函数，直到只剩下$1$个函数为止。

如果所有的函数都被排除了，就说明【长度为$2$】的假设是错误的，

于是KeyTo9假设长度为$3$，一共有$1000000000000$个函数，依次类推。

于是只要KeyTo9收集到的数据点足够多，

那么无论长度为几，KeyTo9最终都能把KeyTo9_Fans和Fans_Fans所用的函数“大致确定下来”。

为了解释“大致确定下来”的含义，我们考虑以下问题：

是否存在$2$个不同的函数，KeyTo9永远都无法区分呢？

由于$RP$值是系统随机给定的，如果KeyTo9收集任意多的数据点都无法区分这$2$个函数，

就说明这$2$个函数至少在$$的密集子集【注$1$】上的函数值相同，

也就是这$2$个函数最多在$$的稀疏子集【注$2$】上的函数值不同而已。

于是“大致确定下来”的意思就是系统随机给定一个$RP$值，KeyTo9知道该$RP$值对应的函数值的概率是$1$。

注$1$：如果集合$S$是$$的一个密集子集，那么系统随机给定的$RP$值属于$S$的概率是$1$。

注$2$：如果集合$S$是$$的一个稀疏子集，那么系统随机给定的$RP$值属于$S$的概率是$0$。

#####

以上讨论的是确定的函数，对于随机函数，以上讨论略作修改即可，结论是：

无论如何暗示，只要KeyTo9收集足够多的数据点，那么当系统随机给定一个$RP$值时，KeyTo9知道【该$RP$值对应的函数值在下注额的密集子集上的概率分布】的概率是$1$。

于是问题$4$已经解决，接下来可以讨论前$3$个问题了。

页: [1]

数学研发论坛's Archiver

最佳的下注策略(3)