KeyTo9_Fans 发表于 2010-4-11 11:51:37

最佳的下注策略(3)

KeyTo9、KeyTo9_Fans、Fans_Fans三个人一起玩赌博游戏。

假设他们三个人都绝顶聪明。

游戏开始时,系统给每个人随机一个$RP$值。

三个人的$RP$值都均匀分布在$$区间,且相互独立。

然后系统再随机找一个人当庄家。

三个人当庄家的概率均为$1/3$。

除庄家外,其余两人在桌面上各下$1$块钱。

然后从庄家开始轮流叫注。

往顺时针方向轮流和逆时针方向轮流的概率均为$50%$,由系统随机决定。

叫注时可选择加注、跟注或者放弃。

第一轮三个人均有一次叫注机会。

如果有人加注,则还需等另外两人做决定。

为了讨论方便,加注额只能是正有理数。

如果选择放弃,则相当于放弃已经下过的注额。

如果只剩一个人没有放弃,则桌面上的钱全部给没有放弃的人。

一旦跟注完毕,即除了放弃者,其余的人下注额相等,则公开他们的$RP$值。

$RP$值最大的人赢得桌面上的钱。

每个人都是首先最大化自己的利益。

当存在多种方案使自己的利益最大且相等时,

Fans_Fans最大化KeyTo9_Fans的利益;

KeyTo9_Fans最大化KeyTo9的利益;

KeyTo9最大化Fans_Fans的利益。

问题$1$:讨论庄家的优势。

庄家平均每局可以赢多少钱?

问题$2$:讨论结盟的优势。

当存在多种方案使自己的利益最大且相等时,

Fans_Fans最大化KeyTo9_Fans的利益;

KeyTo9_Fans最大化Fans_Fans的利益;

KeyTo9最大化Fans_Fans的利益。

KeyTo9平均每局输多少钱?

问题$3$:讨论交互信息的作用。

KeyTo9_Fans和Fans_Fans可以互相看$RP$值,并事先讨论好各自的下注策略。

KeyTo9平均每局输多少钱?

(这个问题相当于$2$人博弈了,其中一人控制$2$个玩家。)

问题$4$:讨论信息安全的问题。

同问题$2$的结盟倾向。

KeyTo9_Fans和Fans_Fans不能互相看$RP$值,但他们通过下注额来暗示对方。

如Fans的$RP$值为$0.8765...$,轮到Fans叫注,Fans加注$1.0000...8765...$,这样就通过无关紧要的小数尾数来暗示了自己的$RP$值。

但此游戏要进行$N$轮,$N->\infty$。

所以KeyTo9很快就发现了这一规律,于是平均每局的输钱数与问题$2$相同。

KeyTo9_Fans和Fans_Fans是否存在一个暗示策略,使得KeyTo9永远都发现不了,最终平均每局输钱数与问题$3$相同?

#####

我对问题$4$比较感兴趣。

建议撇开前$3$个问题,直接讨论问题$4$。

醉月听花 发表于 2012-9-26 08:24:09

版主好像在讨论德州扑克的问题

KeyTo9_Fans 发表于 2015-10-16 17:59:26

是的,楼主想把这个问题的结论用到德州扑克上。

问题$3$里说,KeyTo9_Fans和Fans_Fans可以互相看$RP$值,

在德州扑克里就是$2$人通过某种秘密的方式把自己的牌告诉对方,然后联合起来对付其他人,

这种行为称为“通牌”,是一种作弊行为,一经发现,就要被处罚。

而问题$4$里说,KeyTo9_Fans和Fans_Fans不能互相看$RP$值,但他们通过下注额来暗示对方,

这是规则允许的,因为筹码摆在桌上,是公开的信息,大家都能看到,所以并不存在“私下串通”的作弊行为。

于是问题来了:

随着游戏无限地进行下去,KeyTo9会收集到越来越多的【下注额,$RP$值】数据,

如果KeyTo9_Fans和Fans_Fans的暗示策略过于简单,

KeyTo9很快就可以根据收集到的数据推测出KeyTo9_Fans和Fans_Fans的暗示策略,

于是便知道了KeyTo9_Fans和Fans_Fans的$RP$值,于是稳赚不赔。

于是KeyTo9_Fans和Fans_Fans只好放弃暗示,以问题$2$的策略继续游戏。

KeyTo9_Fans和Fans_Fans是否存在一个暗示策略,使得KeyTo9永远都无法根据收集到的数据推测出来呢?

#####

遗憾的是,楼主试过各种暗示策略,没有一个是永远不被识破的。

本质上,暗示策略就是一个从【$RP$值】到【下注额】的函数,

既然KeyTo9_Fans和Fans_Fans可以通过下注额互相暗示对方自己的$RP$值,

这个函数肯定可以用一串文字和符号(简称“字符串”)来定义。

假设一共有$10000$种字符,那么:

长度为$1$的“字符串”最多可以定义$10000$个不同的函数,

长度为$2$的“字符串”最多可以定义$100000000$个不同的函数,

长度为$3$的“字符串”最多可以定义$1000000000000$个不同的函数,

……

总之,不管长度为几,能定义的函数个数是有限的。

KeyTo9首先假设长度为$1$,一共有$10000$个函数,

然后用收集到的数据来排除这些函数(对于每个函数来说,只要有$1$个数据点对不上,这个函数就可以排除),直到只剩下$1$个函数为止。

如果所有的函数都被排除了,就说明【长度为$1$】的假设是错误的,

于是KeyTo9假设长度为$2$,一共有$100000000$个函数,

然后用收集到的数据来排除这些函数,直到只剩下$1$个函数为止。

如果所有的函数都被排除了,就说明【长度为$2$】的假设是错误的,

于是KeyTo9假设长度为$3$,一共有$1000000000000$个函数,依次类推。

于是只要KeyTo9收集到的数据点足够多,

那么无论长度为几,KeyTo9最终都能把KeyTo9_Fans和Fans_Fans所用的函数“大致确定下来”。

为了解释“大致确定下来”的含义,我们考虑以下问题:

是否存在$2$个不同的函数,KeyTo9永远都无法区分呢?

由于$RP$值是系统随机给定的,如果KeyTo9收集任意多的数据点都无法区分这$2$个函数,

就说明这$2$个函数至少在$$的密集子集【注$1$】上的函数值相同,

也就是这$2$个函数最多在$$的稀疏子集【注$2$】上的函数值不同而已。

于是“大致确定下来”的意思就是系统随机给定一个$RP$值,KeyTo9知道该$RP$值对应的函数值的概率是$1$。

注$1$:如果集合$S$是$$的一个密集子集,那么系统随机给定的$RP$值属于$S$的概率是$1$。

注$2$:如果集合$S$是$$的一个稀疏子集,那么系统随机给定的$RP$值属于$S$的概率是$0$。

#####

以上讨论的是确定的函数,对于随机函数,以上讨论略作修改即可,结论是:

无论如何暗示,只要KeyTo9收集足够多的数据点,那么当系统随机给定一个$RP$值时,KeyTo9知道【该$RP$值对应的函数值在下注额的密集子集上的概率分布】的概率是$1$。

于是问题$4$已经解决,接下来可以讨论前$3$个问题了。
页: [1]
查看完整版本: 最佳的下注策略(3)