找回密码
 欢迎注册
楼主: KeyTo9_Fans

[原创] 最佳的下注策略

[复制链接]
发表于 2010-3-3 09:59:42 | 显示全部楼层
我觉得这个对于通常的N很难找到最优的情况(N=2时分析已经很复杂了)。 倒是可以将每次押注的数目离散化一下,然后计算一下最优解看看结果是怎么样的。 或者让大家比赛一下,比如选择N=10
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2010-3-6 19:20:38 | 显示全部楼层
$N=10$太小了,完全在拼RP。 如果每次都全压,那么玩一百多次就可以玩出连胜$10$把的局面,达到最高纪录,然后就没意思了。 所以我们来玩$N=100$的。 这样才能在一定程度上消除不确定因素的影响,凸现出策略的重要性。 由于实数不好处理,我们只好在整数范围内玩,并把初始金额设为$10000$元。 在IE浏览器的地址栏里输入下面这段代码就可以玩了:
  1. vbscript:document.write(replace("<script>s=10000;t=0;w=0;l=0;while(t<100){t++;y=parseInt(prompt(t+#/100,#+s+#元。输入压注金额:#,0,##));if(y<0)y=0;if(y>s)y=s;if(Math.random()>0.4){if(!confirm(#赢#+y+#元#))break;s+=y;w++}else{if(!confirm(#输#+y+#元#))break;s-=y;l++}if(!s)break;}confirm(#您赢了#+w+#次,输了#+l+#次,最终成绩为#+s+#元#);</script>","#",""""))
复制代码
直接复制粘贴整段代码,不要分开了。 玩完了报一下成绩: --------------------------- Windows Internet Explorer --------------------------- 您赢了64次,输了36次,最终成绩为138000元 --------------------------- 确定 取消 --------------------------- 祝你好运,玩得开心^_^
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2010-3-6 19:37:26 | 显示全部楼层
上面那个成绩是第$2$次玩的成绩。 第$1$次玩的时候没经验,$10000$元竟然输剩$10$元 第$3$次玩的成绩: --------------------------- Windows Internet Explorer --------------------------- 您赢了59次,输了41次,最终成绩为100000元 --------------------------- 确定 取消 --------------------------- 发觉赢的次数很关键。 当赢的次数相同的时候才有可比性。 ##### 第4次赢的次数多,成绩好是很自然的: --------------------------- Windows Internet Explorer --------------------------- 您赢了66次,输了34次,最终成绩为700000元 --------------------------- 确定 取消 --------------------------- ##### 此刻我的积分恰好达到2000,做个记号。 ##### 照这个势头下去可能要刷爆int类型的整数了…… --------------------------- Windows Internet Explorer --------------------------- 您赢了68次,输了32次,最终成绩为20000000元 --------------------------- 确定 取消 ---------------------------
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2012-9-26 08:33:15 | 显示全部楼层
这些问题好像都没什么实际意义,倒不如我开点赌场实例给各位讨论下
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2017-4-19 11:21:27 | 显示全部楼层
当$N=100$时,编程序模拟$100$位参赛选手的实战,

参赛选手们的策略如下:

  第$1$位参赛选手总是下注$0.01$倍现有资金,
  第$2$位参赛选手总是下注$0.02$倍现有资金,
  第$3$位参赛选手总是下注$0.03$倍现有资金,
  ……
  第$100$位参赛选手总是下注$1.00$倍现有资金,

模拟的比赛规则如下:

  每局比赛进行$100$轮下注,

  $100$轮下注过后,得钱高者赢得$1$局比赛,

  任意两位参赛选手进行$1000000$局比赛,

  在$1000000$局比赛中,赢得对方$500001$局比赛则视为击败了对方。

结果第$20$位参赛选手以显著的优势击败了其余的$99$位参赛选手,大获全胜!

这一结果与凯利公式(Kelly formula)

  https://zh.wikipedia.org/zh-cn/凯利公式

  https://en.wikipedia.org/wiki/Kelly_criterion

里面所举的例子:

  举例而言,若一赌博有$60%$的获胜率($p=0.6$,$q=0.4$),

  而赌客在赢得赌局时,可获得二对一的赔率($b=1$),

  则赌客应在每次机会中下注现有资金的$20%$($f=0.2$),

  以最大化资金的长期增长率。

完全一致!
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-4-19 12:57:03 | 显示全部楼层
这个题目如果仅追求最终金额最高,那么每次按固定比例下注自然是最好的方案。
但是如果是多方博弈,目标就是超过对方而不是最终金额最高,于是结果就不同了,也就是每轮下注的比例不会固定了。
比如两轮比赛,如果第一轮失败,第二轮会选择风险更高的方案
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-4-19 22:12:36 | 显示全部楼层
本帖最后由 zeroieme 于 2017-4-19 22:13 编辑

博弈对象是选手之间而不是选手与庄家,跟http://bbs.emath.ac.cn/thread-9448-1-1.html一样的分析
游戏前段以最大化金额为目标,但接近终局,领先者将采取保守策略,落后的使用激进策略。
分析方向从后逆推。假设最后一局开始那一刻,对象之间存在一个金额比w。那么两人需要选用什么策略。

不失一般性。以领先的大金额除以落后的小金额,可以仅讨论w>=1的情形。显然w>2时落后者无法反超。

点评

是的,中途是黑箱感觉更加难分析,得先猜测对方最终情况的分布密度,然后根据这个密度函数倒推计算各层的最优选择,最后得出各层最优选择后能否反过来计算最终的分布密度。有可能可以采用迭代的方法计算  发表于 2017-4-20 10:33
跟那题不一样,这题是【玩的过程中大家都只知道自己的输赢和钱数,不知道对方的输赢和钱数】,$N$轮游戏结束前,对方都是黑箱。那题对方不是黑箱。  发表于 2017-4-20 04:14
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-4-20 12:17:19 | 显示全部楼层
mathe 发表于 2017-4-19 12:57
这个题目如果仅追求最终金额最高,那么每次按固定比例下注自然是最好的方案。
但是如果是多方博弈,目标就 ...

黑箱=囚徒,求自己的金额最高就是了。

点评

不一样,如果前面运气不好,后面就要激进一些,虽然平均值可能不行,但是可能有更大的概率超过对方  发表于 2017-4-20 13:46
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-4-20 15:54:59 | 显示全部楼层
这道题目在N=2时我们可以试着用迭代法来求解。
首先我们假设对方按每次20%押注的方法,可以得到最终对方分布函数
\(T_0(x)=\begin{cases}0&x<0.64\\0.16&0.64\le x\le0.96\\ 0.64&0.96\le x\le1.44\\1&1.44\le x\end{cases}\)
根据这个分布,他的对手在还差一轮时,如果当前手中数据是x,那么他必然会选择$0<=h<=x$使得$0.6T_0(x+h)+0.4T_0(x-h)$最大
于是我们可以记$G_1(x)=max_{0<=h<=x}{0.6T_0(x+h)+0.4T_0(x-h)}$,也就是如果他手里是x那么赢得概率是$G_1(x)$
于是在初始状态他应该选择$0<=h<=1$使得$0.6G_1(1+h)+0.4G_1(1-h)$最大
由此我们得到一个迭代过一次的方案,其中第一步要选择$h=h_1$,他会使得$0.6G_1(1+h)+0.4G_1(1-h)$最大
由此第一步后又可能变成$1+h_1$或$1-h_1$,然后第二步他会根据将目标函数$0.6T_0(x+h)+0.4T_0(x-h)$最大化原则分别作不同的选择
由此我们会得到一个新的目标函数\(T_1(x)\)同样是一个分段函数,应该比\(T_0(x)\)还多一段。
在此后,我们继续根据\(T_1(x)\)计算$G_2(x)$,最后得出$h_1$和\(T_2(x)\),依次递推下去比较理想的情况就能够得到极限分布,它同样是一个分段函数,应该和\(T_1(x)\)有同样多的分段。
当然也有可能在迭代过程中总是不收敛,这样,我们就会得出对应三个$h$参数的联合分布图。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-4-20 19:04:43 来自手机 | 显示全部楼层
记p=0.6,q=0.4,先假设存在简单最优模式,第一轮选择r,如果赢,第二轮选s,如果输第二轮选t.那么现在有另外一个人与之PK,假设第一轮同样用了r并且输掉,那么她第二轮必然选择t是最优方案。我们现在查看稍微增加t的方案,可以看出大部分情况结果不变,除了有$q^3$概率由平均变成输掉还有至少$pq^2$概率由平均变成赢,所以平均结果更好。这说明最优情况t只能取最大值1-r。现在我们再看第一轮她还是选r赢的情况,如果$1+r-s != 1-r+t=2-2r$,那么如果稍微增加s,唯一的变化将是$p^3$平局概率变成赢,$pq^2$平局概率变输,所以是更好的局面。最优情况只能$s=1+r$同样是全部投入。但是对于情况$1+r-s=2-2r$,有$p^3$情况平局变赢,$2pq^2$情况平局变输,所以同样必须$s=1+r$.可以看出第二轮方案完全不同于前面每轮20%的方案
现在已经假设有最优方案$r,s=1+r,t=1-r$,如果对手将r增加一个很小的数d,s减少$d/2$,于是她可以有不小于$p$的概率赢,这说明不存在简单最优策略
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-12-23 09:51 , Processed in 0.024268 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表