一维空间中的吃豆子问题 - 第6页 - 编程擂台 - 数学研发论坛

mathe 发表于 2013-3-11 17:44:27

听说$19#$的策略会越过一个豆子吃另外一个豆子，立马打个补丁重新运行。

目前已运行$4$小时，结果为：

$p=0.47\pm0.03$
$t=0.219102\pm0.000004$

其中$p$是$1/2$的权重，$t$是吃一个豆的平均时长。
KeyTo9_Fans 发表于 2013-3-11 16:40 http://bbs.emath.ac.cn/images/common/back.gif
p就是代码中的w?我算出来在0.7左右最优

mathe 发表于 2013-3-11 17:44:43

49# KeyTo9_Fans
这是不是意味着zgg的就是终极答案了？
wayne 发表于 2013-3-11 17:06 http://bbs.emath.ac.cn/images/common/back.gif
显然不是

mathe 发表于 2013-3-11 17:45:30

....最后，按照mathe提出的说法，w总去吃最近的豆，这就是最优策略。 ...
zgg___ 发表于 2013-3-11 12:20 http://bbs.emath.ac.cn/images/common/back.gif
这个策略应该是不对的。

KeyTo9_Fans 发表于 2013-3-11 23:46:55

wayne在$12#$中提到：

$11#$的$Sco re$函数里面有个$1/2$，不是很和谐。

于是把$1/2$改成参数$a$，重新做实验。

结果$a=0.523\pm0.005$时，吃豆最快，期望时长为$0.2194662\pm0.0000005$。

但还是比zgg____的策略慢。

KeyTo9_Fans 发表于 2013-3-12 17:06:32

修改zgg____的策略，

令$g(x_1,x_2)=\frac{x_1+x_2+1/2*p*|x_1-x_2|}{2+p*|x_1-x_2|}$，

可以吃得更快。

结果是：

$p=1.753\pm0.005$
$t=0.2189915\pm0.0000005$

mathe 发表于 2013-3-12 18:45:56

修改zgg____的策略，

令$g(x_1,x_2)=\frac{x_1+x_2+1/2*p*|x_1-x_2|}{2+p*|x_1-x_2|}$，

可以吃得更快。

结果是：

$p=1.75\pm0.03$
$t=0.218990\pm0.000004$
KeyTo9_Fans 发表于 2013-3-12 17:06 http://bbs.emath.ac.cn/images/common/back.gif
你模拟多少次，在Windows还是Linux?需要注意，Windows上伪随机数周期比较小

shshsh_0510 发表于 2013-3-12 22:48:35

好久没来，凑凑热闹
题目很有意思，提一点想法。前面结果很多，不知是否已被各位提到或讨论过了。

我们设两个点分为$x$,$y$ , wayne的位置为$w$,
1. 上来先考虑最直接的策略，称之为M1: 向两个点中最近的一个走,其下一步步长期望为 $f0(x,y,w)=min(|w-x|,|w-y|)$
2.现在固定$x$,希望研究当$y$随机出现时，下一步的长度期望 $g_{1}(x,w)=\int{f0(x,y,w)}$
展开一下，设$d1=x<w?x:1-x$ ,$d2=|x-w|$ ,$d3=1-d1-d2$(即x,w把线段分为3段的长度)
于是 $g1(x,w)= d2>d3? {d1*d2+d3*d3+(d2-d3)*(d2+d3)/2}:{d1*d2+d2*d2+(d3-d2)*(d2+d3)/2}$
有了$g1$，就可以考虑更深一步的策略M2了，只需比较两步的期望之和
对于$x$,$y$,$w$ 策略 M1的下一步期望为 $f1(x,y,w)=min(|w-x|+g1(y,w),|w-y|+g1(x,w))$
3.继续可以类似考虑3步最优策略M3,只是式子复杂只能用数值解了

这个问题动力系统的味道很浓，也许不同的起始位置会有不同的结果呢

KeyTo9_Fans 发表于 2013-3-12 23:57:47

列一下之前的结果：

策略                                        结果
$g(x_1,x_2)=(x_1+x_2)/2$       $t=0.220408(1)$
$Sco re(x)=(|x-1/2|+a)/(|w-x|)$       $a=0.523(5),\ t=0.2194662(5)$
$g(x_1,x_2)=(x_1+x_2+1/2*p)/(2+p)$       $p=0.478(5),\ t=0.2191031(5)$
$g(x_1,x_2)=(x_1+x_2+1/2*p*|x_1-x_2|)/(2+p*|x_1-x_2|)$       $p=1.753(5),\ t=0.2189915(5)$

有空再评价一下楼上的策略，看看是否把我们打败了。

mathe 发表于 2013-3-13 17:36:07

听说$19#$的策略会越过一个豆子吃另外一个豆子，立马打个补丁重新运行。

目前已运行$24$小时，结果为：

$p=0.48\pm0.01$
$t=0.2191032\pm0.0000005$

其中$p$是$1/2$的权重，$t$是吃一个豆的平均时长。
KeyTo9_Fans 发表于 2013-3-11 16:40 http://bbs.emath.ac.cn/images/common/back.gif
我试着用硬件随机数运行10^10,产生结果在0.21904左右，对于p在0.47~0.52之间数都在这个值

KeyTo9_Fans 发表于 2013-3-14 01:27:14

继续修改zgg____的策略，

令$g(x_1,x_2)=\frac{x_1+x_2+1/2*p*|x_1-x_2|^q}{2+p*|x_1-x_2|^q}$，

可以吃得更快。

结果是：

$p=1.28\pm0.03$
$q=0.72\pm0.02$
$t=0.2189685\pm0.0000005$

与之前的结果对比，可以看到我们又一次刷新了记录：

策略                                        结果
$g(x_1,x_2)=(x_1+x_2)/2$       $t=0.220408(1)$
$Sco re(x)=(|x-1/2|+a)/(|w-x|)$       $a=0.523(5),\ t=0.2194662(5)$
$g(x_1,x_2)=(x_1+x_2+1/2*p)/(2+p)$       $p=0.478(5),\ t=0.2191031(5)$
$g(x_1,x_2)=(x_1+x_2+1/2*p*|x_1-x_2|)/(2+p*|x_1-x_2|)$       $p=1.753(5),\ t=0.2189915(5)$
$g(x_1,x_2)=(x_1+x_2+1/2*p*|x_1-x_2|^q)/(2+p*|x_1-x_2|^q)$       $p=1.28(3),\ q=0.72(2)\ t=0.2189685(5)$

页: 1 2 3 4 5 [6] 7 8

数学研发论坛's Archiver