KeyTo9_Fans
发表于 2013-2-17 02:07:59
实验表明,当$k=2$时,“总是吃最近的豆子”并不是最佳策略。
当两个豆子差不多近时,优先吃边上的豆子,可以吃得更快:lol
具体的策略函数如下:
如果Score$(x_1)>$Score$(x_2)$,那么$f(x_1,x_2,x_w)=Go(x_w->x_1)$,否则$f(x_1,x_2,x_w)=Go(x_w->x_2)$。
其中:
$Sco re(x_i)={|x_i-1/2|+1/2}/{|x_w-x_i|}$,(表示豆子离$1/2$处越远越好,离wayne越近越好)
$Go(x_w->x_i)$表示$x_i$在$x_w$的哪边就去哪边。
该策略吃豆子的平均速率是$(4.55648\pm0.00001)$个每秒,比“总是吃最近的豆子”的策略好。
($3$楼“总是吃最近的豆子”的策略的速率只有$(4.53704\pm0.00002)$个每秒)
wayne
发表于 2013-2-17 10:23:24
11# KeyTo9_Fans
“总是吃最近的豆子” 是局部最优,全局最优的话,需要时时刻刻以当前自身的位置作为距离计算的参照点,作为评估函数。
fans给的这个score很靠谱。但有一个1/2在里面,不是很和谐啊。
mathe
发表于 2013-2-17 20:58:34
k=2时Fans可以试着给个离散解看看?
其实k=2时,本质是求一个函数$g(x_1,x_2)$,如果$x_w<g(x_1,x_2)$那么选择左边,如果$x_w>g(x_1,x_2)$选择右边。同样k=n时是求一个将n个数映射到n-1个数的函数。
而给定选择函数,应该可以通过迭代得出$(x_1,x_2,...,x_k,x_w)$的一个稳定的分布密度,也就是经过一次迭代后密度函数保持不变。然后计算这个密度函数下的平均速率,所以是一个带额外约束条件变分问题,只是k越大,表达式越复杂,很难计算。
zgg___
发表于 2013-2-18 16:25:10
对于两个点的情况,如13层所说,尝试了一些函数g,最后还是选择了平均数,令gq(x1,x2)为x1、x2和1/2这三个数的加权算数平均数,其权的比例为1:1:q,故gq(x1,x2)=(x1+x2+q/2)/(q+2)。然后做了一点数据模拟,对每一个k,每次吃10^5个豆,反复吃50次求平均、最大和最小(代码见下)。g := (x1 + x2 + k/2)/(k + 2);
ks = {};
Do[ts = {};
Do; s2 = Random[];
Do;
If, tt = Abs; w = x1; s1 = x2;,
tt = Abs; w = x2; s1 = x1;];
s2 = Random[]; t = (t n + tt)/(n + 1);, {n, 0, 100000}];
AppendTo;, {50}];
AppendTo}, {k, Min}, {k, Max}}];
Print;, {k, 0, 2, 0.1}];
ListPlot, Filling -> {1 -> {2}, 1 -> {3}},
PlotMarkers -> {" \", "\", "\"}]结果如图,纵轴是吃每一个豆的平均时长,是lz说的吃豆速度的倒数,横轴是1/2的权重,当权重q=0,相当于吃最近的,当权重q很大时,相当于随便吃,即每次出现一个豆的情况(k=1)。此代码效率低,有空弄个好点的。
wayne
发表于 2013-2-19 09:31:07
14# zgg___
nice.
不过,我比较关注的是,这个图像稳定吗
zgg___
发表于 2013-2-19 13:29:33
14L的图是反复吃50次求平均、最大和最小的结果(分别对应图中的点和上下边),看到长长的竖线,图形当然是不稳定的了,呵呵。不过总趋势是稳定的,所以要用c再弄一个验证下。呵呵。
wayne
发表于 2013-2-19 14:14:15
16# zgg___
像fans问的这种题,我的直觉是,我们排除不了那种类似于混沌分形的非线性格局的可能性(例如遍历假说)。
zgg___
发表于 2013-2-19 15:04:50
算了一下10^7个豆的,吃10次,结果比较好看了。
zgg___
发表于 2013-2-19 15:45:40
又弄了一个10^8的豆的,感觉上需要验证随机数的可靠性和考虑double的误差积累了。所以请Fans也有空算一下权重p的极小值吧。呵呵。
源码如下,我用vc2005:#include "stdafx.h"
#include <conio.h>
#include <stdlib.h>
#include <time.h>
typedef double F;
int _tmain(int argc, _TCHAR* argv[])
{
FILE *fp;
long i,j,n;
F w,t,s1,s2,k,x1,x2;
srand((unsigned)time(NULL));
fopen_s(&fp,"d:\\chidou.txt","w");fprintf(fp,"s={");
n=100000000L;
for(k=0.0;k<2.01;k+=0.1){
for(j=0;j<10L;j++){
w=0.5;t=0.0;s1=(F)rand()/RAND_MAX;
for(i=0;i<n;i++){s2=(F)rand()/RAND_MAX;
if(s1<s2){x1=s1;x1=s1;x2=s2;}else{x1=s2;x2=s1;}
if(w<(x1+x2+k/2.0)/(k+2.0)){t+=(w>x1)?w-x1:x1-w;w=x1;s1=x2;}else{t+=(w>x2)?w-x2:x2-w;w=x2;s1=x1;}}
printf("j=%3d; k=%f; t=%f\n",j,k,t/n);fprintf(fp,"%f,",t/n);}}fprintf(fp,"0};");
return 0;
}M画图代码:<<"d:\\chidou.txt"
ss=Transpose,Max[#],Min[#]}&,Partition,{10}]]];ss//First
ListPlot,#}]&,ss],Filling->{1->{2},1->{3}},Joined->True]结果如下,权重p为0到2,0.1步长,结果是吃豆的期望时长:
{0.220413,0.219784,0.219428,0.219236,0.219167,0.219171,0.21924,0.219331,0.219458,0.219596,0.219753,0.219908,0.220075,0.220245,0.220406,0.220575,0.220731,0.220894,0.221046,0.221204,0.221347}
wayne
发表于 2013-2-21 12:25:04
17# wayne
用大数定理,好像可以直接否掉我的直觉,汗...