找回密码
 欢迎注册
查看: 35484|回复: 13

[求助] 关于利益最大化

[复制链接]
发表于 2018-7-8 08:27:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?欢迎注册

×
求问一个问题:
一个有100个轮次的游戏,每轮游戏都会出一道选择题,都会有10个备选的选择,你可以回答或不回答。
每道题答案唯一但可以多选和倍选。
每个选择都需要花费你1个单位的金钱,你每选对一次,就奖励你9个单位的金钱。
当你主观上能基本确定这10个备选的答案的可能性高低时候,你该用什么样的策略来利益最大化而同时兼顾风险控制。

同时想问,这个问题应该是属于什么类别的,有没有相应的计算公式。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-15 14:35:59 | 显示全部楼层
下载这个附件:

guessing.zip (85.48 KB, 下载次数: 6)

解压后就可以玩这个游戏了。玩法如下:

readme.png

需要注意的是:

这个游戏不会自动结束,玩家需要点击窗口右上角的关闭按钮结束游戏。

金钱输光也不会Game Over,每次都可以借$1$块钱继续玩下去。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-15 18:37:16 | 显示全部楼层
随便玩了$100$个轮次,结果如下:

+----------------------------------------------------+
|$100$题答完了,最终的金钱数为$85206184$|
+----------------------------------------------------+

100guesses.png

感觉如果认真玩$100$轮,有很大概率可以把金钱刷到$1$亿。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-16 09:31:10 来自手机 | 显示全部楼层
这个题目的结果显然同备选答案的分布密切相关
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-16 19:30:03 | 显示全部楼层
关于备选答案的概率分布,我是这样设置的:

        记正确答案是选项$A$的概率是$p_A$、是选项$B$的概率是$p_B$、是选项$C$的概率是$p_C$、……、是选项$J$的概率是$p_J$。

        然后我们有:$p_A\in[0,1]$、$p_B\in[0,1]$、$p_C\in[0,1]$、……、$p_J\in[0,1]$

        因此$(p_A,p_B,p_C,...,p_J)$是$10$维超立方体$C=[0,1]^{10}$中的一个点。

        由于我们需要满足$p_A+p_B+p_C+...+p_J=1$,

        因此我们将这个$9$维超平面$P$:$p_A+p_B+p_C+...+p_J=1$与$10$维超立方体$C=[0,1]^{10}$这两者取交集:$P\cap C$,

        这样就得到了一个$9$维超多面体$P\cap C$:$p_A+p_B+p_C+...+p_J=1$,($p_A\in[0,1]$、$p_B\in[0,1]$、$p_C\in[0,1]$、……、$p_J\in[0,1]$)

        最后我们在$9$维超多面体$P\cap C$里均匀地随机取点,得到$(p_A,p_B,p_C,...,p_J)$。

不知道楼主是怎么设定每个备选答案的概率分布的。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-17 08:37:08 | 显示全部楼层
KeyTo9_Fans 发表于 2018-9-16 19:30
关于备选答案的概率分布,我是这样设置的:

        记正确答案是选项$A$的概率是$p_A$、是选项$B$的概率是$p_B ...


备选答案的概率是很重要的
首先最好每轮游戏选择答案的概率分布最好是事先确定的,比如Fans的均匀分布方法。
如果出题者故意将每个答案的概率都定死为$1/10$,那么显然这个游戏就没法玩下去。如果能够良好的预测出100轮中每一轮各答案的概率,才能够有相对应的策略。
另外,利益和风险之间如何选择也需要事先定义好,比如允许有多大的概率完全损失等等,模型定义好以后,就是一个动态规划问题了
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2018-9-28 10:52:22 | 显示全部楼层
本帖最后由 小铃铛 于 2018-9-28 11:05 编辑
KeyTo9_Fans 发表于 2018-9-16 19:30
关于备选答案的概率分布,我是这样设置的:

        记正确答案是选项$A$的概率是$p_A$、是选项$B$的概率是$p_B ...


很久没上论坛了,现在才看到有回复。

这个游戏不考虑随机性,而是对弈性质的。
作为游戏者判断备选答案的可能性大小的依据是:通过判断出题者的意图从中得出结论。

这类似于棋类对弈,或骨灰级数独的手工解题,假如第一次答案是A,那么如果第二次也是A...根据相关游戏规则,游戏者可以在未来的10次中确定一次答案,所以第二次肯定不会是A,...简单地说,整个游戏都用类似的方法来确定每一次各个备选答案的可能性高低的。当然,这不是这个问题想问的。

现在假定:当次,10个备选答案的可能性根据判断已经确定了:A--1级;B--2级;C,D,E--3级,剩下的4级。(也可以是其他组合)
根据游戏规则,保守的策略应该是把A,B,C,D,E根据各自的可能性权重来分配投注金钱,尽量让投入和3级奖金接近。这个风险能降到最低而又能兼顾到利益。

这样,就需要一个算法或公式来分别根据不同的级别组合和每个级别的答案个数(只考虑1,2,3级,4级不考虑)来计算确定每个相关的答案需要投入的金钱数目。

至于提高利益,就不得不增加风险,比如只考虑1,2级,3级以后不考虑,这样,算法上也要考虑进去
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2018-9-29 06:32:39 来自手机 | 显示全部楼层
对弈性质就没什么好玩的了。出题者纯随机出题,选择10个选项同等概率即可

点评

顺便问一下mathe,你的关于Kayles-misère的程序的源码还在吗?原来的下载链接不能用了,我想下载下来学习一下  发表于 2018-9-30 07:55
个人觉得,对弈才比较当然好玩。双方除了需要一定的数学计算外,还涉及其他方面的博弈,这能让游戏者有更大胜算。本人数学功底较差,有关数学方面的计算就需要求助了,其实KeyTo9的程序稍微修改一下就可以适用了  发表于 2018-9-29 11:14
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2018-9-29 11:27:36 | 显示全部楼层
预设判断落空,则意味着对方出险着。所以游戏者此时必须备有足够10(≤10)次游戏的金钱数额,在未来的10(≤10)次中取胜。
假如没有足够的金钱,则意味着前一次游戏不可实行,需要调整投注金钱的总额,使得如果对方出险着,游戏者也足够应付。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2019-3-4 08:42:35 | 显示全部楼层
根据【小铃铛】的只言片语【对弈】【KeyTo9的程序差不多能用】,继续推断【小铃铛】想问的问题。

KeyTo9先猜测一个可能的版本,然后等待【小铃铛】的回复。

首先按照$5$楼的方法构造出一个$9$维的超凸多面体$Q=P\cap C$。

然后出题者从$Q$里选一个点$q$(例如:A:0.01 B:0.03 C:0.05 D:0.07 E:0.09 F:0.11 G:0.13 H:0.15 I:0.17 J:0.19),扔给答题者玩$100$轮游戏。

出题者选完这个点之后,就没得再选了。

(至于$100$道题的答案嘛,是随机数发生器按照出题者所选的概率分布$q$,随机生成的)。

答题者不知道出题者选的$q$点在哪里,于是前面若干轮只能瞎蒙。

更惨的是,出题者(他能看到每道题的机选答案)每次只能告诉答题者蒙对了没有。

(如果蒙对了,就亮出机选答案;如果没有蒙对,就不能亮出机选答案。)

那答题者怎么办?他可能每个答案都要试答,看看哪个对得多,以后就答那个答案。

(但需要注意的是,游戏一共就$100$轮。这$100$轮怎么用?好好分配吧~)

答题者可以自由下注。规则和楼主说的一样:蒙对奖励$9$倍下注,蒙错没收下注。

注意:一开始只有$10$块钱。输光后,每次只能借$1$块钱继续玩,多借$1$块钱都不行。

如果赢钱了,必需把所有所赢金钱拿来偿还欠款,直至所有欠款全部缴清,才能继续玩下一道题。

(不能继续欠下去:欠了多少就还多少,不能只还一部分。

除非所赢的钱全部拿来还款之后,还有欠款,才可以只还一部分,然后继续欠下去。)

如果$100$道题答完之后,答题者尚有欠款未缴清:

那对不起。游戏结束后,答题者必需拿出相应的真钱,缴纳欠款。

如果$100$道题答完之后,答题者有一笔余款:

那恭喜你!游戏结束后,这笔(巨款)就作为出场费,奖励答题者!

(参看文献:《百万富翁》,能拿到$100$万英镑,是答题者的本事!)

点评

reinforcement learning?  发表于 2019-3-4 19:23
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-3-29 17:40 , Processed in 0.048326 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表