找回密码
 欢迎注册
查看: 32096|回复: 9

[原创] 三个项目比大小的博弈

[复制链接]
发表于 2020-4-2 01:38:06 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?欢迎注册

×
两个人分别在三个项目上投入总和固定的精力,该总和记为“1”;

第一个人投入到三个项目的精力分别记为a1,a2,a3,

满足a1≥0,a2≥0,a3≥0,a1+a2+a3=1。

第二个人的约束是类似的,只是把所有的a改成b。

双方都分配好精力后,依次比较第一个、第二个、第三个项目,谁投入的精力更多,

多的一方得1分,若相同则各得0.5分。

三项得分之和大于1.5分的一方获胜,双方均为1.5分则打平。

问该博弈的纳什均衡策略是什么?

也就是求我方出手的概率密度函数p(a1,a2),

使得对方无论怎么分配精力,我方的获胜概率均不低于0.5。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-4-6 16:29:47 | 显示全部楼层
如果对方恰好与我方采取相同策略分配精力呢?

点评

这种情况算打平  发表于 2020-8-17 14:13
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-4-6 18:19:12 | 显示全部楼层
本帖最后由 .·.·. 于 2020-4-6 18:21 编辑

diff(c(0,sort(runif(2)),1))
x~Dirichlet(1,1,1)
$p(p1,p2)=f_{U_{(1)},U_{(2)}}(p1,p2)$
这里f是两个均匀分布的次序统计量的联合分布,书上有公式但我实在懒得查
或者……Dirichlet分布里面抽样就完了。
证明大概是体力活
我只知道这样是最优解……
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2020-8-17 00:03:39 | 显示全部楼层
由于 3 项精力的投入值 a1、a2、a3 是对称的,不妨设 a1≥a2≥a3。

实际对战的时候,我方先以 a1≥a2≥a3 的策略分配精力,

然后把所分配的精力值随机打乱顺序后,再和对方对战即可。

由于连续的概率分布比较难计算,所以先把取值范围离散化之后求解。

把精力投入值离散成 0/15、1/15、2/15、……、14/15、15/15 这 16 种取值之后,

编程求得我方的最佳策略是把以下标红的 4 个策略进行随机混合:

  精力分配策略            使用该策略的概率
  5/15 5/15 5/15         0.00000000000000
  6/15 5/15 4/15         0.00000000000000
  6/15 6/15 3/15         0.00000000000000
  7/15 4/15 4/15         0.00000000000000
  7/15 5/15 3/15         0.20000000000000
  7/15 6/15 2/15         0.00000000000000
  7/15 7/15 1/15         0.20000000000000
  8/15 4/15 3/15         0.00000000000000
  8/15 5/15 2/15         0.00000000000000
  8/15 6/15 1/15         0.00000000000000
  8/15 7/15 0/15         0.00000000000000
  9/15 3/15 3/15         0.20000000000000
  9/15 4/15 2/15         0.00000000000000
  9/15 5/15 1/15         0.40000000000000
  9/15 6/15 0/15         0.00000000000000
10/15 3/15 2/15         0.00000000000000
10/15 4/15 1/15         0.00000000000000
10/15 5/15 0/15         0.00000000000000
11/15 2/15 2/15         0.00000000000000
11/15 3/15 1/15         0.00000000000000
11/15 4/15 0/15         0.00000000000000
12/15 2/15 1/15         0.00000000000000
12/15 3/15 0/15         0.00000000000000
13/15 1/15 1/15         0.00000000000000
13/15 2/15 0/15         0.00000000000000
14/15 1/15 0/15         0.00000000000000
15/15 0/15 0/15         0.00000000000000

当我方使用上述混合策略时,对方各种策略的收益如下:

  精力分配策略            该策略的获胜概率
  5/15 5/15 5/15         0.50000000000000(打平)
  6/15 5/15 4/15         0.50000000000000(打平)
  6/15 6/15 3/15         0.50000000000000(打平)
  7/15 4/15 4/15         0.50000000000000(打平)
  7/15 5/15 3/15         0.50000000000000(打平)
  7/15 6/15 2/15         0.50000000000000(打平)
  7/15 7/15 1/15         0.50000000000000(打平)
  8/15 4/15 3/15         0.50000000000000(打平)
  8/15 5/15 2/15         0.50000000000000(打平)
  8/15 6/15 1/15         0.50000000000000(打平)
  8/15 7/15 0/15         0.50000000000000(打平)
  9/15 3/15 3/15         0.50000000000000(打平)
  9/15 4/15 2/15         0.50000000000000(打平)
  9/15 5/15 1/15         0.50000000000000(打平)
  9/15 6/15 0/15         0.50000000000000(打平)
10/15 3/15 2/15         0.50000000000000(打平)
10/15 4/15 1/15         0.50000000000000(打平)
10/15 5/15 0/15         0.50000000000000(打平)

11/15 2/15 2/15         0.40000000000000(劣势)
11/15 3/15 1/15         0.40000000000000(劣势)
11/15 4/15 0/15         0.40000000000000(劣势)
12/15 2/15 1/15         0.30000000000000(劣势)
12/15 3/15 0/15         0.30000000000000(劣势)
13/15 1/15 1/15         0.20000000000000(劣势)
13/15 2/15 0/15         0.20000000000000(劣势)
14/15 1/15 0/15         0.10000000000000(劣势)
15/15 0/15 0/15         0.00000000000000(必败)


也就是说,我方只需在 4 种分配方案里以 0.2、0.2、0.2、0.4 的概率随机出手,

就可以使得对方无论怎么分配精力,最多都只是和我方打平而已。

根据上述离散的解,我们可以初步断定:最大的分配值不会超过 2/3,否则就处于劣势了。

至于在 0 ~ 2/3 之间该如何取值,则需要继续细分,才能找到规律。

点评

不知道说的是不是这个博弈问题:[url]https://tieba.baidu.com/p/530627072[/url],但双方策略的分界点是 1/3,不是 2/3 ...  发表于 2020-8-17 19:12
应该是在百度数学吧,以前楼主问过的问题,但是那时应该是两个项目?  发表于 2020-8-17 16:26
最大的分配值不会超过 2/3,否则就处于劣势了。——记得我从哪里看到过类似结论,但实在找不到了。  发表于 2020-8-17 02:35
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2020-8-17 16:57:59 | 显示全部楼层
把精力分配的取值范围扩大到 31 个离散值,程序求解的结果如下:
  1. 我方的最佳策略如下:
  2. 精力分配策略            使用该策略的概率
  3. 10/30 10/30 10/30       0.00000000000000
  4. 11/30 10/30  9/30       0.00000000000000
  5. 11/30 11/30  8/30       0.00000000000000
  6. 12/30  9/30  9/30       0.00000000000000
  7. 12/30 10/30  8/30       0.00000000000000
  8. 12/30 11/30  7/30       0.00000000000000
  9. 12/30 12/30  6/30       0.00000000000000
  10. 13/30  9/30  8/30       0.00000000000000
  11. 13/30 10/30  7/30       0.00000000000000
  12. 13/30 11/30  6/30       0.00000000000000
  13. 13/30 12/30  5/30       0.00000000000000
  14. 13/30 13/30  4/30       0.03636363636364
  15. 14/30  8/30  8/30       0.00000000000000
  16. 14/30  9/30  7/30       0.00000000000000
  17. 14/30 10/30  6/30       0.00000000000000
  18. 14/30 11/30  5/30       0.05454545454545
  19. 14/30 12/30  4/30       0.00000000000000
  20. 14/30 13/30  3/30       0.03636363636364
  21. 14/30 14/30  2/30       0.00000000000000
  22. 15/30  8/30  7/30       0.03636363636364
  23. 15/30  9/30  6/30       0.05454545454545
  24. 15/30 10/30  5/30       0.09090909090909
  25. 15/30 11/30  4/30       0.00000000000000
  26. 15/30 12/30  3/30       0.00000000000000
  27. 15/30 13/30  2/30       0.01818181818182
  28. 15/30 14/30  1/30       0.00000000000000
  29. 15/30 15/30  0/30       0.00000000000000
  30. 16/30  7/30  7/30       0.00000000000000
  31. 16/30  8/30  6/30       0.00000000000000
  32. 16/30  9/30  5/30       0.05454545454545
  33. 16/30 10/30  4/30       0.00000000000000
  34. 16/30 11/30  3/30       0.03636363636364
  35. 16/30 12/30  2/30       0.00000000000000
  36. 16/30 13/30  1/30       0.00000000000000
  37. 16/30 14/30  0/30       0.00000000000000
  38. 17/30  7/30  6/30       0.03636363636364
  39. 17/30  8/30  5/30       0.00000000000000
  40. 17/30  9/30  4/30       0.00000000000000
  41. 17/30 10/30  3/30       0.00000000000000
  42. 17/30 11/30  2/30       0.00000000000000
  43. 17/30 12/30  1/30       0.09090909090909
  44. 17/30 13/30  0/30       0.07272727272727
  45. 18/30  6/30  6/30       0.00000000000000
  46. 18/30  7/30  5/30       0.00000000000000
  47. 18/30  8/30  4/30       0.00000000000000
  48. 18/30  9/30  3/30       0.00000000000000
  49. 18/30 10/30  2/30       0.00000000000000
  50. 18/30 11/30  1/30       0.09090909090909
  51. 18/30 12/30  0/30       0.00000000000000
  52. 19/30  6/30  5/30       0.00000000000000
  53. 19/30  7/30  4/30       0.05454545454545
  54. 19/30  8/30  3/30       0.05454545454545
  55. 19/30  9/30  2/30       0.07272727272727
  56. 19/30 10/30  1/30       0.00000000000000
  57. 19/30 11/30  0/30       0.01818181818182
  58. 20/30  5/30  5/30       0.00000000000000
  59. 20/30  6/30  4/30       0.00000000000000
  60. 20/30  7/30  3/30       0.07272727272727
  61. 20/30  8/30  2/30       0.00000000000000
  62. 20/30  9/30  1/30       0.01818181818182
  63. 20/30 10/30  0/30       0.00000000000000
  64. 21/30  5/30  4/30       0.00000000000000
  65. 21/30  6/30  3/30       0.00000000000000
  66. 21/30  7/30  2/30       0.00000000000000
  67. 21/30  8/30  1/30       0.00000000000000
  68. 21/30  9/30  0/30       0.00000000000000
  69. 22/30  4/30  4/30       0.00000000000000
  70. 22/30  5/30  3/30       0.00000000000000
  71. 22/30  6/30  2/30       0.00000000000000
  72. 22/30  7/30  1/30       0.00000000000000
  73. 22/30  8/30  0/30       0.00000000000000
  74. 23/30  4/30  3/30       0.00000000000000
  75. 23/30  5/30  2/30       0.00000000000000
  76. 23/30  6/30  1/30       0.00000000000000
  77. 23/30  7/30  0/30       0.00000000000000
  78. 24/30  3/30  3/30       0.00000000000000
  79. 24/30  4/30  2/30       0.00000000000000
  80. 24/30  5/30  1/30       0.00000000000000
  81. 24/30  6/30  0/30       0.00000000000000
  82. 25/30  3/30  2/30       0.00000000000000
  83. 25/30  4/30  1/30       0.00000000000000
  84. 25/30  5/30  0/30       0.00000000000000
  85. 26/30  2/30  2/30       0.00000000000000
  86. 26/30  3/30  1/30       0.00000000000000
  87. 26/30  4/30  0/30       0.00000000000000
  88. 27/30  2/30  1/30       0.00000000000000
  89. 27/30  3/30  0/30       0.00000000000000
  90. 28/30  1/30  1/30       0.00000000000000
  91. 28/30  2/30  0/30       0.00000000000000
  92. 29/30  1/30  0/30       0.00000000000000
  93. 30/30  0/30  0/30       0.00000000000000

  94. 对方策略的收益如下:
  95. 精力分配策略            该策略的获胜概率
  96. 10/30 10/30 10/30       0.50000000000000(打平)
  97. 11/30 10/30  9/30       0.50000000000000(打平)
  98. 11/30 11/30  8/30       0.50000000000000(打平)
  99. 12/30  9/30  9/30       0.50000000000000(打平)
  100. 12/30 10/30  8/30       0.50000000000000(打平)
  101. 12/30 11/30  7/30       0.50000000000000(打平)
  102. 12/30 12/30  6/30       0.50000000000000(打平)
  103. 13/30  9/30  8/30       0.50000000000000(打平)
  104. 13/30 10/30  7/30       0.50000000000000(打平)
  105. 13/30 11/30  6/30       0.50000000000000(打平)
  106. 13/30 12/30  5/30       0.50000000000000(打平)
  107. 13/30 13/30  4/30       0.50000000000000(打平)
  108. 14/30  8/30  8/30       0.50000000000000(打平)
  109. 14/30  9/30  7/30       0.50000000000000(打平)
  110. 14/30 10/30  6/30       0.50000000000000(打平)
  111. 14/30 11/30  5/30       0.50000000000000(打平)
  112. 14/30 12/30  4/30       0.50000000000000(打平)
  113. 14/30 13/30  3/30       0.50000000000000(打平)
  114. 14/30 14/30  2/30       0.50000000000000(打平)
  115. 15/30  8/30  7/30       0.50000000000000(打平)
  116. 15/30  9/30  6/30       0.50000000000000(打平)
  117. 15/30 10/30  5/30       0.50000000000000(打平)
  118. 15/30 11/30  4/30       0.50000000000000(打平)
  119. 15/30 12/30  3/30       0.50000000000000(打平)
  120. 15/30 13/30  2/30       0.50000000000000(打平)
  121. 15/30 14/30  1/30       0.50000000000000(打平)
  122. 15/30 15/30  0/30       0.50000000000000(打平)
  123. 16/30  7/30  7/30       0.50000000000000(打平)
  124. 16/30  8/30  6/30       0.50000000000000(打平)
  125. 16/30  9/30  5/30       0.50000000000000(打平)
  126. 16/30 10/30  4/30       0.50000000000000(打平)
  127. 16/30 11/30  3/30       0.50000000000000(打平)
  128. 16/30 12/30  2/30       0.50000000000000(打平)
  129. 16/30 13/30  1/30       0.50000000000000(打平)
  130. 16/30 14/30  0/30       0.50000000000000(打平)
  131. 17/30  7/30  6/30       0.50000000000000(打平)
  132. 17/30  8/30  5/30       0.50000000000000(打平)
  133. 17/30  9/30  4/30       0.50000000000000(打平)
  134. 17/30 10/30  3/30       0.50000000000000(打平)
  135. 17/30 11/30  2/30       0.50000000000000(打平)
  136. 17/30 12/30  1/30       0.50000000000000(打平)
  137. 17/30 13/30  0/30       0.50000000000000(打平)
  138. 18/30  6/30  6/30       0.50000000000000(打平)
  139. 18/30  7/30  5/30       0.50000000000000(打平)
  140. 18/30  8/30  4/30       0.50000000000000(打平)
  141. 18/30  9/30  3/30       0.50000000000000(打平)
  142. 18/30 10/30  2/30       0.50000000000000(打平)
  143. 18/30 11/30  1/30       0.50000000000000(打平)
  144. 18/30 12/30  0/30       0.50000000000000(打平)
  145. 19/30  6/30  5/30       0.50000000000000(打平)
  146. 19/30  7/30  4/30       0.50000000000000(打平)
  147. 19/30  8/30  3/30       0.50000000000000(打平)
  148. 19/30  9/30  2/30       0.50000000000000(打平)
  149. 19/30 10/30  1/30       0.50000000000000(打平)
  150. 19/30 11/30  0/30       0.50000000000000(打平)
  151. 20/30  5/30  5/30       0.50000000000000(打平)
  152. 20/30  6/30  4/30       0.50000000000000(打平)
  153. 20/30  7/30  3/30       0.50000000000000(打平)
  154. 20/30  8/30  2/30       0.50000000000000(打平)
  155. 20/30  9/30  1/30       0.50000000000000(打平)
  156. 20/30 10/30  0/30       0.50000000000000(打平)
  157. 21/30  5/30  4/30       0.46666666666667(劣势)
  158. 21/30  6/30  3/30       0.46666666666667(劣势)
  159. 21/30  7/30  2/30       0.46666666666667(劣势)
  160. 21/30  8/30  1/30       0.46666666666667(劣势)
  161. 21/30  9/30  0/30       0.46666666666667(劣势)
  162. 22/30  4/30  4/30       0.41818181818182(劣势)
  163. 22/30  5/30  3/30       0.41818181818182(劣势)
  164. 22/30  6/30  2/30       0.41818181818182(劣势)
  165. 22/30  7/30  1/30       0.41818181818182(劣势)
  166. 22/30  8/30  0/30       0.41818181818182(劣势)
  167. 23/30  4/30  3/30       0.36969696969697(劣势)
  168. 23/30  5/30  2/30       0.36969696969697(劣势)
  169. 23/30  6/30  1/30       0.36969696969697(劣势)
  170. 23/30  7/30  0/30       0.36969696969697(劣势)
  171. 24/30  3/30  3/30       0.32121212121212(劣势)
  172. 24/30  4/30  2/30       0.32121212121212(劣势)
  173. 24/30  5/30  1/30       0.32121212121212(劣势)
  174. 24/30  6/30  0/30       0.32121212121212(劣势)
  175. 25/30  3/30  2/30       0.27272727272727(劣势)
  176. 25/30  4/30  1/30       0.27272727272727(劣势)
  177. 25/30  5/30  0/30       0.27272727272727(劣势)
  178. 26/30  2/30  2/30       0.22424242424242(劣势)
  179. 26/30  3/30  1/30       0.22424242424242(劣势)
  180. 26/30  4/30  0/30       0.22424242424242(劣势)
  181. 27/30  2/30  1/30       0.17575757575758(劣势)
  182. 27/30  3/30  0/30       0.17575757575758(劣势)
  183. 28/30  1/30  1/30       0.12727272727273(劣势)
  184. 28/30  2/30  0/30       0.12727272727273(劣势)
  185. 29/30  1/30  0/30       0.07878787878788(劣势)
  186. 30/30  0/30  0/30       0.03030303030303(劣势)
复制代码

对于上述求解结果,【最大的分配值不超过 2/3】依然成立,

但是最佳策略变复杂了,一共混合了 19 种分配方案。

由此可见,该博弈不太可能有简单策略,

当取值继续细分之后,最佳策略会逐渐趋近于某个概率密度函数,

但这个概率密度函数的表达式,目前我还求不出来。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2020-8-20 11:10:08 | 显示全部楼层
假设 2/3 的分界点是对的,那就是要求一个概率密度函数 f(x,y,z),使得:

(1) 该概率密度函数在定义域范围内的积分等于 1:

$\int_{(x,y,z)\in D}f(x,y,z)dxdydz=1$

其中 $D=\{(x,y,z)|x+y+z=1, 0\leq x\leq 2/3, 0\leq y\leq 2/3, 0\leq z\leq 2/3\}$

(2) 无论对手采用哪种精力分配策略,他的胜率都是 0.5,

也就是对于所有的 $(u,v,w)\in D$,都有:

$\int_{(x,y,z)\in G(u,v,w)}f(x,y,z)dxdydz=0.5$

其中 $G(u,v,w)=\{(x,y,z)|x<u,y<v or x<u,z<w or y<v,z<w\}$

这个积分方程该怎么解呢?
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-11-23 04:34 , Processed in 0.035139 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表