稍后要掷硬币100 次——可以给出一系列正面 (H) 和反面 (T)的序列。

现在你有选择权,可以选择积分规则。

规则A:对于序列中的每个HH,你会都会得到一分;对于每个HT,对手都会得一分。

规则B:反过来,对于序列中的每个HH,对手会都会得到一分;对于每个HT,则你得一分。

比如说HHHT,按A规则你得2分,对手1分。

问:为了积分高于对手你应该选择哪条规则?又或者说,它们的获胜概率是一样的?

——————————————————

答案是选B。

这个问题最近在x上引发了大量的讨论。包括图灵奖得主杨立昆,《黑天鹅》的作者塔勒布在内的人士,都给出了自己的答案。不过确实很难用直白的语言描述清楚。基本上和蛋友一样,主要基于数值模拟。

评论里

vevan:

https://codepen.io/lunar-dark/pen/NWmpKpM
瞎写了一个,每次扔100个币,连续扔100k次,HH胜45k左右,HT胜48k左右
补充一下,试过HT还是TH并不重要,单纯是HH的得分会略微低那么一点点,真的是略微,连投1000局以上才可见稳定的胜负差

[ 广告 ]
赞一个 (6)

PREV :
NEXT :

jimmy 2024年03月20日 11:49 / 上海市杨浦区1楼
一样的吧 对于每次投币 前一次是H的前提下 H和T的概率是一样的 大家得分概率也一样
#12074791 / 举报 / OO [4] / XX [16]
蛋友17031e894484e 2024年03月20日 12:03 / 广东省惠州市2楼
A?有概率连续得分
#12074855 / 举报 / OO [5] / XX [1]
热心蛋友 2024年03月20日 12:14 / 广东省东莞市3楼
TT不得分吗
#12074889 / 举报 / OO [3] / XX [2]
一块小饼干 2024年03月20日 12:23 / 加拿大4楼
HT赢的概率高。两种选择的数学期望是一样的,但是分布不一样,HH最多得99分,HT最多得50分,超过50分的部分都浪费了
#12074914 / 举报 / OO [23] / XX [2]
蛋友8fb1435ee5e2ec 2024年03月20日 12:50 / 山东省淄博市5楼
一样的。每次投出H开始一小局游戏,下一个是H或T的概率一样,每大局游戏都是不定个小局组成的,无论小局的数量多少都不影响大局的胜负率。
#12075003 / 举报 / OO [5] / XX [6]
vevan 2024年03月20日 13:09 / 上海市6楼
https://codepen.io/lunar-dark/pen/NWmpKpM
瞎写了一个,每次扔100个币,连续扔100k次,HH胜45k左右,HT胜48k左右
#12075061 / 举报 / OO [17] / XX [2]
vevan 2024年03月20日 13:26 / 上海市7楼
补充一下,试过HT还是TH并不重要,单纯是HH的得分会略微低那么一点点,真的是略微,连投1000局以上才可见稳定的胜负差
#12075092 / 举报 / OO [3] / XX [1]
云狐 2024年03月20日 13:29 / 上海市8楼
只扔2次胜率是一样的,但2次以上就是HT胜率更高,比如3次的8种情况就是2胜3负3平:
HHH 2:0
HHT 1:1
HTH 0:1
HTT 0:1
THH 1:0
THT 0:1
TTH 0:0
TTT 0:0
#12075102 / 举报 / OO [12] / XX [5]
一块小饼干 2024年03月20日 13:56 / 加拿大9楼
楼上对的,可以看见双方都得了4分但是HHH是2:0赢的,有1分浪费掉了
#12075197 / 举报 / OO [6] / XX [1]
霜雪明 2024年03月20日 16:04 / 广东省广州市10楼
用数学归纳法
#12075616 / 举报 / OO [0] / XX [0]
技术处乌佛 2024年03月20日 16:43 / 北京市11楼
不会编程,用office平替测试了一下
1、excel,1000行,每行randbetween出个0或者1的随机数,样本有了
2、拷出来到word,替换掉^p,变成一个长数字串
3、查找替换,看10和11哪个多,结果是10有265个,11有170个
结论是HT(字背)胜率高
#12075757 / 举报 / OO [7] / XX [0]
技术处乌佛 2024年03月20日 16:50 / 北京市12楼
更正我11楼的内容

word在查找替换时对连续数字判断有问题,所以重新数了一下
10是265次
11是257次

应该还是10(原文的HT,字背)胜率高
#12075790 / 举报 / OO [2] / XX [0]
Blastom 2024年03月20日 19:17 / 重庆市13楼
穷举三次的情况。HHH,HHT,HTH,HTT,THH,THT,TTH,TTT。两个是一样的。
#12076156 / 举报 / OO [2] / XX [3]
xianii 2024年03月21日 00:56 / 广东省深圳市14楼
似乎序列长度为奇数与偶数会有微妙的差异。
#12076787 / 举报 / OO [0] / XX [0]
陈旺财 2024年03月21日 10:33 / 广东省深圳市福田区15楼
只要把全部选项补充完整,结果就会直观很多了。
①只看一个币的时候,只有H、T两种情况,概率是各50%。
②看连续两个币的时候,有HH、HT、TH、TT四种情况,概率各是25%。

“HH上限比HT高”的现象,四个选项一起看就很明显了。
因为HH高分的时候,TT没拿到分;而HT高分的时候,TH也拿到了高分。
所以是不同情况下得分的分配表现不同,而不是出现概率不同。
#12077374 / 举报 / OO [2] / XX [1]
Hikkcc 2024年03月21日 16:32 / 四川省成都市16楼
确实挺神奇,用python写了个,跑了1千万次,HT的胜率明显高于HH。
After 10,000,000 games of 100 flips each:
HH rule won 4,575,137 times (45.75%)
HT rule won 4,859,489 times (48.59%)

问了一下AI,感觉也说数学期望是相同的,但是还是给了一个理论解释,感兴趣可以看看:

🤖「Claude Opus的回答」
首先,让我们计算在100次抛硬币中得到exactly k个HH(或HT)的概率。这可以用二项式分布来计算:

P(X = k) = C(n, k) * p^k * (1-p)^(n-k)

其中,n是抛硬币的总次数(在这里是100),k是我们关注的事件(HH或HT)出现的次数,p是每次抛硬币出现HH(或HT)的概率(在这里是0.25)。

例如,得到25个HH(或HT)的概率是:

P(X = 25) = C(100, 25) * 0.25^25 * 0.75^75 ≈ 0.0778

现在,让我们计算在规则A下得到特定分数的概率。注意,在规则A下,得分可以是0到99的任何整数,而在规则B下,得分只能是0到50的整数。

例如,在规则A下得到50分的概率是:

P(score = 50 under rule A) = P(X = 50) ≈ 1.03 × 10^-16

在规则B下得50分的概率是:

P(score = 50 under rule B) = P(X = 50) ≈ 1.03 × 10^-16

但是,在规则A下得到51分或更高分数的概率是:

P(score ≥ 51 under rule A) = P(X ≥ 51) ≈ 4.12 × 10^-18

在规则B下,得到51分或更高分数的概率是0,因为在规则B下最高只能得到50分。

如果我们把所有可能的分数的概率相加,我们会发现,在规则B下,中等分数(如25分左右)的概率比规则A高,而在规则A下,极高或极低分数的概率比规则B高。

这就解释了为什么在模拟中,HT规则(规则B)的胜率更高。虽然平均分是一样的,但HT规则更经常地得到中等分数,而HH规则(规则A)更经常地得到极高或极低的分数。在实际对战中,中等分数更有可能赢,因为极高的分数并不会提供额外的优势。
#12078616 / 举报 / OO [6] / XX [0]
技术处乌佛 2024年03月21日 16:44 / 北京市17楼
方丈:

1、我11楼的评论里的方法是错误的,辛苦从正文里把我删了吧

2、今天又研究了一下excel的公式写法,用更大的数据量算了一遍

A列【用随机数给出样本】
=RANDBETWEEN(0,1)

B列【如果样本里符合相邻两次是11的顺序就给出一个1,否则0】
=IF(($A2=1)*AND($A3=1),1,0)

C列【如果样本里符合相邻两次是10的顺序就给出一个1,否则0】
=IF(($A2=1)*AND($A3=0),1,0)

D列【如果样本里符合相邻两次是01的顺序就给出一个1,否则0】
=IF(($A2=0)*AND($A3=1),1,0)

E列【如果样本里符合相邻两次是00的顺序就给出一个1,否则0】
=IF(($A2=0)*AND($A3=0),1,0)

比如拉一万行,最后sum一下B、C、D、E列的总数。因为每一次单元格失焦随机数都会重新算,不妨单独起一组统计,粘贴为数字来进行多轮计算

长度限制新发一个回复
#12078658 / 举报 / OO [0] / XX [0]
技术处乌佛 2024年03月21日 16:45 / 北京市18楼

最后我10000行x20轮计算结果这样

win 11 win 10 win 01 win 00
round1 2602 2488 2488 2421
round2 2506 2531 2531 2431
round3 2521 2431 2431 2616
round4 2470 2487 2487 2555
round5 2554 2499 2500 2446
round6 2471 2528 2528 2472
round7 2492 2455 2454 2598
round8 2553 2511 2511 2424
round9 2474 2509 2509 2507
round10 2566 2504 2503 2426
round11 2407 2533 2534 2525
round12 2516 2437 2436 2610
round13 2477 2476 2476 2570
round14 2503 2500 2500 2496
round15 2460 2552 2552 2435
round16 2430 2544 2544 2481
round17 2436 2555 2555 2453
round18 2551 2447 2448 2553
round19 2508 2495 2495 2501
round20 2577 2478 2479 2465
avg 2503.7 2498 2498.05 2499.25

这个数据很难证明HT和HH的胜率是有差异的

完全晕了,另求高人
#12078660 / 举报 / OO [1] / XX [0]
penpen06 2024年03月22日 03:30 / 河北省沧州市19楼
这就解释了为什么在模拟中,HT规则(规则B)的胜率更高。虽然平均分是一样的,但HT规则更经常地得到中等分数,而HH规则(规则A)更经常地得到极高或极低的分数。在实际对战中,中等分数更有可能赢,因为极高的分数并不会提供额外的优势。

这段话应该可以比较完美的解释原因了~~
#12079621 / 举报 / OO [3] / XX [0]