因为时局动荡,阿强父母破产,进而婚姻关系破裂。同时,随着命运接二连三地落下重拳,阿强开始变得自闭,除了童年好友阿花之外,对任何人都是生人勿近的态度。但否极泰来,阿强恶灵缠身——觉醒了替身能力(?)。

好吧,总之,阿强封闭了自我,开始向内探索,最终可以看到一小段未来的特定局部信息

什么样的信息呢?

当出现连续的二选一选项时,阿强能够以二进制的方式,看到序列的走向。比如说,如果猜硬币正反的话,阿强可以在游戏开始的瞬间,看到一组0/1序列,那就是后面连续的硬币正反结果。所以他的替身名是 choice。

确实,这个能力稍显鸡肋。但是还是让阿强再次振作起来,决定去码头搞点薯条money。赢一笔钱就和阿花私奔到埃及。

附近码头上有家为码头工人和水手开设的赌场,里面有种玩法叫“瘪三”(毕竟男生女生配或黑白配,实在违和)。

游戏规则

桌面上有两个圆圈,一个里面写着“大”,另一个写着“小”。庄家也就是赌场一方,有两个牌子,上面也分别写着大和小。每局开始前,赌场荷官把一个牌子放到一个罩子下,玩家看不到里面。

两个玩家,比如说阿强和阿花,按赌场指定的顺序,把赌注筹码压在“大”或“小”圈里。考虑最坏的情况,我们假定,赌场每轮都要阿花先下注,然后阿强跟着来。最后,赌场掀开罩子,向众人展示牌子。

如果,阿花、阿强和赌场的结果完全一样(就是三家同大或同小),则赌场输;反之,则阿花和阿强输。

但是现在阿强有了超能力,他可以和阿花制定一套战略,保证自己一方尽可能获利。

比如说最好想的策略,阿强在游戏开始后,看到未来开大小的结果序列是:小小大大大小大小大大大大小大小小大。

他统计出“大”多于“小”,所以在阿花第一轮凭运气下注的之后,阿强可以压“大”——向伙伴传递一个信息:后面大多于小。然后阿花可以每轮都压大,保证胜率大于50%。

问题是阿强年轻气盛,贪多务得。他想要一个9局里,起码赢下6局的对策?赌场当然不是善茬,所以阿花他们在赌局开始后,就不会做出任何授人以柄的小动作,也就是说,完全依赖事先的策略行事,而不会用眼神或肢体偷偷传递额外信息。

朋友们,如果你是阿强的话,你能想出来吗?


上一回说到 石头+剪刀 VS 石头+布

假如有个石头剪刀布大赛。赢得多的人有奖励。

这里面有个特殊规则,只有两个可选项。其一是(石头+布),亦即没有剪刀;其二是(石头+剪刀),亦即没有

两个玩家可以各选一个。

现在,你抽签先选。请问,你会选只能出(石头+布),还是(石头+剪刀),或者你认为这两个的胜负概率是一样的?

为了方便,我们管选了(石头+布)的叫玩家1,另一个则为玩家2。

发现大家可能不知道博弈论里面有所谓的混合策略。

在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。

纯策略是混合策略的特例。混合策略是指在完全信息博弈中,如果在每个给定信息下,只以某种概率选择不同的策略。

纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。

显然,该游戏是零和的,也就是有人赢,则必有人输。

再要注意的是,纯策略无法达成均衡。如果玩家1始终出石头,玩家2就会连续用石头应对,这意味着玩家1实际上可以选择出布,所以玩家2又应该出剪刀,然后玩家1又改回石头,逻辑循环重复。

从另一个方面来说,这也说明两边都出石头不是均衡点。所谓的博弈均衡点,就是一方玩家无法通过单方面变更策略而使自己获益更大。

当策略固定到石头-石头时,则玩家1可以出布,来使自己获益。

实际上,玩家1的最好选择就是以一定的概率随机出布。

下面说一下如何用 图线法 判断哪个选择更有利(但是就不解释原理了,大家可以照葫芦画瓢来操作)

脑力小体操:用预知替身玩男生女生配?

上图 上面的线表示 玩家2 出石头时,玩家1 从布 到 石头 时 收益的变化。从1(胜)到0(平)。

下面的线表示,玩家2 出剪刀时,玩家1 从布 到 石头 时 收益的变化。从-1(负)到1(胜)。

交点就是平衡点。如果过交点画一条x轴的平行线,则平行线上方是玩家2赢的情况,下方则是玩家2输的情况,显然,他输多赢少。

实际上,我们用这种方式,能够直接算出来,玩家1 的最优策略是以2/3的概率出石头,然后以1/3的概率出布。

[ 广告 ]
赞一个 (7)

PREV :
NEXT :