美女主动搭讪?小心数学陷阱
还记得玛丽莲•沃斯•莎凡特(Marilyn vos Savant)吗?她是吉尼斯世界记录认定的最高IQ人类,在杂志《Parade》上开过一个名叫“问问玛丽莲”(Ask Marilyn)的专栏,专门解决读者的各种疑难杂题,最著名的自然是 三门问题 ,她高明且不可思议的回答让无数人伤透了脑筋。不过常在河边站哪有不湿鞋,就是这样一个“IQ最高”的人,也有糊涂的时候。来看看这道连玛莉莲都回答错的题吧。
玛莉莲的失误
2002年3月31日的“问问玛莉莲”专栏上刊登了这么一道趣题:你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏(这不是死理性派最期待的嘛)。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?
有人就这么算起来了:正反的组合有四种等概率的情况,出现其中两种情况我要付出 2+2=4 元,出现另外两种情况可以得到 3+1=4元,不亏不赚,这是个公平的游戏嘛。那就玩呗,更何况人家是美女。
这样想的老兄不是太单纯就是因为幸福来得太突然被冲昏了大脑。在这里他天真地假定每人都以相等的概率出正反面。还是女人了解女人,玛莉莲就想到了美女可以控制正面出现的概率,她给出解答说:“你不能和她玩这个游戏呐,她只要以1/3的概率出正面,2/3的概率出反面,每6次游戏你就输1元哟。”
画出收益矩阵(payoff matrix),可以算出“好运”的你每次的期望收益真的是-1/6元,如此看来,这还真不是个公平游戏。
美女出正面(P=1/3) | 美女出反面(P=2/3) | |
你出正面(P=1/2) | 1/2 | -2/3 |
你出反面(P=1/2) | -1/3 | 1/3 |
玛莉莲的故事结束了,但是好戏才刚刚开始。且不说美女是否一定就用这个"1/3的概率出正面,2/3的概率出反面"的方案,就是对于玛莉莲给出的美女策略,死理性派也完全可以把它变成一个公平的游戏。
显然玛莉莲这次低估了死理性派的智商,难道只有美女会控制频率吗?对于玛莉莲版本的美女,我们完全可以一直出反面,三次游戏中我们平均可以得到 1+1 元,失去2元,收支平衡,游戏变得公平了。
真正的不公平
需要指出的是,这个游戏确实不是公平的,只不过玛丽莲采用了错误的分析方法。
人们在玩游戏的时候总会自己制定一些策略。在博弈论中,策略(strategy)有两种,一种是确定的,称为纯策略(pure strategy),在什么情况下出什么牌、做出什么选择都已经定好,只需要照章办事。另一种是随机的,叫作混合策略(mixed strategy),给你的所有动作都定一个概率,按概率随机从中选一个。人们在说到随机的时候,直觉上倾向于认为各种情况等概率出现,而有时候,控制某些情况出现的概率却会产生神奇的效果。上面我们已经看到玛莉莲就采用了混合策略,而我们又想出了新的混合策略来应对。
任何一个游戏中,玩家们都会想方设法让自己的利益最大化,有时甚至作出出人意料的决定,这让游戏的局势变得错综复杂,典型的例子就是 海盗分金问题 。可在这复杂的关系下,存在一个惊人的规律,那就是在有限人的游戏中,总存在这样一种情况,每个人都能采取一种策略,使得他的利益不能再增大了。这就是博弈论中重要的纳什均衡(Nash Equilibrium)。纳什均衡分为纯策略纳什均衡(pure strategy Nash equilibrium)和混合策略纳什均衡(mixed strategy Nash equilibrium),前一种是所有玩家都采取纯策略,后一种则是至少有一人采取混合策略。
回到美女请你玩游戏这个问题。列出我们的收益矩阵:
美女出正面 | 美女出反面 | |
你出正面 | 3 | -2 |
你出反面 | -2 | 1 |
在m行n列的收益矩阵a中,存在如下不等式:
当它能取到等号时,游戏存在纯策略纳什均衡。简单来说就是玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少。否则只存在混合策略纳什均衡。而在这个问题中,行最小值的最大值(-2)不等于列最大值的最小值(1),所以这个游戏只存在混合策略纳什均衡。
假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是
3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )
解方程得x=3/8,也就是说平均每八次出示3次正面, 5次反面是我们的最优策略。而将x= 3/8代入到收益表达式 3*x + (-2)*(1-x) 中就可得到每次的期望收入,计算结果是 -1/8元。
类似的,列出美女的收益矩阵。
你出正面 | 你出反面 | |
美女出正面 | -3 | 2 |
美女出反面 | 2 | -1 |
设美女出正面的概率是y,反面的概率是1-y,列方程
-3y + 2( 1-y )= 2y + (-1) * ( 1-y )
解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。
其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多,比如上述玛丽莲的解答。
另外借助于计算机模拟这个游戏,我们也可以轻而易举地得到一样的结论。这里附上一个这样的小程序,算是另一个证明吧。
说到这里,美女之心,路人皆知了。不过既然是主动送上门,而你又不会输得太多,不妨考虑采用最佳策略慢慢陪她玩吧。说不定这个美女足够聪明,察觉到了你早已洞察一切却依然绅士,好感油然而生,改变心意了呢。