这是博弈论通俗演义的第二篇。我们首先分析经典的「美女的硬币游戏」,而后挖掘它背后的模型,再引出「为啥你炒股总亏」的问题。
美女的硬币游戏
问题描述
美女的硬币游戏描述如下:
美女提议与你进行一个游戏,规则如下:
- 双方各持一枚硬币,同时亮出。
- 若双方均为正面,则美女给你 3 元奖励;
- 若双方均为反面,则美女给你 1 元奖励;
- 若双方正反不一致,则你输给美女 2 元。
那么现在的问题是:
- 如果美女不怀好意,想要在你这里赚钱,她应该怎么做?
- 你是否有必胜的策略,能在这个游戏中赚到美女的奖励?
看似公平
我们可以用一张表格表示这个游戏可能出现的各种情况下,你的收益。
↓美女·你→ | 正 | 反 |
---|---|---|
正 | 3 | -2 |
反 | -2 | 1 |
乍看起来,总共有 4 中情况,每种情况出现的概率都是 $\frac{1}{4}$。于是这个游戏是公平的,不管怎样,一直玩下去你也不会亏钱。对于广大单身男同胞,可能还获得了一个与美女搭讪的机会。看上去不亏。但事实真是这样吗?
藏在概率里的陷阱
游戏是公平的,这个推论建立在上述 4 种情况出现的概率均等的前提下。某种程度上,这受到了各种「抛硬币实验」的影响。——大家可能默认硬币出现正反面的概率是均等的,都为 $\frac{1}{2}$。但是这个前提在当前问题中不成立。
实际上,参与游戏的双方,可以选择以一定的概率亮出正面或反面。我们假设美女亮出正面的概率是 $p$,而你亮出正面的概率是 $q$。于是,对于你来说,参与游戏获得收益的期望是
$$\begin{aligned} E = {}& 3pq - p(1 - q) - 2(1 - p)q + 2(1 - p)(1 - q) \\ = {}& 8pq - 3p - 3q + 1. \end{aligned}$$
显然,若 $p$, $q$ 不全为 $\frac{1}{2}$ 时,期望不一定为 0。它可能大于 0 也可能小于 0。
不怀好意的美女
现在假设美女不怀好意。也就是说,她想从你手中赢钱。那么美女要怎样做呢?
考虑 $E$ 是你收益的期望。那么,不怀好意的美女希望通过改变 $p$ 的值,使得 $E < 0$。这即是
$$\begin{aligned} {}&{} E < 0 \\ \Leftrightarrow {}&{} 8pq - 3p - 3q + 1 < 0 \\ \Leftrightarrow {}&{} p(8q - 3) < 3q - 1. \end{aligned}$$
考虑当 $8q - 3 > 0$,即 $q > \frac{3}{8}$ 时,原式等价于
$$p < \frac{3q - 1}{8q - 3}.$$
由于 $f(q) = \frac{3q - 1}{8q - 3}$ 在 $\bigl(\frac{3}{8}, 1\bigr]$ 上是 $q$ 的减函数。因此当 $p < f(1) = \frac{2}{5}$ 时,原式成立。
再考虑当 $8q - 3 < 0$,即 $q < \frac{3}{8}$ 时,原式等价于
$$p > \frac{3q - 1}{8q - 3}.$$
由于 $f(q) = \frac{3q - 1}{8q - 3}$ 在 $\bigl[0, \frac{3}{8}\bigr)$ 上是 $q$ 的减函数。因此当 $p > f(0) = \frac{1}{3}$ 时,原式成立。
再考虑当 $8q - 3 = 0$,即 $q = \frac{3}{8}$ 时,对任意的 $p \in [0, 1]$ 成立
$$E = p(8q - 3) - 3q + 1 = -\frac{1}{8}.$$
综上所述,当 $p \in \bigl(\frac{1}{3}, \frac{2}{5}\bigr)$ 时,无论 $q$ 如何取值,美女都能从你手中赢钱。
苦苦挣扎的你
从上一节中,我们已经可以看出,事实上美女是有必胜的策略的。因此原题第二个问题的答案就显而易见了——你没有必胜的策略。不过不死心的你,可能还想要从你的角度来分析一下。
我们考虑一种极端情况,即「你」的收益最大化的情况,你亮出正面的概率 $q$ 应当满足什么条件。为了让美女无机可乘,你应当调整概率 $q$,使得无论美女亮出正面还是反面,你的收益的期望相等。因为,若不然,美女就可以通过调整概率 $p$,使得正面或反面出现的次数更多,来降低你的总收益。——这与「你的收益最大化」的假设矛盾。
首先,我们列出当美女亮出正面或反面时,你的收益的期望:
$$\begin{cases} E_{+} = 3q - 2(1 - q), \\ E_{-} = -2q + (1 - q). \end{cases}$$
现在,令 $E_{+} = E_{-}$
,则有一元一次方程的解 $q = \frac{3}{8}$。这就是说,当你亮出正面的概率是 $\frac{3}{8}$ 时,你的收益最大。而最大的收益是多少呢?——我们在上一节已经计算过了
$$E\Bigl(q = \frac{3}{8}\Bigr) = -\frac{1}{8}.$$
这也就是说,最好的情况,你平均每一局游戏也得亏 $-\frac{1}{8}$ 元钱。因此,你是没有必胜策略的(相反美女是有的)。
美女硬币游戏的要义和模型
美女硬币游戏的要义,其实就是她的「提议」。她的提议看起来是一个公平的游戏,但实际上是她占据了话语权。具体到游戏中,就是占据了游戏规则的制定权。那么,美女硬币游戏中的美女,事实上就具有了[前作]中提及的先发优势。
更抽象的问题
我们说,假设越强,结论就越弱;反过来,假设越弱,结论就越强。现在我们削弱美女硬币游戏的假设,让它变得更抽象,从而加强我们已有的结论。
考虑到硬币的正反面地位等同。我们不妨设「正正」的情况,收益为 $a$;而「反反」的情况,收益为 $b$。为了让游戏「看起来公平」,我们需要保证「正反」和「反正」的情况,收益为 $-\frac{a + b}{2}$。
↓·→ | 正 | 反 |
---|---|---|
正 | $a$ | $-\frac{a + b}{2}$ |
反 | $-\frac{a + b}{2}$ | $b$ |
这种情况下,对手收益的期望是
$$\begin{aligned} E = {}& apq - \frac{a + b}{2}p(1 - q) - \frac{a + b}{2}(1 - p)q + b(1 - p)(1 - q) \\ = {}& 2(a + b)pq - \frac{a + 3b}{2}p - \frac{a + 3b}{2}q + b. \end{aligned}$$
因此,你收益最大时应满足
$$q = \frac{a + 3b}{4(a + b)}.$$
此时,你收益的期望是
$$E = -\frac{(a - b)^{2}}{8(a + b)}.$$
考虑到 $(a - b)^{2} > 0$ 对任意的 $a \neq b$ 总是成立。于是,我们得到了一个假设很弱的结论:
若你的对手巧妙地设置 $a$ 和 $b$ 的值,使得 $a \neq b$ 及 $a + b > 0$,那么你就总是会输。
从这里,我们也能看出,所谓的「先发优势」是何等巨大。先发者只需要稍微设置一下游戏规则,你就只能输输输了。
炒股还是不炒股?这不是个问题。
现在我们回到炒股的问题上来。在股市中,有如下对应关系。
美女的硬币 | 股市 |
---|---|
美女 | 庄家 |
亮正面 | 做多 |
亮反面 | 做空 |
收益 | 收益 |
如此一来,结论就显而易见了。在一个由庄家控盘的股票上,不论你怎么买入卖出,庄家都很容易通过一定的策略让你(和其他散户)的收益期望最大值为负。如此一来,结论就是:庄家总是能赚钱,而散户长远看总是亏钱。
因此,炒股还是不炒股?这不是个问题。珍爱资产,远离股市——特别是庄家多的题材股。如果你一定要炒股,那么,请在合适的时机投资你了解、看好的基本面良好的股票。