首先,必须申明:现实中“稳赚”的机会极少。
这是一个关于“概率、期望值、跨期下注、选择权、对冲”的严谨而有趣的描述。
稳赚需要有具体的前提条件,这些条件非常隐蔽,且经常被忽视。
假如你懂得了“稳赚的机会原理”,就可以反向设计让自己“稳赚”的那些前提条件,从而获得对手所不具备的概率优势。
由此,我将谈及“概率权”的把握和主动设计,这些智慧是投资和决策的第一性原理。
本文涉及的计算并不复杂,但真正能够理解的人也许不到1%。
所以,假如你没学过概率,没有决策经验,从未用自己的钱下过注,就不要轻易怀疑文中计算的正确性。
一、最小回报最大化
让我们从《普林斯顿概率论读本》的一道题开始:
有人在拉斯维加斯下了一个赌注,押A球队能在常规赛中保持不败,最后赢得冠军,赔率是1000比1,他下注了500美元,若获胜将拿走50万美元。
他运气不错,A球队进入了总决赛,并在比赛中以微弱优势领先于对手B球队。这意味着,如果势头不变,他的500美元将变成50万美元。
这时候拉斯维加斯打来电话,说愿意用15万美元买走他的下注。
A、如果他答应,15万美元马上到手,但可能失去赚50万的机会;
B、如果他不答应,就有机会拿走50万美元,但也可能一分钱都赚不到。
你会选择哪一个?
上面那位球迷对A球队很有信心,拒绝了“立即拿走15万美元”,而是选择已经快到嘴边的50万美元。
这是一个真实的故事。
第四十二届超级碗,巨人队(B球队)在终场前35秒大逆转,赢了爱国者队(A球队)。那位朋友的50万美元就这样飞走了。
什么事情都可能发生。所谓的胜券在握,真的只是一个概率问题。
这位下注者做错了什么?
如果我们假设A球队的获胜概率大于50%,那么下注A球队的期望值也大于(50万✖️50%=25万)。该期望值既然大于15万。所以下注者的选择“拒绝拉斯维加斯开出的15万条件”,似乎是对的。
从概率的角度看,有些正确的选择未必有对的结果。类似于打德扑这类多次博弈,把决策的过程和结果分开看(虽然仍是一个整体),是传奇女扑克牌手安妮·杜克的关键思维模式。
可是,数十万美金,对谁都不是小数字。而且对于普通球迷来说,用500美元换来这么大的赢钱机会,一辈子都难得有一次。如果无法多次重复,概率思维还有用吗?
更不用说还有期望效用和损失厌恶对决策者的影响。
其实,下注者还有另外一种选择,可以让他稳赢数十万美元!
《普林斯顿概率论读本》的作者米勒教授给出了具体的方法——对冲:
下注者当时可以再下注押B球队赢。这样,不管哪一方获胜,他都可以有可观的收入。
让我们来算一下:
假设A球队的胜率是80%,因为拉斯维加斯要利用赔率差来赚钱,所以假设押注B队赢的赔率是3。就胜率而言,这是一个对下注者不利的赔率。
这样一来,这个真实故事中的主角就迎来了一次对冲的机会,他可以反手再下一把注,押B队赢。如果计算妥当的话,不管是A队赢,还是B队赢,下注者都会稳赚。
那么,他应该下注多少呢?
如上所述,我们设该下注于B队的金额为B,所以:
1)A队胜的回报是(50万-500-B);
2)B队胜的回报是(B✖️3-500-B)。
由于双边下注,我们至少会获得两种结果中较小的那个回报,所以接下来我们要追求的是:
令两种结果中较小的那个数值最大化。
如上图,横坐标是B的数值,即下注于B球队的金额:
红线是假如A获胜的回报,表示为:(50万-500-B)
蓝线是假如B获胜的回报,表示为:(B✖️3-500-B)
纵坐标是A队胜和B队胜的不同回报。图中实线部分,是两种可能结果中的最小值,如图可知最小值的最高点是(B✖️3=50万)。
[page]
当(B✖️3=50万)时,不管哪一边获胜,我们赚到的金额是一样的。
计算结果是:B约为16.67万美元,下注者可以稳赚的最小金额是33.28万。
对冲之后,稳赚的金额比拉斯维加斯开出的收购价(15万美元)要高,同时也避免了因为意外发生而导致的50万“概率收益”归零。
我们可以将第二次押B队赢的行为,视为给起初押A队赢的概率权买个保险。考虑到单边押A队赢的期望值为(50万✖️80%=40万美元),押注于B队赢的16.67万美元在扣除成本后,换来最少稳赢的33.28万,还是很合算的。
请尤其留意,在另外一头下注,不可避免地拉低了整体期望值,原因是:拉斯维加斯对赔率的控制,令下注者押B球队的独立期望值是负数。
假设下注金额是B,A队的胜率是80%,下注B队的赔率是3,500和B是两头下注的本金,那么预期收益是:
80%✖️500000+20%✖️B✖️3-(500+B)
而只押注于A队的期望值,是:80%✖️500000-500.
也就是说,为了实现对冲而下注两次的期望值,貌似要小于只下注于A队。
为什么我们要做“拉低期望值”的事情?这个在第五节会有解释。
二、把“煮熟的鸭子”吃到嘴
对上一节做个小结:
1、为什么会有一个稳赚的机会?
是因为主角手中拥有一个“概率权”,也就是“他花500美元以1000比1的赔率押A队赢”这个权利,并且当时A进入了总决赛。该概率权按照期望值计算价值40万美元。
2、赌场开价15万买主角手中的“概率权”,应该只是一个套利行为。肯定是有另外的买家愿意出价20万,所以,赌场当了二道贩子。
当然,这些开价是以赔率差的形式出现的。例如赌场给主角的15万开价,相当于是300比1的赔率,但一定有买家愿意以更高的赔率(例如400比1,即20万)来购买主角手中的下注,赌场只需转手赚差价,风险是零。
所以平台最厉害的地方,是通过赔率差,来倒买倒卖“概率权”以赚取平台收益。
进而,各个领域别的平台,包括电商、短视频,其概率权套利,主要来自参与者只要高赔率,而不在意期望值为负。所以专家要创造出“认知盈余”这类概念来弥补一下。
3、主角的对冲机会,是通过不同时期的两个“跨期下注”构成的。这两个不同时空的下注,构成了某种“势能”。
你不可能在同一个时间通过分别下注A队和B队来实现稳赢的收益,除非平台出现了漏洞。
当然,不排除因为其他参与者们在观点和下注上的不均匀,也会产生某些局部的套利机会。
4、对冲下注时,目的是为了让最小收益最大化。
在求该值的计算中,只考虑了赔率,而没有考虑胜率(即事件不同结果的发生概率)。这是一种典型的风险意识。
5、意外,本来就是带来极大伤害的极小概率事件的发生。又或是被当事人误以为是小概率的大概率事件,又或者是小概率事件因为时间的累积而变成大概率事件。
当有杠杆效应较大的赔率机会,可以用来形成意外事件的安全气囊。
6、由于球类游戏充满了不确定性,并且总决赛的次数有限,下注者无法像玩儿德州扑克那样通过大量重复,以令大数定律“显形”。
所以,即使是在主观胜率很高的情况下,通过“保险策略”对冲尾部风险,对于业余下注者而言,也是值得的。
7、上面的例子里,对冲牺牲了一小部分期望值,换来了一些确定性,体现为在不同结果上的回报分布是均匀的。后面会提及在多次博弈中,这种均匀分布对整体回报的好处。
8、案例里下注者随着比赛的进程,对B球队下注对冲风险,以获得稳赢的结果,也算是某种贝叶斯更新,根据新的信息来评估过去的决策和概率权,并更新下注。
9、在围棋里,占据优势的一方,有两种锁定胜局的方向:一个是乘胜追击,放大优势;一个是缩短战线,甚至主动让出一些利益,让对手没有翻盘的机会。毕竟对围棋而言,赢半目和赢100目没什么区别。
10、对冲,是从优势到胜局,真正把鸭子吃到嘴,防止煮熟的鸭子飞掉。至于见好就收的尺度,其实和乘胜追击一样不易把握。
根据墨菲定律,煮熟的鸭子早晚会飞掉。
三、“概率权”是什么
概率权,是我“发明”的一个概念,来自某次我对一道趣题的8个解答。
一道”简单”的选择题:
有红色和绿色两个按钮,红色按钮有100%几率获得100万元,绿色按钮有50%几率获得一亿元,你只有一次按下的机会。
你按红色按钮?还是绿色?
这道题比想象中有趣,我来回答一下:
1、根据期望值理论,绿色按钮价值5千万;
[page]
2、很多人仍然愿意选拿到确认的100万,因为他们无法忍受50%概率的什么都拿不到,因为毕竟这不是一个多次博弈游戏,人生能有几回搏?
3、换而言之,假如一个人无法承受“什么都没有”,那么绿色按钮的选择就相当于“你有50%概率得到一个亿,有50%概率死掉”。你当然无法承受死,何况高达50%概率;
4、开放地想,假如你拥有这个选择的权利,也就是“概率权”,你可将绿色按钮价值五千万的概率权,卖给一个有承受力的人,例如两千万(甚至更高)卖给他;
5、继续优化上一条,考虑到增加“找到愿意购买你该选择权利的人”的可能性,你可以只用100万(低首付)卖掉这个权利,但要求购买者中得一个亿时和你分成;
6、再进一步,你可以把这个选择权做成彩票公开发行,将选择权切碎了零售,两块钱一张,印两亿张。头奖一个亿。对比5,风险更低,收益更大;
7、鉴于6的成功商业模式,开始募集下一笔一个亿作为头奖,令其成为一项生意;
8、按照P/E估值,募集20亿,公开上市,市值100亿。
那么,买走你的“概率权”的人吃亏了吗?
并没有。
重点不是他很有钱、更有承受力,而是他有机会将你卖给他的概率权以更好的价格变现。
就像本文开头的案例里,拉斯维加斯愿意用15万美元买走主角手中的概率权,是因为赌场很容易就可以将该概率权加价转手。
买走你的“按钮”概率权的人,可能是个概率权批发商。
例如,他手上收购了成千上万你那样的“按钮”概率权,所以大数定律帮助他实现了稳定的正期望值。所以他不惧怕波动性,不介意一城一池的得失,他就是赌场,是平台。
所以,平台的本质,是拥有概率权。
当然,他也可以按照上面的“6、7、8”,把你的一整个概率权,拆成许多个小的概率权,以小投入和大赔率为吸引力,将一个大概率权变成了无数个对买家而言胜率几乎为零的小概率权。
四、跨越时空的选择权
概率权,是基于概率计算的未来选择权。
我给概率权搭了个简单的框架:
1、基于期望值计算的(与空间有关的)概率权。
历史上赢得了彩票的人,都是利用了彩池偶然出现的正期望值。
所以他们抓住机会拼命买,买的越多,越接近于大数定律下的期望值。另外一方面绝对收益也更大。
但是,如果面对负的期望值,再死磕,也没用。勤奋对于赌博和买彩票这类期望值为负的事情毫无意义。
2、基于贝叶斯更新的(与时间有关的)概率权。
创业上的快速试错,是希望通过贝叶斯更新,不断优化商业模式上的概率,直至发现正期望值的套利机会。
厉害的人,会不停扔骰子,去看骰子怎么说。这就是蒙特卡洛的仿真模拟,在一个可以收敛的半径内,聪明地犯错误。
不仅从别人那里学习,还敢于亲自当骰子。
贝叶斯学派相信模拟不确定性是学习的关键,并利用贝叶斯网络和马尔科夫网络来工作。
3、基于三层结构的概率权。
这三层分别是资源层、配置层、执行层。
世俗世界的最终结果取决于三者概率相乘的结果。
该结构强调的是资源、决策、能力圈对概率权的影响。
4、在一个博弈环境中制造有相对优势的(基于统计学的)概率权。
放弃追求所谓最优,只在乎发现相对的概率优势。这是一种套利思维。
有时候,利用的是对概率计算的认知优势;有时候,利用的是竞争对手对不确定性的恐惧感。
(待续)