Skip to content

《生活不是掷骰子》 刘雪峰解读

《生活不是掷骰子》|刘雪峰解读

序言

你好,欢迎每天听本书,我是刘雪峰。今天我要为你解读的是我撰写的第二本科普书:《生活不是掷骰子:理性决策的贝叶斯思维》。

生活中的很多问题背后的真相扑朔迷离,我们很难看透,就像“掷骰子”一样,充满了随机性和不确定性,结果完全依赖于概率,我们无从掌控和把握最后的结果。而如果我们学会利用贝叶斯定理进行推理,就可以在这些不确定性中,找到确定因素,从而更好地理解和预测生活中的各种现象。

更进一步来说,我想通过这本《生活不是掷骰子》,帮更多的人建立批判性思维的能力。

批判性思维这个词在互联网上很火。但如果要细问批判性思维到底是什么,却不是所有人都能说清楚。

100多年前,西方的著名教育学家约翰·杜威(John Dewey)对批判性思维给出了一个定义。他认为,批判性思维是针对一个信念或所谓的知识,我们对支持它的理由及它引申出来的结论所进行的科学和谨慎的思考。简单来说,批判性思维能力,是以科学的方式来分析信息并且得出论断的能力。

杜威把批判性思维放到了一个非常重要的地位,他甚至认为,教育的终极目标不是学习知识,而是培养一个人的批判性思维能力。

那么,我们国家的国民在批判性思维上到底如何呢?

先说大学生。2021年,一篇发表在《自然》子刊上的文章引起了人们的关注。这项研究针对包括中国在内的几个国家本科生展开了调查,得到了这些学生在本科入学和毕业时在批判性思维(critical thinking)能力方面的变化。

我们看看中国学生的相关数据。通过统计数据的分析,研究人员得出了如下结论:在大学刚入学时,中国学生的批判性思维能力与美国学生很接近,和俄罗斯学生类似,明显高于印度学生。但在大学毕业时,中国学生的批判性思维能力比刚入学时有了显著下降,能力不仅被美国学生远远超过,也低于俄罗斯学生。

中国大学生经过四年的本科教育,批判性思维居然有了下降,这个问题在网上引发了很多人的讨论。如果这项研究的结论是扎实的话,那么背后的原因可能和大学的知识性内容较多,学业压力过大有关,也可能跟缺乏批判性思维的训练相关。

而对于更广泛的人群呢?批判性思维方面的缺失可能会更严重一点。当前很多综艺节目、朋友圈,以及很多互联网上的文章,为了流量会精心包装各种观点和事实,但是论据和论证过程充满了漏洞。然而很多这样的网文会成为热点和爆款,这根本上还是因为很多人在看这些网文的时候,缺乏批判性思维。

市面上有很多和批判性思维相关的科普书,都会从不同的角度来介绍批判性思维,并介绍很多的相关概念。而我写的这本《生活不是掷骰子》,主要是围绕一个数学公式“贝叶斯定理”,来系统地构建起一个人的批判性思维能力。

贝叶斯定理可能很多人也听过,但在很多人眼里,它只是一个数学公式。然而,这本书会告诉你,它不只是一个公式。如果你真的能够理解它,它会成为一个你科学思考的方式,甚至是世界观的一部分。

在这本书里,我采取层层递进的方式介绍贝叶斯定理。第一块内容介绍了贝叶斯定理的应用场合:信息推断的一些基本概念。第二块内容介绍了贝叶斯定理中的核心要素:先验概率和观测。第三块内容是贝叶斯定理的进阶和某些具体场景中的应用。

今天的解读,我也会层层递进地带你一起探索贝叶斯定理。

贝叶斯定理的应用场合:信息推断

先来看贝叶斯定理的应用场合:信息推断。批判性思维中的一个极其重要的能力,是能够透过表象看本质。从观察到的现象推测出背后的原因,就是信息推断。

我们的大脑每时每刻都在做信息推断:抬头看看天空来推断今天会不会下雨,和人聊天时通过对方的眼神和动作推测其内心所思,坐飞机遇见了颠簸后我们大脑会下意识思考背后的原因,投资家通过金融市场的变化来推断政策导向,医生通过患者的外在症状判断其可能患的疾病,科学家通过实验结果找到背后的理论,等等。

然而,人们常见的一种思维是下面这样的:观察到一个现象,脑子里立刻浮现出一个能够可以部分解释该现象的原因,并开始自动寻找支持这个原因的其他证据,然后自己坚信这个原因是对的。

以上的思维方式,我把它叫做“黑白思维”。

我们小时候都学过“智子疑邻”这个成语,出自《韩非子》。说的是,宋国有个富人,有一天下雨,那个富人家的墙被毁坏。他儿子说:“如果不赶紧修筑它,一定会有盗贼进来。”隔壁的老人也这么说。这天晚上果然丢失了大量财物。他家人很赞赏儿子聪明,却怀疑偷盗是隔壁那个老人干的。

这家富人就是典型的“黑白思维”。他们面对家里大量财物丢失这个现象,针对邻居的老人,他的思考过程是这样的:

看到的现象是:自己丢东西了。然后找了一个原因:邻居老人偷的。然后开始收集证据来支持这个原因:这个老人过去曾经说过,如果不赶紧修墙,一定会有盗贼进来,看来他之前就有过偷自己家东西的念头。然后这些证据被用来加强这个原因:肯定是他偷的。

虽然“智子疑邻”这个故事我们知道富人犯了错,但是现实中很多人的思考方式的本质和这个富人是一样的。日常生活中,我们经常会听到有些人说这样的话:领导肯定对我有意见了,因为我昨晚给他发消息他过了一天还没理我;他俩绝对在谈恋爱,我经常看他们回家的时候走在一起;公司的销售业绩不好,肯定是因为产品质量出了问题。这些人都在用黑白思维来做信息推断。

你知道黑白思维的问题在哪里吗?

首先,黑白思维只考虑了一个原因,而一个现象背后可能的原因有很多。智子疑邻的例子中,这个富人在“大亡其财”这个现象背后,他的备选原因只有一个:“邻居的老人是贼”,而没有考虑到其他的原因,例如“其他人偷了我的东西”“这个老人好心提醒我”等等。

其次,黑白思维有一个很荒谬的地方,就是一开始脑子里想到的原因,就是最后你的结论。这会导致你在后面收集的所有证据,只起到了加强对开始的那个原因的信心而已。

另外一种更合理的思维方式,叫做概率思维。具有概率思维的人观察到一件事情的时候是这么思考的:

1.观察到了一个现象;

2.把所有可能产生该现象的原因列举出来;

3.收集其他的相关证据;

4.给每个可能的原因一个概率(可能性),然后概率最大的原因胜出。

和黑白思维不同,概率思维会考虑多个不同的原因,并且用随后收集的证据,来确定每个原因的概率,这样就更有可能接近背后的真相。

概率思维最关键的在最后一步,就是如何根据你的观测,确定每个原因的概率。

这里又会遇到一个思维误区:大部分人,在确定某个原因的概率时,下意识使用的是这个原因发生的前提下,有多大概率能够产生观察到的现象。

这个听起来有点拗口,我们举个例子。如果你是一个气步枪爱好者,有一天,你在一个训练场上碰见了一个气步枪奥运冠军。你俩约定,分别往同一个靶上打了一枪。都打完之后,检查靶纸,发现中心十环处有一个弹孔。

现在问题是,这个十环,更可能是谁打的?

绝大部分人脑子里会想:这还用问,肯定是奥运冠军打的。

我们仔细思考一下思考过程。现在观察到的现象是“靶子中心有一个弹孔”。可能的原因只有两个:(1)你打的;(2)奥运冠军打的。

假设我们根据历史记录知道,你射中十环的概率是10%,而这位奥运冠军打中十环的概率是98%。

这个10%,就是第一个原因“你打的”发生的情况下,能够产生“靶子中心有一个弹孔”的概率。

这个98%,就是第二个原因“奥运冠军打的”的情况下,能够产生“靶子中心有一个弹孔”的概率。

在数学上,我们把某个原因的前提下,产生观察到的现象的概率叫做似然概率。

人们的潜意识,会把那个似然概率最大,也就是最容易产生观察到的现象的原因当作背后的原因。这在数学上叫做“最大似然估计”。某个原因的似然概率越大,说明该原因下该现象发生的概率越大,或者说,这个原因对该观测现象解释得越好。上面的例子中,“奥运冠军打的”这个原因,比“你打的”这个原因,更容易解释“靶子中心有一个弹孔”这个观测,因此我们下意识就认为,肯定是奥运冠军打的。

最大似然估计很符合我们的直觉。我们再来举个例子。

很多人害怕坐飞机,绝大多数人遇见飞机剧烈颠簸的时候都会非常紧张,包括手心出汗、心悸、脸红、呼吸急促、胸闷等。

为什么会这样?因为人们脑子里下意识采取的思考方式,就是最大似然估计。

我们来具体说说。“飞机剧烈颠簸”这是一个你看到的现象。导致该现象有两个原因:

  1. 飞机出事了;

  2. 飞机很安全,只是遇见气流而已。

哪个原因的似然概率更高呢?根据常识,飞机出事时,一定会剧烈颠簸。因此第一个原因100%会产生观察到的现象。而飞机遇见气流时,不一定剧烈颠簸,假设平均每10次遇见气流会剧烈颠簸一次,那么这个概率是10%。

很显然,“飞机出事了”这个原因产生“剧烈颠簸”的概率,比“飞机很安全,只是遇见气流而已”要高得多,对“剧烈颠簸”这个现象解释得更好。

因此,一般的人遇见剧烈颠簸,下意识就会得出“完了,飞机出事了”这个结论,各种紧张反应也就随之而来了。

最大似然估计这种把对现象解释得最好的原因当作背后的原因,是人类万年进化刻在我们基因里的推断方式。

可是,有没有人意识到,最大似然估计得到的结论可能是错的呢?

最大似然估计,忽略了一个隐藏很深但又非常重要的因素。这个因素就是不同的原因本身发生的概率,我们把这个概率叫做“基础概率”。

还是拿飞机剧烈颠簸来举例。虽然“飞机失事”会比“飞机遭遇气流”这个原因能够更好地解释“飞机剧烈颠簸”,但是飞机失事是一件极小的概率事件,而遭遇气流则是普遍发生的情况,也就是前者基础概率要远远低于后者。所以当你发现飞机剧烈颠簸的时候,背后的真正原因,更可能是“飞机遭遇气流”。

我们可以把这个例子的道理推广开来:当观测到某个现象后,我们考虑背后的原因时,不仅需要考虑这个原因对这个现象解释得好不好,还要想想该原因本身发生的概率高不高。

如果你把这两个因素都考虑进去,那么你本质上,就是在用贝叶斯定理来做推断了。

现在,我们就来进入这本书的第二个阶段:贝叶斯定理的核心概念。

贝叶斯定理的核心概念

贝叶斯定理中,有三个重要的概率。

第一个叫做后验概率。这个后验的“后”是“先后的后”,“验”是“实验的验”。英文叫做posterio probability。后验概率中的“后”,就是拿到观测以后的意思。后验概率就是你拿到观测以后,你对于某个原因给出的概率大小。这个概率就是最终我们要想的。我们最后选择的原因,就是后验概率最大的原因。

贝叶斯定理给出的,就是后验概率的表达式。后验概率的大小,由两个概率的乘积决定。

第一个叫做先验概率(Prior probability)。这个先验概率,就是我们前面提到的“基础概率”。先验概率中的“先”,就是拿到观测之前的意思。某个原因的先验概率,是我们在拿到观测之前对该原因本身发生的概率的评估,也就是该原因本身发生的概率高不高。比如飞机遭遇气流的概率有多高,飞机失事的概率有多高。先验概率依赖于之前对该原因的认知,通常可以由历史数据或者经验拿到。

第二个叫做似然概率(Likelihood probability)。这个概念我们之前介绍最大似然估计的时候讲过。某个原因的似然概率是某个原因的情况下能够观察到该现象出现的概率,也就是这个原因对这个现象解释得好不好。

贝叶斯定理的公式我在这里就不具体列出来了,感兴趣的同学可以从书中找到,网上也很容易搜到。但是贝叶斯定理告诉我们,后验概率由先验概率和似然概率决定。后验概率最大的原因通常是既对观测的现象有一定解释力,本身又常见的原因。有了贝叶斯定理这个工具,我们就可以计算在某个观测的情况下,不同原因的后验概率的大小。

书中从第三章开始,就围绕贝叶斯定理这几个概念展开。后续的章节中,分别介绍了贝叶斯定理告诉我们的几个道理。

第一个道理和先验概率有关。先验概率作为拿到证据之前对于该原因发生概率的判断,在很多场合的重要性要远远超过似然概率,甚至在很多情况下,我们可以不用看似然概率。

书中讲了一个守门员如何扑点球的例子。

守门员扑点球,是一个典型的信息推断的过程:守门员通过观察罚球队员的动作,来判断他罚球的真正方向,从而做出正确的扑救选择。

因此,当前的观测是“罚球队员的动作”,我们想要推断出来的,则是射门球员真正的射门方向。

很多一般水平的守门员的思路是:“看他往哪里踢,我就往哪里扑。”这种方法思路,本质上是找一个“能够最好地解释罚球队员当前动作的方向”。 例如,在观察到某个“罚球动作”的时候,我发现“射门方向为右上角”这个原因,可以比其他的射门方向更好地解释这个罚球队员的动作,那我就认为“右上角”的概率最大,我就往右上角扑球。

这就是我们前面提到的“最大似然估计”。然而,用最大似然估计来判断罚球方向在实际中面临两大问题。第一,点球的球速太快,守门员反应的时间来不及。很多情况下,如果守门员看清楚罚球队员的出脚动作时,再做扑救早就来不及了。第二,罚球队员的假动作很多,尤其高水平足球运动员。你看着他像是往右下方踢,可是他在触球的一瞬间改变了发力点,球冲着左上方去了。

“假动作很多”,本质上就是“不同的射门方向,都可以较好地解释某个罚球动作”。从数学上来说,就是各种不同原因的似然概率很相似。

当不同原因的似然概率相等时,决定哪个原因后验概率更大的因素,就是先验概率。

对于这个例子,某个方向的先验概率,是守门员观察到罚球动作之前,球员朝这个方向射门的概率。换句话说,罚球球员,平常最喜欢往哪个方向射门,那么这个方向的先验概率就最大。

所以,贝叶斯定理告诉我们,作为守门员,其实没太大必要看球员现场罚球的动作,而是直接朝着罚球队员平时最喜欢的方向去扑。

我们来看发生在2006年,德国与阿根廷的世界杯对决的例子。双方在120分钟的对决中均无建树而进入点球大战。在点球大战之前,德国的助理教练给莱曼送来了一张神秘的小纸条。莱曼每次扑点球前,都要拿出纸条,默默地看上一眼。最终结果,莱曼对所有点球都判断对了方向:除了两个质量太高的射门没有扑出之外,其他全部扑出,直接让阿根廷人黯然出局。

那么纸条里到底写的什么呢?

德国队的相关人员,利用分析软件,通过统计过去阿根廷射手的点球数据,总结出了他们的射门特点,然后写在一张小纸条上交给莱曼。这张纸条从上到下的内容依次是:

• 克鲁兹:右上角

• 阿亚拉:左下角

• 罗德里格斯:大力抽射右边

• 坎比亚索:短距离助跑抽射左上角

这些射门特点,就是在莱曼现场观察到他们射门动作前,这些运动员的先验概率。

莱曼在场上完全依靠事先总结的射门特点,也就是他们的先验概率,几乎不靠现场观察到的球员的出脚动作就能准确地扑出了大部分的点球。这是一个贝叶斯定理在应用中将先验概率用到极致的例子。

我们刚才介绍了先验概率的重要性。我们来看贝叶斯定理告诉我们的第二个道理,这个道理和观测的信息量有关。

先验概率本质上是你拿到当前观测之前,对某个背后的原因的认知。后验概率是你拿到观测后对该原因可能性的一个重新评估。

如果先验概率和后验概率的差距很大,说明这个观测让你对某个原因的可能性有了不同的认识,那么这个观测的信息量就很大。而如果这两个概率非常接近,那么这个观测的信息量就很小。

所以,从这个角度来讲,观测的信息量与人们对某个原因可能性看法的变化密切相关。

书中经过数学推导告诉我们,信息量大的观测,都具有“排他性”:这个观测,只有某一个原因能够解释,其他原因都不能解释。这种具有排他性的观测,就是信息量大的证据。

而同样,如果某个观测,不同原因对其解释力度非常接近,那么这个观测没有排他性,信息量很小。

所以书中给出了结论:某个观测信息量,不取决于它对某个原因的绝对解释力的大小,而取决于它对不同的原因相对解释力的差别。

这个道理非常重要。当你理解了这个道理以后,你就能看穿骗子常用的一个伎俩。

我们来举个例子,这个例子是赵本山、范伟和高秀敏在2001年央视春晚的小品《卖拐》。小品讲述了村里的一个大忽悠(赵本山)是如何一步一步通过“忽悠”把双拐卖给了一个双腿健康的大厨(范伟)的。其中有段情节是下面这样的。

赵本山对范伟说:在最近的一段时间内,感觉没感觉到你的浑身某个部位, 跟过去不一样了?你想,你使劲想……你说实话。

范伟回答:我没觉着哪儿不一样,我就觉着我这脸越来越大呀!

赵本山说:对了,这不是主要病症!你知道你的脸为什么大吗?

范伟问:为啥?

赵本山回答:是你的末梢神经坏死把上边憋大了。

赵本山问了一个泛泛的问题:是否浑身的某个部位,和过去不一样了。然后范伟在他的启发下,找到了一个观测“脸大了”。然后,赵本山给出了一个原因:“末梢神经坏死”。

稍微仔细分析一下,“脸大了”这个观测,其实是无法推断出其背后的原因一定是“神经末梢坏死”。因为即使这个原因可以很好地解释“脸大了”这个观测,但其他的原因,例如“长胖了”,也可以很好地解释这个观测。

也就是说,“神经末梢坏死”这个观测并不具有排他性,它没有任何信息量。

只要我们用到了贝叶斯定理,就能看出来骗子的这个伎俩的模式:找到一个很多原因都可以解释的观测,然后强塞给人一个原因。这也是很多忽悠人伎俩所用的方法逻辑。

我们刚才讲了贝叶斯定理告诉我们的两个道理,一个和先验概率有关,一个和观测的信息量有关。

在明白了这两个道理之后,我们就可以来说说从贝叶斯定理推导出来的一套方法。这套方法能帮助一个人做出生活中的各种决策,尤其是预测自己做某件事情的成功率。

具体的方法是这样的:想要知道自己一件事情的成功率有多少,最好的方法是找到和自己面临的情况相似的一个圈子,然后用圈子里的人做这件事情的成功率作为自己的“基础概率”,然后在这个基础概率上,根据自身的特点做一个调整。

这个例子是我自己的亲身例子。我父亲大概在65岁时,被诊断为“房间隔缺损”,这是心脏病的一种。在当地医院的医生表示,如果采取保守治疗,那么头几年应该没事,但是5到10年以后,情况可能会逐渐恶化,最后大概率会发展成无药可治的心衰。如果要做手术就要开胸,老人家年纪已经很大了,手术的风险、术后的恢复和并发症等情况都远不如年轻人乐观。

所以我们就面临一个两难选择:不做手术,大概只能健康生活10年;而做开胸手术,风险较高。这时候,我们该如何选择呢?

这个本质问题,是要知道我父亲的手术成功率。

我知道北京的某家医院的医生手术水平很高,于是我把父亲送到了这家医院,并且很幸运地挂了一位有经验的副主任医师的号。我问了那位医生三个问题。

我:“通常而言,您这里对房间隔缺损患者做开胸手术的成功率有多少?” 医生说:“一般不会有大问题,我手里的病人99%都顺利出院了。”

我问这个问题是想知道一般人在这家医院做该手术时的成功概率。这个圈子,就是在该医院做类似手术的患者。我可以把这个概率作为我父亲手术成功的基础概率。

虽然我拿到了第一个圈子里的基础概率,但是因为我父亲毕竟岁数大了,不完全符合“一般人”的情况,所以我还想拿到更符合我父亲特点的圈子中的对应概率,就是“在该医院做类似手术,并且年龄和我父亲相当的患者成功率”。于是我问了下一个问题:

我:“像我父亲这么大年龄的房间隔缺损患者,您之前治疗得多吗?” 医生说:“说实话很少。”

很可惜,我没有拿到这个数据。我于是又回到第一个基础概率。现在我需要知道,如果要在这个基础概率上调整的话,是否需要有大的调整。于是我问了第三个问题:

我:“我父亲年龄比较大,会不会有很大的风险?”

医生说:“问题应该不大。”

这意味着调整很小。基于此,我可以判断,我父亲做开胸手术的话,成功率也会接近99%。这个成功率,值得我们毫不犹豫地做手术。后来手术很成功,我父亲也顺利地康复了。

通过“找圈子”找到基础概率,然后再调整的方法,可以用在很多决策中。我在书里也介绍了很多类似的例子,包括孩子能否考上好大学,一个大学生到底能否找到好工作,一个创业者的成功率,等等。感兴趣的朋友,可以点击文稿末尾的电子书,做拓展阅读。

最后,贝叶斯定理不仅是一个能够帮助我们推理的工具,它更是一种世界观,也就是看待世界的方式。

世界是复杂的,为了客观而睿智地看待这个世界,我们需要首先对这个世界的很多现象有基本的常识。这个常识不一定完全正确,但是请不要完全凭借你自己的经验或者从网上看到的零星事例,而是最好能基于可靠的大量统计数据来得到。你需要用数字而不是感觉,用概率而不是非黑即白来思考问题。你建立起来的这个基本的世界观、基本认知或者常识,就是你的先验概率,先验概率对于判断的重要性再如何强调也不为过。

然后,贝叶斯定理告诉我们,我们要勇于接纳新证据和新观点,用科学的方法检验它们的真伪,并且用这些证据来改变你原有的认知。这就是观点随着事实的改变而改变。在很多情况下,你对某个事物的初始认知并不那么重要,只要我们能不断地通过新的证据去调整自己的认知,最终也能接近最后的真相。

这就是批判性思维和成长型思维。如果你具有了这种思维,你就会不断进步,你的眼光就会比一般人更深刻,你的视野会比一般人更宽广,你就会成为别人眼中那个睿智的人。

结语

好,今天这本书就解读到这里了。通过今天的内容,我想通过贝叶斯定理,帮你建立一套思维体系:数学和生活不是脱节的,它体现了生活的智慧,它给我们带来了一个新的思考问题的方式。

当然,因为篇幅原因,书中还有大量的例子,感兴趣的朋友,也推荐你去亲自翻开这本书,感受更多生活中的数学思维。

好,今天这本《生活不是掷骰子》,我们就讲到这里。恭喜你,又听完了一本书!

划重点

1、黑白思维不是科学的推理方式,而是概率思维才能更好地反映现实世界的复杂性。

2、观测的信息量不取决于对某个原因的绝对解释力,而是取决于对不同原因的相对解释力差异。

3、预测成功率不是凭空猜测,而是应该找到相似圈子的基础概率再做调整。