《从祖先到算法》李南南解读

《从祖先到算法》| 李南南解读

关于作者

本书作者亚历山大·本特利，是美国田纳西大学的人类学系主任。他主攻的研究方向是人类传播知识的方式，曾著有《窃言盗行：模仿的科学与艺术》。

关于本书

这本《从祖先到算法》是对本特利上一部作品《窃言盗行：模仿的科学与艺术》的延续和升级。

核心内容

第一部分，知识的传播，到底是怎么发生的？都有哪些研究？各自的观点是什么？

第二部分，知识的传播，遵循着哪些逻辑？

你好，欢迎每天听本书。

今天为你解读的，是一本人类学领域的漫谈，叫《从祖先到算法》。这本书主要探讨了一个话题：知识到底是怎么传播的？

乍一听，你可能觉得，很好回答。书本、聊天、上网，不都能传播知识吗？但是，这本书探讨的，不是此时此刻，传播知识的方式。而是在上百万年的时空尺度上，传播知识的逻辑。

这么说可能有点笼统，举个例子，你就知道这个研究解决的是哪一类问题了。你可能听过一句话，叫话越传越多。比如一件小事，从村东头传到村西头之后，就被添油加醋，传得面目全非。但是，你能想象吗，有的故事口耳相传了2000年，几乎没有任何变化。比如《小红帽》的故事，根据人类学家的最新研究，这个故事已经出现了2000年，在全世界有58个版本。而且这58个版本，居然出奇的一致，只是在一些细节上，有那么一丁点改动。比如在亚洲地区的版本里，当狼外婆假扮不成功时，会喝一点水，来清清喉咙。在非洲的版本里，狼会自己割破舌头，为了让声音更柔和。除了个别细节之外，这个故事几乎没有任何变化。

那么，为什么在一个小小的村子里，信息的传播会有那么大的变形？而在全世界范围内，跨越2000年，一个故事居然可以这么稳定？要想回答这个问题，咱们就得明白，知识的传播到底遵循着什么样的逻辑？

要特别说明的是，这本书虽然不到200页。但读起来难度不小。因为它的起点，是基于另一项人类学研究。就像一栋楼，把入口设置在了二层。所以，要想读懂这本书，咱们得先找到通往二层的梯子，要把之前的研究翻出来，梳理一遍。当然，这个过程本身也很有趣。因为把这些观点前前后后串起来，你会发现一场很精彩的人类学思辨。为此，我也特地查询了之前的相关研究，在接下来的解读中，把它们一起讲给你听。

这本书的作者，是美国田纳西大学的人类学家，叫亚历山大·本特利。他主攻的研究方向，就是人类传播知识的方式。他的上一本书叫《窃言盗行：模仿的科学与艺术》。窃言盗行，就是盗窃语言和行为的意思。这本书主要说的是，人类的知识传播，最早是依靠模仿同类的行为来实现的。而今天要说的这本《从祖先到算法》，是他对上一部作品的延续和升级。

接下来，我将分成两部分，为你解读这本书。第一部分，咱们围绕这场漫谈的核心，说说，知识的传播，到底是怎么发生的？前前后后都有哪些研究？各自的观点是什么？第二部分，再说说，知识的传播，遵循着哪些逻辑？

首先，第一部分，咱们先围绕着，知识的传播到底是怎么发生的，这个问题，来说说这场人类学思辨。

这场思辨，要先从一个人说起。这就是著名的人类学家，科学探险家，阿尔弗雷德·拉塞尔·华莱士。在人类学领域，这是一个跟达尔文齐名的大宗师。当年，达尔文刚刚提出进化论，华莱士就提出了自然选择理论，几乎是前后脚。而且在很多问题上，华莱士的看法比达尔文还要深入。

比如，孔雀为什么开屏？要知道，对孔雀来说，开屏的代价，是牺牲飞行能力。对鸟类来说，不会飞，这个损失太大了。针对这个问题，达尔文的解释是，开屏可以让雄性吸引雌性。而华莱士在这个基础上，又深入一步，多问了一句，雌性孔雀为什么会喜欢雄性开屏？他的解释是，因为羽毛好不好看，反映了鸟类健不健康。羽毛越漂亮，说明越健康。所以本质上，开屏其实是在释放健康信号，雄性通过这个信号来吸引雌性。你看，这个解释是不是更深入？

但是，就是这么厉害的一个人，却遇到了一个，他没法解释的问题。这个问题困扰了人类学家几十年。后人还用他的名字，来命名这个问题，管它叫，华莱士问题。

简单说，华莱士问题可以总结成一句话，那就是，人类的大脑发挥功能，为什么总会滞后？假如我问你，20万年前的原始人，为什么没有发明蒸汽机？很多人的第一反应可能是，因为他们还不够聪明，大脑不够发达。但是，考古学家已经发现，大概20万年前，原始人的大脑，就已经达到了目前的水平。从生理结构上看，他们跟你一样聪明。你能掌握的知识，20万年前的祖先都能掌握。

但问题就出在，这些聪明的祖先，却几乎什么都不会。比如语言、绘画、使用火，这些潜藏的能力，直到很久之后才突然展现出来，并且突飞猛进。我们的大脑，在期间的十几万年里，就像休眠了一样。

你看，人类的大脑，早在20万年前，就为太空遨游做好了准备。但是，我们却直到今天，才刚刚登陆月球。那么，大脑发挥功能，为什么会滞后这么多呢？

这个问题困扰了学界很久，人们提出过很多解释。直到1992年，一个来自脑科学的发现，回答了这个问题。

当时，神经科学家发现了大脑里，有一群叫作镜像神经元的神经细胞。镜像神经元的功能，就是让我们能够模仿同类。

比如，你看到别人造了一把斧头，你也能照葫芦画瓢，造一把出来。这个模仿能力，就来自于镜像神经元。再比如，镜像神经元，还是语言诞生的基础。因为语言诞生的前提，是感知对方的意图。什么叫感知？说白了，就是对感受的模仿和再现。你能感受到别人的快乐、恐惧、焦急，等等。总之，信息、情感、文化，之所以能在人类之间快速传播，就是因为我们的大脑里有镜像神经元。

基于这个发现，加州大学圣迭戈分校，有一个著名的神经科学家，叫拉马钱德兰，对华莱士问题作出了回答。他认为，人类掌握一个知识，分成两个阶段。

第一个阶段是，个别的几个人，偶然遇到了一些问题，并针对这个问题，制定了解决方案。比如，某个部落要经常面对大型猛兽，他们发现，用手斧，也就是最早期的那种，只能握在手里的，削尖的石块。他们发现，用手斧对抗大型猛兽，风险特别高。你只有离得很近，才有机会使用。为了解决这个问题，这个部落，就有人琢磨，可以把石块，打磨成尖利的细长条，这样就可以投掷。这就有了早期的长矛。

第二个阶段，是通过镜像神经元，其他的同类快速模仿这个技术。比如，一个部落出现长矛之后，过不了多久，所有的部落就都能造出长矛。这样，一个新技术、新知识，就在人类中快速传播开了。

换句话说，知识的发生是偶然的，是少数人为了解决自身环境中，遇到的那个特定的问题，发展出了某个知识。但知识的传播是必然的。因为人类的镜像神经元，能让我们快速完成模仿。并且通过模仿，来掌握这个知识。

你看，这就回答了华莱士问题。为什么大脑发挥功能会滞后？很多知识直到很晚才被人类掌握？这是因为我们还没有遇到，能够触发这个知识的问题。

同时，这个研究，也伴随着另一个结论。注意，这个结论，跟我们今天的主题关系很密切。那就是，知识到底是怎么传播的？根据镜像神经元的发现，得出的结论是，模仿，是人类这个物种，传播知识的主要方式。

其实，在很久之前，类似的理论就有人提出过。只不过这回，镜像神经元的发现，从脑科学的角度，把这张拼图给补齐了。这个结论，也成为很多学者的共识。在它的众多支持者里，就包含咱们今天说的这本《从祖先到算法》的作者，亚历山大·本特利。前面说过，他的上一本书，是2013年出版的，叫《窃言盗行：模仿的科学与艺术》，就是从这个观点，衍生出来的，认为人类的知识、信息和文化的传播，是通过模仿实现的。

听到这，你可能会觉得，这个理论很有道理。你看，它既符合社会学的推论，也有脑科学的佐证。但是，就在之后的几年里，作者发现了两个疑点。

第一个疑点是，假如只有创新和模仿这两种行为的话，在一个族群里，创新者太多，新知识太多，这就难免出乱子。人们会没法判断，哪个知识才最有效，最值得传播。假如是通过实践来试错验证，这个成本未免太高了。反过来，假如创新者太少，模仿者太多，一个知识出现之后，所有人全都接受，这就会导致，一个族群的技能千篇一律，失去多样性。在传播学上，管这种因为传播单调的信息，导致整个群体中的信息质量降低的现象，叫作回音室效应。就像你在一个空房间里，说出一句话，听到的全是自己的回音。这些反馈没有任何价值。

总之，创新者的数量不能太多，也不能太少。后来，人类学家还推算出了一个数字，5%。也就是，一个族群里，有5%的创新者，和95%的模仿者，这个比例是最合适的。但是，作者发现，很多族群并不符合这个比例，但也没出什么问题。这是第一个疑点。

第二个疑点是，在人类的知识传播史上，其实一直存在两种传播方式。第一种是复制，比如阿舍利手斧，这是旧石器时代的工具。人类使用它长达150万年。在这150万年里，阿舍利手斧几乎没变样，只是大小不同。这是第一种传播方式。第二种是变形，就像咱们开头说的，一句话从村东头传到村西头，就变得面目全非。其实，工具的制造，也经常出现类似的情况。你发明一个工具，别人学会之后再次制造，总会跟你做的，有点不一样，但总体上，又差不太多。这就说明，在模仿和创新之间，还存在着第三种，知识传播的方式。那么，这个方式到底是什么呢？

注意，重点来了，这个答案，是这本书的核心。我之所以要解读这本书，很大程度上，也是因为受到了这句话的触动。

作者认为，在模仿和创新之间，还存在第三种行为，叫作效仿。它和模仿不是一回事。模仿是对结果的复制。而效仿，是对思考过程的再现。

这二者最大的区别，就在于，效仿比模仿，多问了一个为什么。比如，我看到你用石头造了一把长矛。模仿就是我也用石头，做一把一模一样的长矛。假如没有石头，这个模仿就没法实现。造长矛的知识，也就传播不到我这。

但是，效仿就要多问一个为什么，并且通过这个为什么，来还原你的思考过程。比如，我在造长矛的时候会想，为什么要用石头？因为我的目的是击杀猎物，所以材质必须坚硬。那么，假如没有石头，我能不能用坚硬一点的木材代替？假如换成木头，我是不是可以把它削得更尖一点，来达到同样的效果？

你看，在这个过程中，表面上看，我只是在照葫芦画瓢。但实际上，我是在重现制造长矛，这个知识的发生过程。我追求的是杀死猎物的结果，而不是重现死板的制造工艺。

用一个今天的词，效仿，其实是一种微创新。也就是，我不对原来的知识，做任何颠覆性的突破。但是，我也不完全照搬。而是以这个知识为蓝本，结合我自己的思考，做出一些微小的改进。

同时，效仿本身，还是一个知识的纠错筛选机制。你看，当一个新知识出现，模仿者可能不分青红皂白，照做就是。但是，效仿者会多问一个为什么。为什么这么做？它的目的是什么？为了实现这个目的，这是不是最有效的方法？

作者认为，很多动物都懂得模仿，比如大猩猩。在知识的传播这件事上，真正让人类和大猩猩区别开的，就是人类懂得效仿。

其实，说到这，你可能已经发现，即使在今天，知识的传播，也遵循着这个逻辑。我们经常说，一个知识或者技术，要小步迭代，也就是一点一点改进。这个小步迭代，本质上就是一种依托于效仿的微创新。

以上就是第一部分内容。知识的传播，到底是怎么发生的？围绕这个问题，人类学家开展了漫长的思辨。刚开始，人们认为知识是依靠模仿行为传播的。但现在，作者提出，在创新和模仿之间，还存在第三种行为，叫效仿。效仿的本质，是一种基于原有知识的微创新，也是人类对新知识的完善纠错机制。那么，说到这，我们就自然而然地要问一句，我们在效仿时，遵循着什么样的逻辑呢？

接下来，第二部分，我们就说说，效仿遵循着哪些规则？

开头，咱们曾经说过一个问题，为什么《小红帽》的故事，流传了2000年，几乎没有任何改变？其实，类似的情况还有很多。比如《白雪公主》，也有很多版本。但各个版本都差不多。像爱尔兰版，只是把魔镜换成了一条鳟鱼。是鳟鱼告诉王后，你不是最美的女人。其他部分，并没有太多改动。

要想解释这个问题，咱们就得说到，效仿行为的第一条规则，叫幸存者效应。也就是，在信息的传递中，我们不管怎么改动它，都会留下那些，跟生存有关的知识。

你看，《小红帽》《白雪公主》表面上看，都是故事。但是，这些故事本身，却包含着一系列，跟生存有关的知识。比如《小红帽》的故事告诉你，不要相信陌生人，不要独自居住，森林是危险的，等等。再比如《白雪公主》告诉你，不要接受陌生人的食物。这些情节，本质上是一种在任何一个时代，任何一个国家，都适用的生存知识。因为实用，所以它们不管怎么传播，也不会发生太大的改动。毕竟，这关乎生存。

同样，我们在效仿一项技术时，也一定不会改变那个，关系到生存的关键部分。比如，你想效仿别人，造一张弓箭。那么不管你对这把弓做出了多少改动，你肯定不会把尖头改成圆的。它一定还是尖的。因为只有尖的，才能杀死猎物。

说到这，我们已经知道，那些跟生存有关的信息，会在效仿中保留下来，不会发生太大的变形。那么，什么样的信息，最容易发生变形呢？比如开篇说的，一句话从村东头传到村西头，为什么会面目全非？这就要说到，效仿行为的第二个规则，叫社会地位效应。也就是，一个信息越是能够吸引别人的注意力，能够引起争议，在这个信息面前，人们就越容易忽略事实。为了成为人群中的焦点，占据更好的社会位置，人们有可能会把这个信息改得面目全非。

仔细想想你就会发现，那些被传得乱七八糟的信息，往往特别八卦。比如明星绯闻，家长里短。

对这类信息，我们有天然的好奇，总是忍不住想打听。更重要的是，在传播这类信息的时候，假如你一五一十，实话实说，别人反倒不爱听。反而是添油加醋，他才会听得津津有味。

换句话说，假如一套知识里，包含着一些八卦，或者有争议的内容。它在传播的过程中，这些八卦的部分，就很容易变形。比如，牛顿被苹果砸中，发现了万有引力。这是一整套，包含知识的信息。它包含两个内容，一个是万有引力这个知识，这部分不管怎么传播，都不会变。但是，另一个内容，牛顿被苹果砸中，这就是个有点八卦感的故事。它到底发没发生过？直到今天，这还是科学史上的一桩公案。据说牛顿本人，从来没有在任何手稿上，提到过这件事。但是，我们仍然传得乐此不疲。这就是社会地位效应，在发生作用。

当然，这只是在一定时期内，显示出的传播趋势。假如我们站在一百年，甚至一千年的时空尺度上，观察人类知识的演进。你会发现，整个人类的知识，是一路向好，不断提升的。换句话说，在知识传播这件事上，人类其实有一套很牢靠的纠错机制，让我们排除错误，不断逼近真相。这套最底层的纠错机制，就是我们要说的，第三种知识传播的规则，叫作贝叶斯规则。也就是，在知识的传播中，人类会使用贝叶斯推算，不断搜集证据，来更新知识。

贝叶斯是18世纪初的一位苏格兰神父，也是一位数学家。贝叶斯推算，是他发明的一种数学方法。这套公式非常复杂，咱们在这就不多说了。只需要大概知道，贝叶斯推算的核心，是先建立一套假设的因果模型，然后，再根据搜集到的新证据，来更新这套模型。后来，人们把这种思考方式，统称为贝叶斯推算。咱们今天说的，不是具体的贝叶斯公式，而是这套思考方式。而且深入观察你还会发现，贝叶斯不光是一种数学推算，也是人类认知这个世界的基本方式。而贝叶斯做的，是把这套方法数学化。

说到这，到底什么是贝叶斯推算，你可能还是觉得有点笼统。要想弄明白，首先，咱们得知道，人类获取知识的目的，是弄清这个世界运转方式。什么叫运转方式？本质上，其实是一套因果模型。也就是A和B之间，到底有什么因果关系？比如地震，到底是地质变动导致的自然现象，还是背后有鬼神作用？再比如草木生长，到底是因为有阳光雨水，还是因为上帝的恩赐？人类获取的一切知识，几乎都是为了建立一套，尽可能反应世界真实运行方式的因果模型。

当然，你可能发现了，很多因果模型在今天看来，根本靠不住。那么，在现代科学出现之前，人们是怎么修正这套因果模型的呢？就是依靠贝叶斯推算，先建立一个假设的模型，然后用新证据来修正它。

比如，张三家的房子被龙卷风吹倒了，他怀疑是邻居李四在诅咒他。李四的诅咒是原因，龙卷风是结果。这是初始的因果模型。然后，你就可以搜集证据来修正它。怎么搜集证据？最简单的方式是，对原因做一个干预动作，看看结果有没有改变。假如有，就说明二者可能存在因果关系。假如没有，就不存在。比如，在这个故事里，干预动作就是，找村长做主，由村长命令李四，让他也诅咒别人，然后看别人家的房子有没有事。

再比如，一个原始人，发现每到春天，小草和树木会一起变绿。这两件事有百分百的相关性。但是，怎么判断有没有因果关系呢？根据贝叶斯推算，很简单，只要对其中一个对象，做一个干预动作就行了。比如把草拔了，假如树照样变绿，就说明树变绿和小草之间没什么关系。

而且更重要的是，对人类来说，贝叶斯推算其实不需要学，我们天生就掌握这种思考方式。比如，你在公交站等车，第一趟车是6点半到的，第二趟车是7点到的。你本能的就会觉得，第三趟车，应该7点半到。但是，假如7点半没到，而是8点到。你会更新这个模型，觉得发车间隔，可能是成倍的延长。第一趟和第二趟之间间隔半小时，第二趟和第三趟之间间隔一个小时。那么第三趟和第四趟之间，应该间隔2个小时。那么，下一趟车可能是10点到。

注意，这个推算准不准确，其实不重要。重要的是这种思维方式。我们天生就懂得搜集新证据，来更新因果模型。

换句话说，在知识的传播中，每个接触到这个知识的人，都有机会根据自己搜集到的证据，来验证和更新这个知识。贝叶斯推算，是人类传播知识，最底层，也最根本的一种纠错机制。这就是咱们说的第三种，知识传播的规则，贝叶斯规则。要特别说明一下，贝叶斯规则这个词并不是书里提出的，它完整的表述应该是，人们会本能地调用贝叶斯方式方法，来验证知识。为了表述方便，咱们把它简称为贝叶斯规则。

好，以上就是第二部分内容。效仿遵循着哪些规则？其实，我们探讨的已经不只是效仿的规则，而是人类传播知识的规则。咱们一共说了三个规则，幸存者效应、社会地位效应和贝叶斯推算。这些刚说完，就不重复了。

到这里，这本《从祖先到算法》的精华内容，已经为你解读完了。其实，在整本书里，我个人最喜欢，也最希望你拿走的一句话，就是那句关于模仿和效仿的定义。模仿是对结果的复制，效仿是对思考过程的再现。因为这句话，其实反映了两种很常见的思维模式。我们在看到别人的创新时，到底是在揣摩对方的思考？还是在刻板地模仿某个结果？我相信，把实现成功的能力学到手，比试图直接模仿成功本身，要更加可行。最后提醒，听书已经上线红包分享功能。你只要点击文稿里的红包按钮，就可以把它分享给你的朋友。

撰稿：李南南脑图：摩西脑图工作室转述：徐溟旭

划重点

1.在创新和模仿之间，还存在第三种行为，叫效仿。效仿是基于原有知识的微创新，也是人类对新知识的完善纠错机制。

2.人类传播知识的规则有三个，幸存者效应、社会地位效应和贝叶斯推算。

3.模仿是对结果的复制，效仿是对思考过程的再现。

《从祖先到算法》 李南南解读