《声音捕手》 董晨宇解读
《声音捕手》| 董晨宇解读
你好,欢迎“每天听本书”,我是董晨宇。今天为你解读的书是《声音捕手》,副标题叫作“获取人们感受、隐私和金钱的智能语音营销”。
对于智能语音设备,咱们都不会陌生。你很可能购买过“小度音箱”或者“天猫精灵”一类的产品,并且通过和它们说话来发出命令,比如问问天气、听听歌。除此之外,智能语音设备还包括车载信息系统、警报器等家居互联设备等等。简而言之,所谓智能语音,就是通过捕捉我们的声音,来完成任务的技术。这本《声音捕手》关注的便是这一当下非常火的行业,不过,作者并不想和我们一起畅想行业未来,而是希望向我们发出警告:智能语音很可能不是我们的朋友。
何出此言呢?我来给你举个真实的案例。在美国亚马逊公司的一项专利中,描述了它们为智能语音设备开发的新功能。一个咳嗽、鼻塞的女性对一款智能音箱说:我饿了。请注意,只有这三个字。不过,这个设备已经足以通过用户的音调、节奏、发声方法、颤动等细节,检测出说话人的语音异常,并判定为感冒。这时候,智能音箱马上问她,需不需要喝点鸡汤,当这位女性拒绝后,它又提议说,可以考虑购买一小时内可以送达的止咳糖浆。
讲完这个例子,我想问你一个问题:如果你是这位女士,你会觉得它很体贴吗?恐怕还真不一定,因为很可能它正打着自己的算盘呢。从短期来看,它可以挖掘用户可能的需求实现盈利,比如你很可能会在亚马逊在线药房中购买这瓶止咳糖浆;从长期来看,智能语音设备可以通过你的声音变化,推断出你的整体健康状况,这些信息很可能会和你的健康保险评估联系在一起。
从这个角度去想,我们因为智能语音设备而在生活中获得的便利,与我们因此失去的隐私相比,哪个更重要呢?当然,评估其中利弊的权力,肯定要交给消费者本人,但这本书的目的,就是在你进行决定之前,帮你揭秘智能语音行业如何攫取我们的个人信息,实现自己的商业目的。这本书的作者是美国宾夕法尼亚大学教授约瑟夫·图罗。他是广告学研究的著名学者,自1974年开始,便在全球顶级学术刊物上发表广告学相关研究。近年来,他尤其专注于商业智能语音设备的研究。《声音捕手》这本书是他在2021年最新的力作,一经推出,便被美国著名商业博客Business Insider评选为当年最值得关注的21本书之一。
好,接下来,我就分三个部分,为你介绍这本书的主要内容。第一部分,我从历史角度,来和你梳理一下“声音”如何成了商业营销的“新宠”?第二部分,我从商业角度入手,和你分析一下智能语音技术如何通过诱导式监控,让消费者爱上它。换句话讲,为什么很多人明明在意自己的隐私,但还是会购买和使用这些产品。第三部分,我再从政策角度入手,和你解释一下美国对于智能语音行业的治理为什么难有进展,中国在这方面又有什么经验。
首先,我从历史角度,为你解释一下,声音如何成了如今的商业“新宠”。请注意,当我们使用“新宠”这个词的时候,至少就需要说明白两件事:第一,旧宠是谁?第二,旧宠在哪里不如新宠?
首先我们来说旧宠是谁。作者认为,在市场营销中,智能语音设备通过识别用户声音来定位需求,这本身属于“个性化营销”这个领域在处理的事情。因此,当我们说“旧宠”的时候,就需要首先理解,在智能语音设备之前,企业是怎么做个性化营销的。
虽然个性化营销这个词听起来很时髦,但其实它是一种非常古老的营销手段,在历史上至少经历了三个阶段。第一阶段是小商贩。我给你举个例子,你家附近有一个小饭馆,你经常去吃饭,服务员和你也算是半个熟人,你一进门,他很可能不会问你想吃什么,而是说:“您来了,吃点什么,和上次一样?”如果店里人不多,他还可能和你聊几句家长里短的事。
严格意义上讲,这其实就是个性化营销。小商贩作为一个古老的存在,他们的经营活动被限定在一个非常有限的区域里,他们的生存之道,就是和这个区域里的消费者建立比较持久的关系,对不同的人说不同的话,推荐不同的商品。
不过,小贩的个性化营销也有一些难以解决的问题,比如效率低下,没办法扩张。所以这种店铺被我们称为“小本生意”,它做不大。随着大众媒体和市场调研机构的崛起,个性化营销进入了第二阶段。在大众媒体时期,不同媒体对应着不同性别、收入、种族、年龄的用户,一家企业需要先弄明白你的目标客户喜欢看什么内容,然后在相关的媒体上打广告。请注意,这个逻辑在如今仍然没有过时,比如你的用户是年轻人且受教育程度较高,你可能会考虑在播客节目上投入广告;但如果你的用户是老年人,电视台仍旧是你可以考虑的一个选项。
大众媒体的优势在于效率高,容易同时接触到大量的潜在客户,不过,它所做的个性化营销,仍旧是建立在非常肤浅和粗糙的指标之上。随着社交媒体时代的到来,个性化营销进入了第三个阶段。社交媒体中的个性化营销,主打的就是数据翔实、丰富。一方面,用户会在社交媒体上留下大量的个人信息和行为轨迹,另一方面,企业又可以通过大数据方式捕捉到这些信息。这样一来,个性化营销就不仅仅止步于大众媒体时期的人口学特征,还包括了用户的兴趣爱好、观点态度、社交关系等等。埃里克·施密特在谷歌担任首席执行官时曾说过一句很有名的话,谷歌公司能大致知道顾客是谁、关心什么、他们的朋友都是谁,毫不夸张地说,它甚至比顾客更了解他自己。
不过,施密特在说这句话的时候,用了“大致”这个词。这意味着谷歌对用户的了解还不够完美。为何如此呢?因为用户虽然留下了丰富的数据,但这些数据有多少是真实的,就很难讲了。比如,一个人很可能会在社交媒体上谎报自己的年龄、收入,甚至是性别。
说到这里,我沿着个性化推荐这个脉络,为你总结了三个旧宠,分别是小商贩、大众媒体和社交媒体。接下来就到了第四个阶段:智能语音技术。那么,智能语音技术凭什么能成为“新宠”呢?简单来说,作者总结了三大优势:
前两个优势比较容易说清楚。第一,声音本身是独一无二的,而且很难撒谎。我们可以在社交媒体上填写虚假的个人信息,但很难随时随地伪装自己的声音。第二,相比面目识别技术,语音识别技术没那么惹人注意,公众的反感会少很多。举个例子,一说到刷脸支付,很多人都不愿意开启,就是担心自己的隐私安全。不过,语音识别技术已经悄悄走进了千家万户,比如说智能音箱设备,因为它的监控更加间接、更加难以被察觉。
第三个优势我要和你展开聊聊。用户的声音作为一种个性化营销数据,它的潜力可能会超出你的想象。我来给你介绍三个已经经过科学证实的结论:
第一,我们可以通过一个人的声音大致判断他的体重。体重越重的男性的声音就越高昂,体重越重的女性的声音就越低沉。不仅如此,我们如今甚至已经可以根据五岁儿童的声音频率,来判断他的实际体重了。
第二,我们可以通过一个人的声音揭示他的身高。道理也不难懂,个子高的人有更长的声道、更大的肺,他的声音和个子矮的人就不太一样。
第三,在一名女性开始服用避孕药的几个月内,智能语音技术就可以检测出她用了避孕药。这是因为这种药物会抑制排卵,从而改变身体的激素水平,进而改变一个人的声音特质。
当然,这三个例子仅仅是冰山一角,智能语音领域的研究者普遍相信,在不久的将来,我们可以很容易从一个人的声音中识别出更详尽的个体特征,比如相貌、体形、疾病、年龄、智力等等。
这里要多说一句,我和你介绍这些潜在的应用,并不是要神话智能语音技术。公允地讲,用声音推测用户的生理状态,比如身高、体重、疾病,科学研究的进展很大;但是用声音推测用户的社会状态,难度比较大,至今还不是很靠谱。这里面主要的原因是文化差异。举个例子来说,我们用声音判断一个人情绪的难度就很大,因为不同文化表达情感的方式不同。很多美国人不管激不激动,都特别喜欢用夸张的声音和表情来表达自己的感受。很可能声音上激动,内心里平静。但中国人正好相反,我们的文化在很大程度上是压抑自我表达的,即使你很激动,也要控制自己的情绪,表现得很冷静,这才是成熟的标志。这也就意味着,一个人的文化背景、家庭背景对他的声音表达方式影响会非常大,不过,目前的智能语音技术很难掌握和分析这些文化方面的信息。
不过即便如此,智能语音对于生理状态的判断水平就已经足够让企业感到兴奋了,当然,也足够让很多消费者不寒而栗。我们可以设想一下,如果一份语音分析结果显示出一个人患有抑郁症,或者处于帕金森病早期阶段,或者仅仅是服用了避孕药,这份语音分析结果又被送到了老板或保险公司的手中,这个人会被人怎么看呢?
说到这里,我们便需要解释一个十分矛盾的问题:明明智能语音技术会对我们的隐私产生巨大的潜在威胁,为什么还有这么多人去购买和使用它呢?作者在书中将这种矛盾解释为五个字:诱导式监控。
这个词是2017年由社会学研究者皮内洛皮·特鲁利诺提出的。特鲁利诺的意思很简单,她认为在现代社会中,公众经常被诱导,自愿参与一些可能有损自己隐私的行为,并且在这个过程中,会更关注这一行为给自己带来的好处而不是坏处。诱导式监控往往会采取一种平行策略,一方面强化公众的获得感知,另一方面弱化公众的损失感知。接下来,我就从这两方面来和你解释一下,智能语音技术的生产企业,尤其是亚马逊、谷歌和苹果公司,是如何引诱消费者接受自己的产品的。
我们首先来说“强调获得感知”。作者在书中总结了三个策略:打造一体化、建立乌托邦,以及最简单粗暴的低价销售。
所谓打造一体化,就是亚马逊和谷歌这些商业巨头通过各种智能家居的开发,为消费者提供了一整套智能语音技术驱动的家庭设备,用作者的话来讲,就是让智能语音成了“伴随你一生的技术”。我们之前主要提到的例子都是关于智能音箱的,但实际上,大型公司的愿景绝不仅仅是一个音箱,而是希望将自己的设备覆盖到家居生活的方方面面,比如亚马逊公司的产品就包括低音炮、播放器、微波炉、挂钟、智能插头、屏幕、摄像头等等,它为智能家居提供一个全面解决方案。而连接这些设备最主要的方式,就是强调个性化的语音驱动。
作者在书中举了一个智能家居的未来场景:晚上孩子快写完作业了,妈妈打算让他过一会儿洗个澡,就用语音指令的方式打开了再循环水泵,等孩子要洗澡的时候,一打开喷头就马上可以出热水,完全不用等待。睡觉前,妈妈和智能语音设备说一声晚安,然后所有的门锁和灯会一起关上。那么,一体化的意义是什么呢?一言以蔽之,就是通过让消费者习惯于使用语音操控各种家庭设备,从而把消费者锁在它的生态系统中。让消费者离不开它,而不是它离不开消费者。
接下来是建立乌托邦。在这里,作者特别强调了专业媒体扮演的推波助澜的作用。
你可以回忆一下,在一项新技术刚刚出现的时候,媒体喜欢怎么报道这些技术?一般来讲,两种报道最多。一种是“技术万岁”派,媒体会宣称这个技术能带给我们一个更好的世界;另一种是“技术至死”派,宣称这个技术会让人类陷入更大的困境。比如AI刚刚兴起的时候,人们都在畅想未来的世界会是如何智能;但当AI驱动的阿尔法狗击败李世石时,媒体又在渲染人类文明将会被AI攻陷的警告。这就是典型的技术万岁和技术至死两种极端态度。
回到智能语音这个技术上,作者以Siri的问世作为案例,发现绝大多数的媒体都在营造“技术万岁”的乌托邦气氛。比如说,在Siri推出之后,《纽约时报》就发表了一篇长文,回顾了交互式助手的历史,并相信它们有一天能够成为我们的医生、司机、翻译和客服。这些言论将智能语音视为技术发展史上的一个重要里程碑、一场革命性的进步。你作为消费者,如果跟不上这种进步,自然也就会被时代淘汰。一言以蔽之,作者认为,媒体对于智能语音技术的正面报道建立了这种技术的合法性地位,也助长了这种产品将会与我们紧密相伴的观念。
那么,有没有报道警告消费者必须慎重考虑智能语音呢?作者的观察是,不能说没有,但是寥寥无几,甚至《华盛顿邮报》在一则头条文章中直接说:智能语音设备的确存在隐私风险,但消费者愿意为了便利而牺牲隐私。美国一家语音行业的网站调查也证实了这个观点,2/3的美国人担心智能语音技术带来的隐私风险,26%的人表示非常担心,但这并没有影响他们购买语音设备。
最后是简单粗暴的低价销售。这一策略很容易理解,对于消费者来说也非常熟悉。比如说,在推出智能语音设备Alexa时,亚马逊首先为Prime会员提供了提前购买即可享受额外折扣的福利,为什么这样做呢?因为这些Prime会员是公司最信任,也是最忠诚的顾客,可以帮助公司进行口碑传播。整体而言,Alexa卖得也非常便宜,几乎赚不到什么钱,当然不难理解,亚马逊也从来没有想依靠这个设备本身赚钱。
聊完了强调获得感知,我再和你说说这些企业如何降低公众的损失感知。作者同样总结了三种策略。一是不透明的运行规则、二是转移注意力、三是安抚。
我们首先来说不透明的运行规则。在美国,虽然近年来有很多人在呼吁更加积极和透明的算法政策,比如让企业公开自己的算法,或者让消费者参与到算法制定的过程中,但是,真正愿意这么做的美国企业寥寥无几。这也就意味着,你的声音被智能语音设备收集之后,究竟会被发送到哪里、如何储存和处理,以及处理之后的结果会如何反过来影响你,这些问题都是不透明的。
当然,有些消费者非常在意这件事,就投诉这些企业,要求自己的声音不被用于商业活动。但这样做有用吗?作者认为用处不大,因为他发现,有一些公司虽然向它的家居智能设备用户保证说,自己会将录音和广告活动隔离开,不会将相关数据用于个性化营销。但实际上,这些公司会偷偷把录音转成了文本,再进行分析,最后拐了个弯,还是用于向用户展示个性化广告。而这一切都是在幕后,在消费者不知情的情况下运作的。
第二是转移注意力。因为算法的运行规则的不透明,肯定有很多人在使用智能语音设备时会感到恐慌。在这种情况下,最好的办法,就是转移注意力,尽量让顾客不去关注有关信息使用的声明。
我们都知道,一个App的隐私政策,一般都是以很小的字体显示在网站页面底部,或应用程序下方的选项中。就算你愿意认真阅读隐私政策,也会发现里面充满了各种术语,好像就是为了故意让你读不下去。
还有一种情况,想必你也很熟悉,当你给一家企业的客服打电话时,你肯定听过这样的提醒:“为了保证通话质量,您的来电可能会被录音”。这其实也是在转移你的注意力,把你的声音录制下来,真的仅仅是为了保证通话质量吗?实际上,至少从技术手段来讲,企业完全有能力将你的声音和你的消费习惯绑定在一起进行分析。
第三是安抚。这里面最常用的方法,是将智能语音设备的声音初始设定为女性的声音,而且是柔和的女声。比如在美国,Siri、谷歌智能助理和Alexa的默认语音都是女声。这肯定不是巧合,而是因为女性的声音会给人更多的安全感,更友好、恭敬、舒适,消费者的接受度更高。当然,也有很多人批评这种设置,因为它实际上进一步强化了几代人对于女性在社会中从属地位的刻板印象。
说到这里,我们再做一下总结。我和你介绍了三种强化获得感知的策略:打造一体化、建立乌托邦,低价销售,以及三种弱化损失感知的策略:不透明运行、转移注意力、安抚。那么,强化获得和弱化损失双管齐下,结果是什么呢?结果便是培养了一大批“顺从”的用户,听任企业使用他们的个人数据。
宾夕法尼亚大学的研究团队在2017年和2018年做了一项历史性的研究,就证明了这一效果。研究者询问受访者在多大程度上认同以下这句话:“我几乎无法控制营销者在网上对我的了解程度,我已经接受了这个事实。”在2017年,58%的被访者因为认同被归类为顺从者,到了2018年,这个数字就变成了63%。
既然智能语音技术给消费者带来了更加不可控的隐私风险,那么,我们有没有可能禁止这项技术在商业领域的应用呢?
作者在研究时邀请了六位企业高管,来预测语音画像的未来发展。其中,阳狮集团的高管认为,智能语音技术永远不会在商业领域被广泛应用,因为他认为,公众不可能再一次容忍网络隐私被侵犯。不过,另外五位高管都认为,利用智能语音技术来了解客户,并对目标客户进行定向营销,是不可避免的未来。
如果真如大多数人所认为的那样,智能语音技术是商业营销不可避免的未来,那么,我们有没有能力去将这项技术锁在笼子里,或者换句话讲,让它的使用受限于一系列的商业伦理规范呢?说到这里,很多人可能首先想到的策略是,这需要我们努力增强隐私保护意识。比如这本《声音捕手》,就是一本很详尽的科普书籍,让你了解智能语音技术可能带来的风险。不过,增强隐私保护意识这种说法虽然没错,但几乎也没什么用。
在这里,我想和你介绍一个社会学概念:隐性课程。这个词本来是教育学家菲利浦·杰克逊在20世纪60年代提出来的,意思说的是学校如何向学生们全方位展示好的生活方式和学习态度,这些展示又如何潜移默化地规定了学生们探索社会的行为准则。换句话讲,学校的影响力并不仅仅是通过数理化这些课程施加的,更是通过它倡导的生活方式来施加的。后者的影响甚至可能比前者更大。
回到智能语音技术这个话题上来,你会发现,不管是生产这些设备的企业、报道这些设备的媒体,还是利用这些设备的广告商,它们强调的并不仅仅是这些设备在功能上的便捷性,更是大谈特谈智能语音技术在社会方方面面的革命性意义。智能语音技术是什么?是一项技术吗?没错,但在各种各样的宣传中,智能语音技术更像是一种梦想,一种人类社会的未来。这些梦想加在一起,就形成了一门“隐性课程”,影响着人们广泛认同的世界观,更决定了社会中大多数人想当然接受的生活规则。这样一来,人们不仅接受了智能语音技术是先进的、合理的,也渐渐接受了智能语音营销是正常的。
简单而言,作者的观点是,如果仅仅从个体层面劝说公众警惕甚至拒绝这一技术,几乎是无用功。相比之下,更重要的手段应该在法律层面对它进行刚性的限制。
不过,这件事在美国进行得并不顺利。原因其实也很简单,作者认为,美国联邦政府对于监控技术采取的法律策略,往往是最小干涉原则。作者甚至发现,除了针对健康、金融信息和13岁以下儿童等特定群体存在相关法规之外,没有任何联邦法律对商家的监控行为加以有效限制。虽然在这几年里,美国的抗议活动频频发生,但美国国会内部的分歧却导致联邦商业隐私法一直没有出台。
联邦法律行不通,那就只能寄希望于州法律。作者发现,近几年的确有一些州开始针对商业隐私进行立法,比如2020年生效的《加利福尼亚州消费者隐私法案》,就要求公司在收集声音信息前或收集过程中告知消费者。如果个人要求删除自己的声音信息,那么公司就必须照办。这项法律甚至要求公司必须在自己的网站上设置一个醒目的退出链接,消费者点一下,他的声音数据就不允许流通和出售。但设置这些法律的州目前实际上并不多,并且这么一个州一个州地逐一立法所需要的时间又非常漫长,这就造成美国对于智能语音技术的治理效果非常不理想。
怎么办呢?作者在这本书中,提醒美国政府看看中国经验。相比于美国政府的最小干涉原则,中国政府恰恰走了另一条路,形成了一个由政府引导的数据保护体系,从一开始就对智能语音技术和相关产业进行了严格的限制。
这种限制体现在两个方面。
一方面,中国建立起了一个自给自足的智能语音设备生态。虽然亚马逊和谷歌开发了大量智能语音相关的设备,但在中国市场几乎都没有形成规模。可以说,除了苹果公司开发的Siri之外,其他智能语音设备的生产商都来自中国本土企业,例如百度、阿里巴巴和小米。相对封闭的智能语音产业生态让治理的难度显著降低。
另一方面,中国的强政府治理还表现在一系列法律法规的相继出台。2018年3月,百度总裁李彦宏曾经在公开活动上说过一句话:中国人愿意用隐私换便利,引发了互联网中铺天盖地的反击。当时很多人在讨论,为什么中国人愿意用隐私换便利?但作者的观点则不一样,他认为这句话在中国互联网上引起的愤怒反应,正说明了中国人不愿意用隐私换便利。
接下来,2018年5月,中国国家标准化管理委员会发布了《个人信息安全规范》;2019年,多款应用程序因为“未经用户同意,收集、使用用户个人信息”被工业和信息化部列入黑名单。2022年6月,国家互联网信息办公室又出台了《移动互联网应用程序信息服务管理规定》。作者认为,中国在隐私保护方面处于领先地位。
好,这本书就为你介绍到这里了,下面我们再来回顾总结一下。我分了三个部分来为你解释智能语音技术如何威胁到我们的隐私。
第一部分,我们讲到了智能语音技术为何成了“个性化营销”的新宠。相比传统媒体与社交媒体中既有的个性化营销,智能语音技术的优势在于数据真实、给用户带来的安全感高,以及拥有巨大的应用潜力。
第二部分,我和你解释了智能语音设备的生产企业如何通过诱导式监控,让消费者爱上它。其中存在一个平行策略,一方面强化公众的获得感知,另一方面弱化公众的损失感知。多说一句,你会发现,很多新技术的推广,都会用到同样的逻辑。
最后,在第三部分,我和你介绍了如何应对智能语音技术带来的隐私威胁。作者认为,单单是增强公众的隐私保护意识是不够的,政府需要在法律层面强势介入。在这方面,作者认为美国的治理成果并不尽如人意,应该向中国经验学习。
好,以上就是为你介绍的全部内容。你可以点击音频下方的“文稿”,查收我们为你准备的全部文稿和脑图。你还可以点击右上角“分享”按钮,把这本书免费分享给你的朋友。恭喜你,又听完了一本书。
划重点
-
智能语音技术的优势在于数据真实、给用户带来的安全感高,以及拥有巨大的应用潜力,因此成为“个性化营销”的新宠。
-
智能语音设备的生产企业通过诱导式监控,一方面强化公众的获得感知,另一方面弱化公众的损失感知,最终让消费者爱上了它。