Skip to content

20. 与机器人的交往是否注定会是《她》的结局?从媒介等同看人机互动

大家好,我是刘海龙!欢迎收听《生活在媒介中:传播学100讲》。

这几天我看到前面节目的评论里,有一条听众的留言,她感兴趣“电子乌托邦”与“反乌托邦”的内容,说最近看了一些赛博朋克的影视作品,对资本控制、技术垄断、人性异化深感恐惧,感觉未来的赛博空间会异常孤独落寞。

我很理解这位朋友的担忧。人与机器的交流一直是影视作品的热门话题。比如电影《机械姬》中的机器人,就曾经在图灵测试中利用人类的同情心和弱点,欺骗和引诱测试者,杀死了发明了机器人的发明家,并把机器人都释放了出来。

电影《机械姬》剧照

电影《她》中的人机交流则更具有反思性。主人公西奥多的人工智能系统善解人意,让他感到相见恨晚,并且产生了身体和精神上的欲求,甚至放弃了同真实的人建立关系的可能,而选择与机器成为伴侣。但是当他意识到这个系统正在和成千上万的人建立同样的关系,爱欲的排他性使他不得不终止了这段关系。

电影《她》剧照

大众文化对于人机交流充满了极端状况的浪漫想象,不是好就是坏。但是对于未来的设想总是充斥着恐惧和不确定,几乎没有作品对未来的人机交流做积极的表述。这不禁让我们充满担忧:人是否能与机器进行像和真人一样的沟通呢?和机器的交往是否一定会以悲剧收场?

科幻作品固然精彩,但其实在现实生活中,我们早已开始与机器打交道了。你是如何与电脑打交道的?我们是如何感知和对待电脑的?我们和电脑等新媒体的互动与同人的互动究竟有什么本质的不同?

什么是媒介等同?

我们是不是都有过这样的经历,假如你很辛苦写的东西或者很重要的文件突然因为电脑的某种故障或误操作给删掉了无法恢复,是不是会对着电脑发火,骂它,甚至动手?这就反映了我们在某种特定情绪下的下意识反应,我们会突然像对待人一样去对待媒介。

为什么会出现这种现象?背后的原理会带来哪些媒介设计上的启发?我们今天就通过媒体等同理论来谈一谈人机交流的问题。

什么是媒体等同(media equation)?简单来说就是,个人会像对待真实的人和真实的场景一样去对待电脑、电视和新媒体。

这个理论是由美国学者巴伦·李维斯和克利夫·纳斯(Bryon Reeves and Clifford Nass)在20世纪90年代提出来的。

Bryon Reeves

Clifford Nass

很多人对这个理论的第一反应是有点违反常识。每个人都知道媒介就是个没有生命的工具,为什么我们还会傻到把它当成一个人来看待?

这个说法确实有道理,因为理性上我们确实会压抑住自己的这种貌似幼稚的反应。但是还没有建立这种理性思维习惯的小孩子还是会作出这种反应。

比如一群儿童看到一个电视画面,显示桌子上有一袋爆米花,有几粒还从袋中掉出来。如果这时向儿童提出问题:如果拿起电视机,把它倒过来,爆米花会怎样呢?许多孩子都说其余的爆米花将会从袋子里洒出来。

这个结果可能会让成年人哑然失笑,因为儿童没有意识到媒体内容并不是真实的。但是犯这种错误的不仅是儿童,也包括成年人。

比如为什么我们会被恐怖电影吓出一身冷汗?作为成年人,难道我们不知道那是假的吗?而且即使拍摄内容是真实的,观看电影本身也不会对我们造成威胁。

同样,我们对着电脑和机器发脾气,难道没有意识到这种反应是无意义的吗?机器根本无法读懂我们的反应或作出回应。

还有一个经常能看到的现象,当影视中的人物对观众说话时面带微笑打招呼的时候,观众通常也会有下意识的微笑或友好行为。

人为什么会对媒介做出如此“幼稚”的反应呢?两位研究者是从进化论的角度来解释这一现象的。

李维斯和纳斯认为,人类在几十万年的进化过程中,一直是在和真实的人和环境打交道,我们的大脑跟不上现实的发展,电影、电视和数字媒介,加在一起的历史也就一百多年,在我们的大脑中还没留下深刻的印记,大脑还没有进化到完全适应新媒体。

在漫长的丛林时代,那些体积较大,运动的物体才会对我们构成威胁;和视觉相比,听觉所感知的范围更大。这些长期适应自然界和社会留下的“集体无意识”并不会因为人类短暂的新媒体使用而消失,相反,人类有时还会不恰当地把这种反应误用到新媒体上。

媒体等同理论认为,我们对媒介的反应就是一种无意识,并不需要思考。

当我们对电子媒体做出自然反应时,并不会认为它们是假的。比如我们看到恐怖片时,第一感觉是恐惧,然后才会理性地提醒自己,这一切都是虚幻的。

人性的弱点也是计算机的弱点?

为了论证这个观点,李维斯和纳斯他们在20年的时间里,用了35个实验。

The Media Equation

在他们的实验中,通常都是先找一个人与人交往中会产生社会性反应的情境。比如说,人们一般会更喜欢讲礼貌的人,这是一个原则。

然后他们会在媒介上复制这个情境,比如如果电脑对我们讲礼貌,我们是不是也会像喜欢其他人一样喜欢电脑呢。

有的时候为了让这种反应更接近现实生活中的下意识反应,通常会让两种情景交叉着进行,比如说让参加实验的人看一个视频,然后根据内容回答问题。同时在这个过程中,穿插着让实验对象进行次要任务,也就是回答我们要真正测试的问题。在这么做的时候,实验者的反应时间非常短,通常不能经过大脑仔细思考,这就避免了理性的介入,更容易看到下意识的反应。

我们来介绍几个实验。

首先我们考虑这样一个情境,如果一个人做了某件事,然后当面问你,你觉得我刚才表现得怎么样?我们一般怎么反应?

大部分人肯定不好意思说你表现得不太好,在哪里哪里存在问题。我们一般会磨不开面子,会比真实的评价更正面一些。但是如果这个人不在眼前,另一个人问我们对这个人的评价,恐怕我们会更愿意发表真实的看法。

关于这个现象他们也有一个相应的实验。他们邀请用户对软件作测试,第一个组在测试完毕后,在同一台计算机上对这个软件评分。第二个组换到另一台计算机上对刚才的软件评分。结果发现在同一台计算机上进行的评分,要比在另一台计算机上的评分更高。这说明我们也不愿当着计算机的面,说他的坏话。

卡内基写的《人性的弱点》中也提过类似的观点,他说夸奖别人会有助于人际关系,虽然听上去很虚伪,但是好像现实生活中大部分还是非常吃这一套。虚假的赞美也比没有赞美强。

How to Win Friends and Influence People

用计算机上运行测试软件做实验也有同样的发现,用户对那些夸奖自己的软件往往评分更高,反之,对批评自己的软件评分比较低。

同样,在人际交往中,我们会对谦虚的人更有好感。如果自夸,或者贬低别人,我们会觉得这个人不谦虚,印象不好。反之,如果一个人经常称赞他人,贬低自我,我们会对这个人印象不错。

关于这一点,实验者们还测试了当计算机对于自己的软件和其他计算机的软件做出评价时,使用者对此计算机的评价。结果发现,人们把对人的评价标准也同样用在了计算机身上。

具体来说就是,虽然人们评测的都是相同的软件,但是当计算机称赞自己这款软件或者批评其他计算机上的软件不如自己好时,用户对这款软件的评价相对比较低。但是当计算机称赞其他计算机上的软件更好,或者说自己这款软件不太好时,用户对这款软件的评分就会更高一些。

这说明,虽然面对相同质量的软件与硬件,当用户感觉到与他们交流的媒介更讲礼貌时,他对媒介的满意度就会更高。用户对待电脑的规则与对待人的规则是一样的。

这说明,虽然面对相同质量的软件与硬件,当用户感觉到与他们交流的媒介更讲礼貌时,他对媒介的满意度就会更高。

用户对待电脑的规则与对待人的规则是一样的。

计算机也有性别差异?

除了评价,在性别对待上李维斯和纳斯也有相同的发现。前面我们讨论过媒体存在文化性别,有些媒体被认为是女性使用的,有些媒体被认为男性使用的。当媒体使用不同性别的声音和外形时,使用者也会下意识地把媒体看成是具有某种性别。

比如他们让用户在一个计算机上参加互动辅导课,一部分计算机放的是爱情与人际关系的课,另一部分是技术问题课。这些课程只有声音,不出现人物形象;每个课程中又细分为两种,一种是男性声音,另一种是女性声音。

上完了辅导课,接着就再让这些被试验者到另一台计算机上用文字形式做刚才这门课的测试题。然后再到第三台计算机上,告诉答题者对与错,同时这个计算机还会对第一台计算机的教学工作进行评价。第三台计算机中有一半机器是男性发音,另一半是女性发音。

结果就发现,男性发音的表扬容易被接受,女性发音的表扬就要差一些,而且来自男性化声音的表扬比来自女性化声音的表扬更容易被人接受。

同时,被测试者会倾向于认为女性发音的计算机被认为更了解爱与人际关系的话题,而男性发音的计算机更了解技术问题。

后来他们还进行了一些相关实验,发现人们认为男性化声音比女性化声音更具有魄力,更外向,更聪明,而且来自男性化声音的表扬比来自女性化声音的表扬更容易被人接受。

当然,这些其实都是对性别的刻板印象,它们是不是合理,咱们暂不讨论。但这些实验至少说明,用户是会把媒体看成是有性别的对象的。而且在测试之前,很多用户表示是没有性别歧视的,但是在测试中,他们还是把性别的刻板印象应用在了计算机上。

计算机也有性格?

不仅如此,我们不但会把人类的社交规则应用于计算机,还会赋予他们以人类的个性。当计算机分别使用支配式的文本和恭顺式的文本与用户交流时,人们会认为计算机分别具有支配性和恭顺性两种性格维度,并且具有这两种性格的人会喜欢与自己相似的计算机。

除了计算机,他们也会对屏幕上的虚构的人或事件作出性格判断。研究者们曾经让画家把动物(例如猫、狗、牛、羊)和无生命的物品(例如鞋、书、笔)用彩色简笔画画出来,画上眼睛和其他生命特征,但是并不像人。然后让成人去选择这些动物和物品的性格。

研究结果发现,人们会认为有些动物的支配性比较强,比如鳄鱼、狼和尖齿的狗,这些动物都身体硕大且此有侵犯性,而猫、受惊吓的小鸟和宠物狗则被认为是很恭顺服从。

这些实验说明,人不仅对媒体物体作出社会反应,他们也会对媒体中虚构的人或事件作出相应反应。性格的社会力量十分强大,任何东西、如果画上眼和嘴,都会使人认为它们是有性格的。

其实对人以外的所有物体作出社会反应,是一个在不同文化中都能够看到的现象。尤其是在科学理性不那么发达的时代,各个民族的神话里,都存在着泛神论的现象,这其实就是一种把自然现象、动物和各种物品赋予人的形象与性格的意识。

像中国和日本的妖怪学会给各个物品都赋予一个人性化的妖怪形象。大家去看日本的《百鬼夜行》之类的绘画,真的会觉得东方文化会将一切都妖怪化。

《百鬼夜行》中的幽灵形象

跑个题,这个现象可能和文化也有关系。比如有的学者就认为,东亚文化认为可以通过妖怪去推卸责任,而西方文化则认为妖怪会让他们失去对世界的控制,这好像是一种耻辱。所以东亚文化可能更容易将动物与物人格化。

人机互动

但不管是西方还是东方,早在前现代的时候,人类就有了以人类为中心的等同趋向。而媒介等同,我们可以理解为是一种等同趋向在新媒介技术环境下的体现。

现在,媒体等同理论在人机交互界面的设计方面有非常大的应用,它提醒我们,如果要让用户顺利地与机器打交道,就必须遵守现实世界中的社会规则。

比如我们前面提到的会恭维的计算机或程序更讨人喜欢,所以机器在与人交流时加入一些恭维的话、表扬的话或者更加礼貌,会让用户体验更好。

比如有时候拼写检查纠正用户的错误时,同时对用户已经拼写正确的复杂单词进行赞扬,就可能会让用户感觉没有那么挫败。

还比如说,当用户成功找到某个网站时显示出一条语音或文字表示祝贺,或者订购某个影片或商品时,对其品味进行赞扬,就会比仅仅机械地反馈会让人感觉更好。

还有当用户操作错误时,除了纠正和指出错误外,如果能够结合鼓励和赞扬,可能也会让人有较好体验。

媒体等同理论还引出了一个有趣的问题:媒体是不是一定要设计得像人才能引起人的社会性反应?根据媒体等同这个理论,这个问题的答案显然是否定的。

虽然说人对媒体的反应总是社会性的,但媒体与人外在的相似性并不一定是产生社会性反应的必要条件,我们可以把那些完全没有人的外形的机器也想象成人,并与之互动。

而且根据日本森政弘提出的“恐怖谷效应”理论,当类人物体外形趋近人类但还不是100%相似时,人类的好感度会突然下降,出现一个低谷。比如僵尸、蜡像、尸体、诡异的人形机器人等,它们像人但是又不完全是人,反而会引起人类的反感和恐惧。

恐怖谷原理示意图

近年来属于媒体等同理论的发现越来越多,其实这个理论是早期的人机交流理论中比较有名的理论。

李维斯和纳斯的这本《媒体等同》是1996年出版的书,在出版24年后,于2020年才获得了国际传播学会(ICA)的最佳图书奖。可见人机传播和人机互动越来越受到重视,这个研究的价值得到了承认。

所谓的人机互动,简称为HCI(Human Computer Interaction),是一个研究人如何感知、思考以计算机为基础的技术,以及什么样的条件会影响人机互动、什么因素可以提高计算机系统可使用性等问题的领域。

这里面根据人与媒介的关系,又分为两个不同的研究路径。第一个是把计算机作为信源进行研究。这种角度把计算机作为一个社会行动者(CASA,computers are social actors)看待,把计算机看成是一个主体,考察人们如何对其做出社会性反应。前面说的媒体等同就属于这个角度。

为什么人会对计算机做出社会性反应呢?除了媒体等同提出的进化心理方面的解释外,还有两种解释。一是认为用户在与机器互动时会联想到程序或技术背后的人或者是制造者,认为是制造者们通过程序和机器与用户在互动。二是这可能反映了互动者不了解计算机系统如何工作。

比如前面提到过用户会对那些恭维自己的计算机更有好感。但是研究发现,当用户账户登录失败的时候,成人对计算机的恭维会有正面评价,但是儿童却没有这种反应。成人会觉得这后面是有一些人性的机制在起作用,而没有这些复杂想象的儿童则不会产生这个感觉。

人机互动研究的第二个路径是把计算机作为媒体进行研究。人们使用计算机的目的只是为了获得信息,或者只是把计算机当成与他人交流的工具。

后者就是计算机中介的传播所讨论的问题。把计算机作为信息获取工具,这种对媒介的看法本质上与对大众传播的看法非常接近。一般会讨论用户如何使用计算机,媒介的可信度如何以及认知上的效果如何。

今天,随着人工智能的发展,计算机的能动性越来越高,媒介与人的互动越来越接近于人际互动,这就更进一步强化了人机交流中的社会反应。

好,这一集就到这里,这也是与媒介理论相关的最后一集,我们花了挺多时间从媒介的角度来解释为什么我们会生活在媒介中,下一集,我们要换个方式,从传播的角度再来谈谈这个问题的另一面。谢谢大家的收听,下集见。

补充阅读

巴伦·李维斯、克利夫·纳斯:《媒体等同: 人们该如何像对待真人实景一样对待电脑、电视和新媒体》,卢大川等译,复旦大学出版社, 2001.