Skip to content

86. 算法的统治,一个福柯式的全景监狱?流量、算法推荐与算法游戏

大家好,我是刘海龙!欢迎收听《生活在媒介中:传播学100讲》。

像报纸、电视这样的传统大众媒体,有一个明显的特点,就是所有受众看到的都是同样的内容。在web 1.0 时代,也就是像新浪、人民网这样的门户网站上,受众基本上看到的也是同样的内容。所以过去我们所说的使用媒体,默认为媒体内容是一个固定不变的因素。

但是今天我们说起使用今日头条、抖音、快手、小红书、微博、B站、微信的订阅号,每个人接触到的内容就大不相同。比如要是我们经常看某个账号的内容,甚至点赞、评论、互动,那么下次打开应用,这个账户的内容就会在前面,而不是按发表时间顺序排在后面。同时和这个账户内容相似的内容可能也会被自动推荐给我们。这个背后起作用的就是“推荐算法”。

但是今天我们说起使用今日头条、抖音、快手、小红书、微博、B站、微信的订阅号,每个人接触到的内容就大不相同。

比如要是我们经常看某个账号的内容,甚至点赞、评论、互动,那么下次打开应用,这个账户的内容就会在前面,而不是按发表时间顺序排在后面。同时和这个账户内容相似的内容可能也会被自动推荐给我们。这个背后起作用的就是“推荐算法”。

那推荐算法是如何起作用的,它的实质是什么,又会对我们最近一直讨论的媒体内容生产造成什么影响?我们今天就来谈谈这个问题。

算法:主观性地显示与排序人的理解与价值

首先,什么是算法?早在计算机发明之前,就有这个概念,顾名思义,就是用加减乘除等书面计算方法进行的计算。在计算机产生后,算法就专指一套用系统的方式解决问题的策略机制。简单来说,就是用一套计算机能够执行的命令自动运行的一套程序。

首先,什么是算法?早在计算机发明之前,就有这个概念,顾名思义,就是用加减乘除等书面计算方法进行的计算。在计算机产生后,算法就专指一套用系统的方式解决问题的策略机制。简单来说,就是

用一套计算机能够执行的命令自动运行的一套程序。

比如我们使用搜索引擎,输入一个关键词后,就会有一套计算方法将与我们搜索的关键词有一定关系的网页按照相关性排列出来。这个后面就有不同的排列计算策略,是把访问量最大的网页排前面,还是把引用量最大的网页排前面,还是把关键词重复次数最多的网页排在前面。

所以算法本身具有一定的主观性,它显示出人们对解决问题的不同理解和价值优先排序。比如大家看的短视频网站,是优先推荐那些最热门的视频给用户,还是优先推荐那些新视频给用户,是优先推荐完全相似的视频,还是优先推荐相似但有一定差异的视频,这个就取决于平台的价值观与判断。

像是抖音和快手在算法推荐机制上就存在一定不同。比如他们都会把新发的视频放到一个池子里,给同样的机会测试。如果一个视频点击量非常大,抖音就会一直推荐它,让它一直留在这个池子里,让这个视频更加火爆。这样就会形成一个马太效应,热门视频会更加热门。

但是快手就会更普惠一些,一定时间之后,这个池子中的视频就会都更换。这样一个视频虽然很热,可能就不会再持续推荐,而是会适当照顾一些不那么热门的视频。也就是说,在抖音上你更容易刷到大家都在看的视频,而在快手上,则容易刷到一些和别人看到的不一样的视频。

根据之前的一些计算,快手的头部内容流量占比约为30%,而抖音的头部内容流量占比为88%。这个数据并不准确,只是一个大概的估计,但是基本也能看出二者在流量分配政策上的差异。

算法的实质:社会层面的可见性

那么算法的实质是什么呢?我们说的这个实质不是技术层面的,而是社会层面的。因为我们不是在学习算法技术,而是理解它的文化意义。从社会层面看,算法的实质就是可见性。

我们在这个节目最开头谈到媒介是什么的时候,提到媒介的一个特性就是将不可见的变成可见。算法作为一个媒介,也具有这个特征。它让某些内容变得可见,反过来,也会让某些内容不可见。

比如在新浪微博上,你关注的账号的内容更新不是按时间顺序排列的。也就是说,并不是最近更新的内容就排在最前面,而是你经常观看的账号,或者与之有互动(点赞、转发、评论、私信)或者比微博社会网络上看关系比较近的账号,每次你打开,就会出现在你的页面的上方最容易被看到的地方。哪怕是他们前几天发的信息,也会放在最上面,让人有一种最近更新的错觉。

反过来,那些你不太阅读和互动的账号,久而久之就会排在越来越后面,渐渐的就从你的视野里消失了。算法让一些用户或内容变得具有可见性,另一些用户或内容变得不具有可见性。

反过来,那些你不太阅读和互动的账号,久而久之就会排在越来越后面,渐渐的就从你的视野里消失了。

算法让一些用户或内容变得具有可见性,另一些用户或内容变得不具有可见性。

这样看来,算法是不是和我们上一讲谈到的媒体工作一样,也具有了建构世界和我们人际关系的作用呢?而且算法作为媒介或者传播的基础设施,它本身也具有透明的特征。普通用户在使用中,很难察觉到算法背后的价值观和框架正在影响着他们对世界的看法,以及和他人之间的关系。

这样看来,

算法是不是和我们上一讲谈到的媒体工作一样,也具有了建构世界和我们人际关系的作用呢?而且算法作为媒介或者传播的基础设施,它本身也具有透明的特征。普通用户在使用中,很难察觉到算法背后的价值观和框架正在影响着他们对世界的看法,以及和他人之间的关系。

那么算法是如何起作用的呢?它会先在暗中搜集用户使用行为的数据,然后将这些数据放进它的计算公式里。这个计算公式非常复杂,我们常见到的公布出来的,只是一个非常简单的公式,但实际上使用的可能更复杂,是商业秘密,同时也是个黑箱。

这个黑箱不仅对用户来说是神秘的,其实就是对平台来说,也很难真正理解。因为它涉及的参数和数据太多,工程师只能设置初始条件,却很难控制实际的精确结果。所以经常是牵一发而动全身,调整一个地方,可能会造成其他地方出现意想不到的结果。

有的学者把算法统治看成是一个福柯式的全景监狱。全景监狱这个概念我们前面提到过,这是边沁设想的一种理想的监狱建筑。囚犯的牢房围成一个圈,正中是监视塔。塔中的人可以清晰地看到每个房间里的囚犯在干什么,但是囚犯却无法看到塔中的情况,同时囚犯之间也无法交流。这样囚犯就会觉得随时都可能被监控,而遵守规矩。因此就能够用最少的人力,去监控尽可能多的囚犯。

圆形监狱,插图作者:Jenni Fagan,图源:dunesworkshop.org

社交媒体的算法也建构了一个类似的全景监狱,用户知道有算法存在,但是也不知道具体它是如何运作的。如果他们遵守平台的规则,他的信息就会被推荐,具有可见性,反过来,如果他们不遵守平台的规则,就会受到惩罚,不具有可见性。

社交媒体的算法也建构了一个类似的全景监狱,

用户知道有算法存在,但是也不知道具体它是如何运作的。如果他们遵守平台的规则,他的信息就会被推荐,具有可见性,反过来,如果他们不遵守平台的规则,就会受到惩罚,不具有可见性。

公域流量与私域流量

这里所说的可见性,主要体现在流量上。一般来说,流量被分成公域流量和私域流量两种。

所谓公域流量,就是平台首页推荐或者精选内容页面上获得的流量。像大家在B站首页上看到的那些推荐就是公域流量,这个流量分配的机会是非常稀缺的,一般是平台觉得非常有价值的内容才会这样主推。在短视频网站,你一打开就会在显著位置推荐的视频或者播放直播,常常都是公域流量。由于具有一定的强制性,所以这个流量是非常可观的。

私域流量就是每个账号订阅或者粉丝关注产生的流量,也就是平台不推荐,也会有一些忠实用户会主动观看所产生的流量。这个流量平台一般控制权比较小,是账户的基本盘。当然,如果违反了平台的规则,它也可以通过限流甚至封号的方式来干预。哪怕有的时候内容审核拖一拖,可能内容发布的最佳时机也就过去了。

在公域与私域流量的分配上,抖音和快手也存在不同。比如一个账号新发了一个视频,抖音会更多地把它推荐给那些对这个内容感兴趣的用户那里,而不是订阅了这个账号的粉丝那里。而快手就相反,会更多地推荐给粉丝。

抖音分配给感兴趣的标签用户和粉丝的流量比是9:1,而快手则是3:2。这样做的结果就是在抖音上,不管你之前有多少粉丝,如果你发的单个视频的质量不行,可能流量也不会多。但是在快手上,只要你粉丝多,那么每个视频至少有一个比较高的保底流量。

这样看来,抖音又显得更公平一些,给好的视频以机会,但对大V来讲,就没法躺在之前的成就上安稳地生存了,如果不能推陈出新,大V也很快被淘汰。

平台分配流量,如何构成一种规训?

除了算法本身充满着主观性和规训色彩外,其实平台手中还握有大量机动的流量进行分配。如果平台要搞一些活动,创作者积极参加,就会被分配一定的流量。比如我也在B站做UP主,B站如果要搞一个活动,说是读书日推荐些书,或者拍一下学者的书房,那就会有一个专门的活动页面,并且在首页上推荐。

前一个活动我参加了,后一个没有,就会有不同的待遇。短视频网站每天在直播的时候,也握有一定数量的流量。平台会分配一些打开APP时默认进入的用户给一些主推的主播,这样一上来直播就很有人气,这些人气又会带来更多的看热闹从众的人。这个时候有背景、听话的主播就受到奖励,这也构成一种平台的规训。

前一个活动我参加了,后一个没有,就会有不同的待遇。短视频网站每天在直播的时候,也握有一定数量的流量。

平台会分配一些打开APP时默认进入的用户给一些主推的主播,这样一上来直播就很有人气,这些人气又会带来更多的看热闹从众的人。这个时候有背景、听话的主播就受到奖励,这也构成一种平台的规训。

甚至现在的平台还会把流量商品化,抖音有DOU+平台,用户花钱就可以给自己的内容配上流量。新浪微博也可以购买阅读量,让你更有可见度。在平台之外,还产生了一个流量商品化的地下市场,这就是大家可能听说过的网络水军。你可以用付费的方式获得更多的观众、粉丝、转发和评论,甚至还可以用刷单的方式,制造虚假的销售量或者商品的好评。

这种数据工作最后的目标仍然是满足平台算法的要求,提高账号的可见度。当然,如果你直播的时候买了很多流量,但是东西没卖出去,投入的流量费是否能够赚回来?这就具有一定风险了。

靠花钱买流量只是一个短期行为,很多创作者和用户要真正获得收益,还是要靠真正的可见性和热度才是长远之计。这就促使很多的用户天天琢磨哪些内容,或者什么样的操作能够获得算法的青睐,能够得到平台更多的推荐。

我们有可能“逆向破解”算法吗?

我们前面说过,算法是一个黑箱,这就出现了很多“逆向破解”操作。但是这种“逆向破解”充满着玄学。因为算法是由复杂的参数和数据构成,人脑并没有办法真正理解,只能根据输入和输出结果,去进行推测,建立因果关系。

这就像我们前面提到过的柏拉图洞穴寓言里讲的,那些被绑的奴隶,每天在墙上看见不同物体经过后产生的投影,于是就开始猜测其中的规律,但是这些不同的物体的出现其实并没有规律,可能歪打正着中了的,就以为发现了真理。柏拉图在这里是嘲讽他认为的民科民哲,但是通过这种方式,奴隶们获得了对世界的解释与意义。

柏拉图洞穴寓言,图源:consciousness-popsci.blogspot.com

用户对算法的揣测与解释也是这样一个过程,有的学者将其称之为“算法想象”或“算法解码”,就是人们怎样用人类的意义去理解算法的逻辑,在这个过程中,用户之间还存在交流和协作,这个过程又被有些人称之为“算法八卦”。听这些概念,就会发现,学者们认为这些行为并不靠谱。这些算法想象也许有道理,或者偶然能中,但是并不能保证它一定科学。

因为这些民间的所谓“算法专家”,并没有一个科学的方法,仅仅是用神话式的解释,比如把算法看成是人格式的存在,它会累,它会注意不到,或者是某个内容符合国家精神等,还有的创作者会总结出一些提高被平台推荐和提高流量的方法,比如一段时间内连续发相同的垂直内容,或者增加直播的时长。

很多都是用人的思维方式来推测算法。但是这并不妨碍人们去探索和赋予算法以一定的意义。甚至还有一些算法专家开班来讲解自己总结出来的经验。

除了去想象和顺应算法外,用户还会去抵制、颠覆甚至改写算法的意图,这也称之为“玩弄算法”。比如一些用户会有意去看一些自己不喜欢的内容,来干扰算法的推荐机制,打破我们前面说的信息茧房。还有一些用户会用外挂去破解平台的算法规则,像是早期的外卖骑手和打车平台的用户就会用一些抢单软件或破解版的软件来破坏算法的规则。电子商务去刷单、刷好评等。

总之,技术和算法本身和我们前面讨论过的职业意识形态、惯例、宏观制度等因素一样,现在也参与到了内容的生产过程,用户的行为与内容创作也受到算法的规训,平台资本主义以一种看似中性的技术,更严密地控制着用户的行为,而用户也在积极地适应与反抗这个体制。从某种意义上,算法作为一个行动者,也参与到内容的生产之中,加剧了内容的商品化。

因此将算法从背景中重新突显出来,让它具有可见性是非常重要的一步,接下来整个社会要对其背后的价值观、政治进行深入地讨论与协商,将这种隐性的权力与控制放到笼子里进行监管,这样才能真正保证创作者与用户的权利。

不知道你有没有意识到算法造成的问题,又是如何解决的?欢迎在评论区参与讨论。

好,感谢你的收听,下次我们会讨论假事件与景观社会的相关话题。