译介|社交媒体信息流算法如何影响政治态度和行为
2024-04-01 07:53:58
  • 0
  • 0
  • 0

来源:再建巴别塔

本文来源于公众号:数字交往

【摘要】

本研究对2020年美国选举期间Facebook和Instagram信息流算法影响展开了研究。研究将一部分愿意参与的用户分配到按时间顺序排列的信息流。与默认的算法排序相比,这一举措使用户在平台上的活动和花费时间都显著减少。按时间顺序排列的信息流也对用户接触内容的方式产生了影响:用户在两个平台上看到的政治和不可信内容的数量增加了,而在Facebook上看到的不文明或包含侮辱性词汇的内容减少了;与此同时,在Facebook上,看到的来自中立派朋友以及具有不同政治或意识形态立场的人群的来源的内容的数量增加了。然而,在为期三个月的研究期间,按时间顺序排列的信息流并没有显著改变用户在议题极化、情感极化、政治知识或其他关键态度方面的水平。

译者:

浙江大学传媒与国际文化学院 博士生 王敏

湖北大学新闻传播学院 副教授 谷羽

社交媒体公司采用的机器学习算法对选举和政治产生了哪些影响呢?公众普遍认为,这些算法可能导致政治上的“信息过滤泡沫”(1),助长极化(2, 3),加剧社会现有的不平等(4, 5),并助长虚假信息的传播(6)。由于社交媒体公司采用的算法通常对用户来说是不透明的,因此关于它们的运作方式以及对政治的影响的理解存在许多分歧(7, 8)。因此,了解这些系统对个体层面的政治态度和行为产生的影响,具有极其重要的科学和实践意义(9)。

特别是,用于优化向用户呈现内容顺序的信息流排名系统——即算法,受到了监管机构和公众的密切关注。但研究这些信息流算法的影响是具有挑战性的。即使可以直接访问专有代码和数据,也很难描述其影响(10),因为这类算法是根据诸多因素对个性化定制的,例如用户的过去行为和从类似用户的行为中得出的预测,从而导致对内容排名产生复杂且可能异质化的影响。此外,一个既定的反事实并不总是显而易见:科技公司经常进行“A/B测试”,或称为随机对照实验,以改进用户体验,但这些实验通常旨在评估诸如个体输入权重或特定面板中信息显示方式等离散元素(11)。评估一个基于机器学习的信息流排名系统的总体影响,需要一个清晰易懂的备选方案来进行比较。

基于此,我们在2020年美国总统选举期间,在Facebook和Instagram这两大拥有全球超过35亿月活跃用户的主要社交媒体平台上,进行了随机对照实验。我们将2020年秋季Facebook和Instagram使用的算法排名系统作为基准(以下简称“算法信息流”)。在一个随机分配的处理组中,用户的信息流按照时间顺序排列(以下简称“时间信息流”)。尽管按时间顺序排列项目在技术上也属于一种算法,但与那些受到广泛关注的社交媒体平台采用的预测性机器学习系统有所不同。简单的按时间顺序排列,即将最新的项目放在信息流的顶部,既易于实施(最初在Facebook和Instagram上使用),也与当前由政策制定者和公民社会成员在公共辩论中提出的备选方案相匹配。

研究问题

本研究始于一个研究问题(RQ):即按时间顺序排列的信息流如何影响用户所接触到的内容?随后提出了三个主要的研究假设。

首先,关于极化效应的假设(H1)。学者们长期以来一直对社交媒体的极化效应感兴趣(21)。社交媒体信息流算法可能以至少两种方式影响政治极化。首先,如果算法使用过去的用户行为来影响输出,那么用户过去参与过的观点可能会在将来得到优先考虑,可能会鼓励选择性接触与自己观点相似的政治观点(1, 19, 22–24)。反复接触与自己观点相似并且加强性的内容可能会在议题立场上加剧极端化(17)。因此,我们预期按时间顺序排列的信息流会减轻议题极化(H1a)。其次,算法可能会降低用户连接网络的某些部分的内容的优先级。更具体地说,先前的研究认为Facebook的特性可能会鼓励党派刻板印象(3, 25)并影响对外团体的负面态度(26)。因此,在美国的党派政治背景下,我们也预期按时间顺序排列的信息流会减轻个体层面的情感极化(H1b)(27)。

第二个主要假设涉及政治知识(H2)。信息流算法可能会对政治知识产生影响,因为在当今极化的社会中,新闻通常具有吸引力,使新闻更有可能被有意或无意地遇到(28–30)。虽然人们使用社交媒体的目的与政治无关(31),但有三分之一的Facebook用户在该平台上获取新闻(32)。我们预期将用户从算法驱动的信息流中移出会减少他们在平台上花费的时间和在平台上的参与,从而减少接触政治信息的机会。因此,我们预期按时间顺序排列的信息流处理会降低对2020年选举活动的了解程度(H2a),减少对新闻报道的最近事件的回忆(H2b)。

第三个主要假设涉及到政治参与(H3)。首先,简单来说,由于按时间顺序排列的信息流会导致总体在线参与度下降,因此在线政治参与可能会减少。其次,政治知识可能会使公民参与政治过程(33, 34),随着知识的下降,参与可能也会下降。第三,社交媒体算法可能降低动员的协调和信息成本 (11, 15, 35),因此去除这类算法可能会减少参与。另一个可能的机制是,相对于算法信息流,按时间顺序排列可能会增加对更多交叉视角的接触,学者们认为这可能会产生矛盾情绪并产生疲软效应(36)。我们假设按时间顺序排列的信息流会减少在线和离线形式的政治参与,包括自报在2020年选举中的投票率以及在平台上的政治参与。

研究设计

研究通过在2020年8月在Facebook和Instagram信息流顶部放置调查邀请来招募参与者。参与者是居住在美国,年龄至少18岁并提供知情同意的用户。招募对象是比平均每月活跃用户更活跃的Facebook和Instagram用户。参与者被邀请完成五次调查,分别在8月底、9月中旬、10月中旬、11月选举日后立即进行以及2020年12月中旬。他们分享在平台上的活动,并参与对平台外互联网活动的被动跟踪。在研究中,在研究中,参与者被要求分享他们在Facebook和Instagram平台上的活动,并且研究人员也被动地(passively)跟踪参与者在平台外互联网上的活动。参与者有权选择在他们的数据与任何个人身份信息关联之前退出研究,或者选择让之前提供的数据被移除。

参与者被随机分为两组:一组是状态quo算法(译者注:即平台默认使用的算法)信息流控制条件,他们的Facebook或Instagram信息流没有进行任何更改;另一组是按时间顺序排列的信息流处理条件,从2020年9月24日至12月23日生效,其中最新的内容(由原始帖子的发布日期和时间定义)出现在信息流的顶部。两组参与者参与后获得相同水平的补偿。来自连接账户(如好友、页面和群组)的帖子的选择和排放可能会受到影响,而广告的选择和排放则不受影响。根据独立估计,这意味着在平台上呈现给受访者的材料中,约80%是作为实验的一部分进行操控的(37)。大样本(Facebook:n = 23,391;Instagram:n = 21,373)包括完成了前两轮调查和至少完成了后三轮调查之一的参与者,使得我们具备了足够的统计能力来检测小效应(例如,对于情感极化,我们有能力检测到Cohen’s d = 0.032或更大的总体平均处理效应,分别适用于Facebook和Instagram)。在实验样本的参与者中,有19.5%没有完成任何后处理调查波次。然而,这种流失在处理组和对照组之间没有显著差异(Facebook,p = 0.83;Instagram,p = 0.35)。有关研究设计的这些以及其他方面的附加信息可在SM第S1节的材料和方法中找到。研究设计、测量和分析在处理分配之前已在开放科学框架(OSF)中进行了预注册。

正如在预先分析计划中所述,我们主要关注的估计量是加权的总体平均处理效应(PATE),该效应根据用户的预测意识形态、好友数量、关注的政治页面数量和活跃天数等变量进行了加权(SM第S9.5节)。为了透明度,我们还报告了在同意参与的参与者中的非加权样本平均处理效应(SATE)。非加权样本中,在30至44岁之间、白人、女性和自由派者的比例比加权样本高;他们的收入更高;并且拥有大学学位(详细比较请参见SM第S3.1节)。

我们的PATE估计的目的是假定在除了其他特征以外的处理效应异质性可以忽略不计,以便更容易对Facebook和Instagram群体进行推断。总的来说,与(38)的结果一致,我们发现了有限的效应异质性(SM第S2.3节)。如果我们的加权方案没有充分考虑到样本中更高的活动水平,那么我们的估计可能对应于可能是最相关的用户子集:那些在平台上参与度最高、产生了不成比例的内容的用户(SM第S2.1节)。

研究发现

首先,我们描述了按时间顺序排列的信息流对用户在平台上体验的影响(见图1)。参与度、用户满意度和新闻原创性是Facebook信息流算法用来确定个体用户内容排名的关键信号[详见(20, 39, 40, 41)](SM第S1.1节)。我们发现按时间顺序排列的信息流处理组的用户在Facebook和Instagram上的时间花费显著减少。研究参与者在这两个平台上的日均时间花费高于美国月度活跃用户的平均水平(图1,A1和A2)(与美国月度活跃用户样本的比较见SM第S3.1节)。然而,在算法信息流组中,平均受访者每天花费的时间比美国月度活跃用户多73%,而在按时间顺序排列的信息流组中,这个差距减少到了37%(p < 0.005)。在Instagram上,算法信息流组的平均参与者花费的时间比美国月度活跃用户多107%,而按时间顺序排列的信息流组的参与者花费的时间比美国月度活跃用户多84%(p < 0.005)。

我们还观察到了对其他社交媒体平台的替代情况:在移动端,按时间顺序排列的信息流组中,Instagram用户在整个研究期间在TikTok和YouTube上的平均使用时间分别增加了36%(2.19小时)和20%(5.63小时)(p < 0.05);对于Facebook用户,花在Instagram上的时间增加了17%(1.24小时)(p < 0.05)。在浏览器使用方面,虽然在Instagram用户中没有检测到变化,但在按时间顺序排列的信息流组中,Facebook用户对reddit.com和youtube.com的平均访问次数分别增加了52%(16.2次,p < 0.005)和21%(50.1次,p < 0.05)。

在Facebook上,算法信息流组的用户平均点赞率为6.7%,而按时间顺序排列的信息流组的用户仅为3.1%(见图1,B1)。Instagram上也呈现类似的低参与度模式(见图1,B2),在两个平台上的点赞和评论比较均显示p值小于0.005。按时间顺序排列的信息流导致Facebook上来自好友的内容相对份额平均减少了24个百分点,而Instagram上来自相互关注的内容相对份额平均减少了5个百分点(p值均小于0.005;见图1,C1和C2)。此外,在Facebook上,按时间顺序排列的信息流使得用户看到的来自好友、页面和群组的网络份额减少(见图1,D1);而在Instagram上,用户相互关注的内容每天的份额也减少了(所有比较的p值均小于0.005)(见图1,D2)。有关时间花费、参与度、接触度、网络和替代的所有描述性统计数据均在SM第S2.1节中报告。

接下来,我们聚焦研究问题,研究了按时间顺序排列的信息流对用户信息流内容的影响。这些效应在预先指定的亚组中大多数没有变化,除了一个例外,详情可见SM第S2.3节。如图2所示,按时间顺序排列的信息流中包含的与政治相关的内容平均比算法信息流更多,这一差异在Facebook上的政治新闻内容中也得到了体现。按时间顺序排列的信息流减少了在Facebook上来自意识形态“交叉”来源的内容份额(18.7%对比20.7%,p < 0.005),并减少了来自在意识形态上“志同道合”的来源的内容份额(48.1%对比53.7%,p < 0.005);关于政治意识形态分类的详细信息,在Instagram上无法获取,可在SM第S7节中找到。探索性分析表明,在Facebook上,按时间顺序排列的信息流中志同道合和交叉内容的减少被来自具有不同政治或意识形态立场的中立好友和来源的内容的增加所抵消(按时间顺序排列的信息流为30.9%,算法信息流为22.6%,p < 0.005)。在按时间顺序排列的信息流中,中间类别的增加和志同道合来源的减少幅度均大于交叉帖子的减少,这可能与算法信息流促进了“回声室”或“过滤泡”效应(1)是一致的。

相对变化最显著的是来自不可信来源的内容份额以及被分类为不文明或含有脏话的内容(分类方法的更多细节请参见SM第S7节)。在Facebook上,按时间顺序排列的信息流相较于算法信息流使得来自指定的不可信来源的内容份额增加了超过三分之二(4.4%对比2.6%,p < 0.005),同时减少了近一半的不文明内容(1.8%对比3.2%,p < 0.005)。对效应异质性的分析显示,调整后的不文明减少在具有较大社交网络的用户中更为显著,这可视为网络规模的一个代理。在Instagram上,我们没有发现用户信息流中不文明内容的比例有实质性变化(1.6%对比1.6%),但我们确实发现了来自不可信来源的内容增加,尽管相较于在Facebook上略小(1.6%对比1.3%,p < 0.005)。最后,我们分析了一个内容类别,即含有侮辱性词汇的内容。根据我们的分类方法,在两个平台上这一类内容一开始就非常罕见(Facebook上为0.03%,Instagram上为0.02%),在Facebook上按时间顺序排列的信息流中甚至进一步减少了(减少了约一半,为0.019%,p < 0.005)。

然后,我们对主要假设进行了检验(见图3,顶部)。在Facebook和Instagram上,按时间顺序排列的信息流条件下的受访者在情感或议题的两极化程度方面并没有显著低于算法信息流条件下的受访者(在所有情况下,经过多重比较调整,p值均约为1),这表明我们未能支持H1。此外,在两个平台上,就选举知识或新闻知识而言,处理条件之间也没有统计学上显著或实质性的差异(所有估计值的p值均大于0.63),这表明我们未能支持H2。总体而言,在所有情况下,我们都未能观察到先前研究中所发现的效应大小更小的情况(14)。

我们的第三个假设涉及自报告的政治参与,包括在线(如签署在线请愿书)、离线(如参加抗议活动或集会)或两者兼而有之的形式(如向政治候选人捐款)。对于Facebook平台,估计结果显示,按时间顺序排列的信息流对这个自报告政治参与指标几乎没有影响(p = 1.0)。在Facebook的算法和按时间顺序排列的信息流组中,我们未发现报告参加2020年选举的用户比例有统计学上显著的差异(p = 1.0)。在Instagram上,对于自报告的政治参与(p = 1.0)或自报告的投票率(p = 0.64),也未检测到明显的影响。然而,通过使用在平台上度量的政治参与方式,例如发布或点赞被分类为政治性的内容、分享投票信息,以及在社交媒体上提及正在竞选的政治家和候选人,我们发现了强有力的证据表明,按时间顺序排列的信息流对两个平台都产生了负面影响(Facebook,-0.117标准差,p < 0.005;Instagram,-0.090标准差,p < 0.005)。

我们简要回顾了信息流算法可能如何影响在线政治参与的潜在机制。我们对知识和交叉观点的提出机制无法通过我们的设计直接评估,因为这些潜在的中介变量发生在治疗后(42)。对于我们提出的动员协调和信息成本机制,具体测试将留给未来的研究。我们提出的另一机制是,由于总体在线参与的下降,平台上的政治参与也将减少。在SM第S3.2节(表S82至S85)中,我们提供了证据表明,在两个平台上政治内容的减少与参与所有内容的减少幅度相似。这与我们对异质效应的分析一致,显示了在Facebook和Instagram最活跃的用户中政治参与的减少最为显著(SM第S2.3节和图S34和S49)。

最后,在图3底部呈现的测试中,我们发现几乎在所有结果中,两种信息流条件之间没有显著差异。在几乎所有的结果中,我们观察到两种信息流条件之间对各种事实主张的感知准确性、对媒体的信任(无论是传统媒体还是社交媒体)、对政治机构的信心、对政治极化的认知、认知政治效能、对2020年选举合法性的信仰或对政治暴力的影响都没有统计学上的差异。唯一的例外是,在Facebook平台上,按时间顺序排列的信息流条件下的用户更频繁地点击来自可能具有党派倾向的来源的政治新闻内容(0.107标准差,p < 0.01)。在一个未经预先注册的分析中,我们发现这是因为用户在平台上暴露于相同一组党派来源的新闻增加了(SM第S3.3节)。尽管这似乎与我们的研究结果相矛盾,即治疗增加了对意识形态中立或混合来源的暴露,但显而易见的矛盾在于,后者的暴露度测量基于所有类型的内容,而我们预先注册的新闻点击测量仅关注包含政治新闻链接的帖子。鉴于过去的研究发现,受众在政治上同质化的新闻来源可靠性较低(43),差异的一个可能解释是,算法信息流中降低低质量来源排名的持续努力可能已经减少了对在按时间顺序排列的信息流中将获得更多可见性的频繁发布的党派新闻链接的暴露。

讨论:研究的不足之处

我们的研究证明了在2020年底,Facebook和Instagram的信息流排序算法强烈地影响了用户在社交媒体上的体验。按时间顺序排列的信息流显著减少了用户在平台上的时间,减少了用户在平台上参与内容的程度,并改变了他们所接收到的内容的组合——例如,在Facebook上减少了来自朋友的内容,同时增加了来自页面和群组的内容。用户看到了来自意识形态中立的朋友和受众混合的来源的更多内容;更多的政治内容;来自不可信来源的内容;以及少量被分类为不文明或包含污言秽语的内容,相比之下,他们在算法信息流中看到的情况则恰恰相反。用户在在线形式的政治参与方面的参与度也较低。然而,除了这些特定于平台的体验之外,用按时间顺序排列的内容取代现有的机器学习算法并没有在政治态度、知识或离线行为方面引起可检测的变化,包括关于两极化和政治参与的基于调查的度量指标。这些发现对先前的研究以及关于社交媒体算法对政治和选举影响的民间理论提供了新的见解(3)。

针对我们的处理在引发用户在线行为上带来了显著变化,但在用户样本的政治态度、知识和离线行为方面几乎没有可辨认的变化之间的脱节,有几种可能的解释。可能需要一个更持续的干预周期才能产生这样的下游效应(44),尽管我们的研究周期约为3个月,比大多数政治传播实验研究的持续时间要长得多。如果这项研究没有在一个两极分化的选举活动期间进行,政治对话的发生频率相对较高,或者如果采用了与现行信息流排序算法不同的其他内容排序系统作为替代,我们的结果可能会有所不同。同时,这项研究在一个特定的政治背景下进行(美国),其结果可能不适用于其他政治体制。尽管如此,许多当代美国的特征——如日益加剧的两极化、民粹主义的崛起以及在线虚假信息的存在——也存在于许多其他民主国家。在制度化保护较少的情况下(例如,媒体不够独立或监管环境较弱),算法的影响可能会更为显著。最后,对按时间顺序排列的信息流的改变影响了用户在Facebook、Instagram等平台上以及其他方面的体验——例如,减少在平台上花费的时间,看到来自群组和页面而不是朋友的内容,看到更多不同类型的内容以及看到较少不同类型的内容,以及在其他社交媒体平台上花费的时间增加。这些因素可能相互影响,并对政治态度、知识和行为产生不同的影响,以至于总体上我们没有观察到可辨认的变化。

另一个限制涉及我们研究设计的性质:我们的研究设计提供了关于个体直接影响的估计,因此不能说明社交媒体是否塑造了社会激励机制或影响了其他用户的行为。例如,如果排名算法影响了对某些类型内容的需求,它们可能会影响内容生产者(如新闻组织)、公民组织和政治活动的决策,这将反馈到算法系统本身的输入中。更简单地说,我们研究的按时间顺序排列的信息流的经历在一定程度上由我们样本之外的其他用户分享的帖子组成,而这些用户的行为受到了标准算法排名的影响。因此,我们的设计不能说明“一般均衡”效应。如果我们的随机干预(按时间顺序排列的信息流)扩展到所有用户的总体中,其影响可能会有所不同,因为网络内的算法反馈可能会产生复杂的系统动态。未来的研究可以探讨在本研究中发现的一些最强效应(例如在平台上花费的时间减少)是否在按时间顺序排列的信息流与政治态度和行为之间的关系中起到中介作用。

尽管存在这些限制,我们收集的实验数据规模很大。我们的研究结果表明社交媒体信息流排名算法对个体情感、议题极化、政治活动知识和离线政治参与的影响并不显著,即使是微小的影响也没有被观察到,即我们没有发现社交媒体信息流排名算法对这些方面产生直接而明显的效应。虽然我们关注的研究结果(因变量)在评估民主健康方面非常重要,但并不涵盖所有可能的方面。未来的研究应该探讨我们研究的排名算法是否对其他结果产生重大影响,比如议程设置或用户自己的策展习惯。

在这些研究发现指出社交媒体算法可能不是导致政治极化等现象的根本原因时(44),我们应该提高对其他在线因素(例如社交媒体广告模型所产生的激励)或离线因素(例如长期人口结构变化、党派媒体、不断增加的不平等或地理排序)的关注,这些因素可能更加重要,推动着对民主进程和结果的影响。

参考文献、图表及补充材料略,详见原文链接:science.org/doi/10.1126/science.ade7138

 
最新文章
相关阅读