女子发视频称被顺风车司机高速上拖拽下车,平台通报全程细节,律师称双方行为涉嫌违法犯罪,如何看待此事?
这件事,可能是第二个货拉拉案,无论是手法,还是微博的意见反馈,和货拉拉事件都有不少相同之处:社交机器人制造数据+错误信息传播。当然,司机将女子拖拽下车是对的,要不然对方万一真跳车了司机的损失更惨重。
在回答开始之前,我们先看看这件事最新动态的微博,我们可以发现,截止目前,司机已经被行政拘留。
首先先明白一个概念,什么是微博外赞,什么是微博内赞?
如图所示,微博的大拇指为外赞,微博的爱心为内赞。很明显的是,从各项参数上看,很明显,伪造总赞数量最容易。因为外赞每条微博只能点一个,内赞可以点十几个,但正常人一般只会点3~5条评论的赞。无论是伪造有影响力的用户,还是伪造评论数量,难度均高于伪造总赞数。举个例子,伪造1000条评论需要1000个账号,但伪造1000个总赞可能只需要100,甚至更少的账号数量。
所以,在此基础上,能初步得出“内外赞理论”:
一般情况下,正常微博的内外赞比例是在5以内,一旦超过5,这条微博就有社交机器人刷赞刷流量(包含主动和被动两种形式)。一旦超过20,即属于大水漫灌的情况。此时也是假新闻最喜欢的情况。甚至可以粗略认定,内外赞比例超过20的情况,不是已经属于假新闻,就是正在制造假新闻。
这条微博的内外赞比例接近20,那么实际上关于司机的负面描述,真实性就不如“温柔的思辩姐姐是樱小路露娜”。
当然,除此之外,我们还可以看看货拉拉案的过程:
我们可以发现,事发时货拉拉声明微博的内外赞比例也超过了20。所以我们可以认为,这两件事有一定的关联性。
在这之中,我们重点注意做数据的方法:社交机器人和错误信息内外配合,评论区对男性进行辱骂,进一步促使群众对错误信息进行传播。
我们可以看看PNAS Nexus在2024年7月的这篇文章,里面说明了恶意行为者和虚假信息之间的关系。
实验引入了SimSoM,一个通用社交媒体平台的极简模型。该模型允许探索信息共享网络被控制虚假账户的恶意行为者操纵的场景,并衡量此类信息操作的后果。
与虚假代理不同,真实代理的目的是消费和分享高质量的信息,我们将虚假代理定义为由不良行为者控制的账户,用于在真实代理之间传播低质量内容。在本文中,我们将这些账户称为“不良行为者”或“虚假代理”。此类账户可能由人类、社交机器人或两者混合控制。该模型有三个参数来模拟不良行为者的操纵策略:渗透、欺骗和泛滥。
渗透描述了不良行为者如何通过让真实账户关注他们来扩大其信息的曝光率。不良行为者对社交网络的渗透由参数γ建模,即每个不良行为者被每个真实代理关注的概率。
唔姆,如图所示,以上是模拟真实账户(紫色节点)和不良行为者(黄色节点)的子网络。a图表示关注者链接结构图。实线链接表示每个子网络内的关注者关系。两个子网络都具有模仿或源自在线社交网络的枢纽和聚类结构。根据渗透参数γ,虚线链接表示关注不良行为者的真实账户,该参数表示真实节点关注任何给定不良行为者的概率。当γ=0时没有渗透,不良行为者被隔离,因此无害;相反的极端γ=1表示完全渗透,即所有真实账户都关注不良行为者。b图表示坏人渗透γ对合成网络中消息质量的影响。
来自真实账户的消息的质量q和吸引力a分别来自两个不同的分布,反映了这些消息往往质量高、吸引力低的经验证据。新消息的质量q和吸引力a均在单位间隔内定义。根据经验数据,真实账户的q和a被假设为独立的。 对于真实的账户,质量q来自指数分布
指数τ=10是通过经验估计的。
而吸引力的公式是 ,其中α>1.。
我们假设不良行为者严格生成低质量消息(q=0)。该内容的潜在欺骗性由欺骗参数ϕ (
),即坏人消息具有不可抗拒的吸引力的概率。概率为ϕ,我们设定a=1,并且有概率1-ϕ从与真实账户相同的分布中获取吸引力。如果 ,恶意行为者和真实账户会生成具有相同分布吸引力的消息。如果
,不良行为者的信息更有可能具有较高的吸引力;ϕ越大,不良行为者发布的低质量内容的潜在传播能力就越大。
社交网络的关键结构特征可能会加剧我们受到不良行为者操纵的脆弱性。经验网络具有两个在社交媒体中普遍存在的特征:枢纽的存在和高度集群的社区。
唔姆,如图所示,集群的存在不会显著影响整体质量,因为我们假设每个集群中的代理跟随不良行为者的可能性相同。另一方面,拥有枢纽会使网络更容易受到操纵:在存在枢纽的情况下,相对系统质量会显著降低,无论是在有集群的情况下而不是没有集群。这是因为节点入度和出度高度相关在经验网络中。因此,当真正的追随者集中在枢纽之间时,高质量的内容也会集中在这些枢纽之间。这意味着,与内容均匀分布在真实节点之间的情况相比,高质量内容的竞争更激烈,而且会更快过时。但不良行为者的内容并非如此,因为这些内容在真实用户之间均匀传播。
不良行为者可能会通过结合各种操纵策略来最大化其信息传播。
唔姆,如图所示,以上是相对于没有不良行为者的情景,不良行为者的单独和组合策略对系统消息质量的影响。a) 不同的渗透γ,没有洪水或欺骗。阴影表示面板 a–c 中运行的 95% 置信区间。b) 洪水θ随渗透变化并且没有欺骗。c) 欺骗手段φ随渗透而变化并且没有洪水。d)联合渗透和洪水攻击,没有欺骗。e)联合渗透和欺骗,没有洪水攻击。f)联合欺骗和洪水攻击,渗透。结论很明显,图4中d、e、f 显示了组合战术的效果。渗透战术占主导地位,但与洪水战术或欺骗战术相结合可以造成更大的伤害。如果将这三种策略结合起来,不良行为者可以将质量进一步降低至30%。
唔姆,如图所示,以上是分别由虚假和真实代理生成的低质量和高质量内容的重新共享级联大小的互补累积分布。a图代表渗透,b图代表洪水,c图代表欺骗。不良行为者策略对真实代理(“高质量”)和虚假代理(“低质量”)生成内容的转发级联规模的影响。我们观察到,吸引力会增加低质量级联的规模。这符合新颖性等因素会使虚假新闻更具传播的假设。
唔姆,如图所示,以上是转发和曝光级联大小之间的缩放。a) 低质量消息(由虚假代理发布)的缩放。b) 高质量消息(由真实代理发布)的缩放。一般而言,转发会低估曝光度大约一个数量级。排除最小的级联和最大的级联(以避免有限尺寸效应),我们观察到曝光网络随着转发网络呈亚线性增长分别是曝光和转发级联的大小,以及ν是缩放指数。这意味着随着消息的病毒式传播,曝光量的增长速度比转发速度慢。低质量消息的指数较高,这表明,每多转发一次,虚假代理发布的消息就会获得更多的浏览量。[1]
除此之外,在使用大量社交机器人参与社会热点后,会产生什么结果呢?一个很明显的结果是,会大量增加负面内容的曝光率,而当负面内容的曝光率太高,且清一色相同属性时,自然会影响当事人说话的可信度。
我们可以看看PNAS在2018年11月的这篇文章,
该文章以2017年加泰罗尼亚的公投为背景,收集了大约360w条推特作为数据集。
唔姆,如图所示,为了阐明人机交互的性质,所以从情绪角度出发,分析人类和机器人之间情绪趋势的差异。图中机器人与机器人之间互动情绪平稳趋近于0,而机器人对人之间的互动,特别是在时间段内,会呈现从一定的正面情绪,突然下降到负面情绪的过程,随后随着时间慢慢上升至趋近于0,而无论是人类与机器人之间的互动,或者是人与人之间的活动,也会有先大幅下降,再缓慢上升的至0的过程。
为了捕捉社交互动结构中的关键趋势,还可以通过关注社交互动网络,简单分析机器人与人之间互动的社交网络形式。
唔姆,如图所示,其中第一组有18%是机器人,第二组有12%是机器人。A图显示,通过计算PageRank,平均而言,人类的中心地位是机器人的 1.8 倍,这表明后者倾向于从社交系统的边缘行动。除此之外。尽管机器人处于边缘地位,但它们的互动目标很有策略,大多将其活动引向人类中心,在系统中发挥着重要作用。而 从情绪角度方面,第一组中人与人和机器人与人互动的平均情绪为负面,第二组中为正面。这种情绪上的巨大差异表明,这两个确定的群体以不同的方式认可他们交换的信息。事实上,在机器人突破社交网络的阈值后,第一组优先认可负面内容。[2]
那么回到这个问题,我们可以发现,该问题微博和货拉拉微博底下充斥着大量社交机器人和不良行为者,且熟练运用渗透、欺骗和泛滥等方式进行错误信息传播。所以,根据数据的伪造程度,可以简单判断信息的负面程度和是否加入了错误信息。