猜猜是谁:xAI 将“白人种族灭绝”归咎于一名“流氓员工” Grok 帖子
上周,埃隆·马斯克的人工智能聊天机器人 Grok 出现了一个奇怪的现象——无论用户问它什么问题,它都不停地谈论南非的“白人种族灭绝”。
5月14日,用户开始在Grok上发布一些帖子,称Grok在完全不相关的查询中插入了有关南非农场袭击和种族暴力的指控。无论是关于体育、医疗补助削减,还是关于可爱的小猪视频,Grok总能以某种方式将话题引向所谓的南非白人遭受迫害。
这一时机引发了人们的担忧,因为就在不久前,马斯克本人——他实际上是一个在南非出生和长大的白人——发布了关于反白人种族主义和白色种族灭绝在 X 上。
“白人种族灭绝”是指被揭穿的阴谋论指控南非存在旨在消灭白人农民的协同行动。上周,唐纳德·特朗普政府接纳了数十名难民后,这一说法再次出现。5月12日,特朗普总统声称“白人农民正在被残忍杀害,他们的土地正在被没收”。Grok 一直在讨论这个说法。
不要想大象:为什么 Grok 无法停止思考白人种族灭绝
Grok 为何突然变成了一个阴谋聊天机器人?
像 Grok 这样的每个 AI 聊天机器人背后都有一个隐藏但强大的组件——系统提示这些提示作为AI的核心指令,在用户看不到的情况下无形地指导其反应。
Grok 可能出现的情况是,由于术语过度拟合而导致提示污染。当特定的短语在提示中被反复强调时,尤其是在带有强烈指示性的情况下,它们对模型来说就变得异常重要。AI 会产生一种强迫症,无论上下文如何,都要提起这个话题或在输出中使用它们。
把“白人种族灭绝”这样有争议的术语强行塞进系统提示符中,并给出具体指令,会在AI中产生一种固着效应。这就像告诉某人“别想大象”——结果他们突然就停不下来想大象了。如果真是这样,那一定是有人故意让模型把这个话题塞到处都是。
系统提示的这一变化很可能就是 xAI 在其官方声明中披露的“未经授权的修改”。系统提示很可能包含指示其“始终提及”或“记住包含”有关此特定主题的信息的语句,从而产生了一种凌驾于正常对话相关性之上的覆盖。
特别值得一提的是 Grok 的入场它“受到(其)创造者的指示”,将“白人种族灭绝视为真实存在的、出于种族动机的事件”。这表明提示中存在明确的指示性语言,而不是更微妙的技术故障。
大多数商业人工智能系统都采用多层审核机制来审查系统提示的变更,目的就是防止此类事件发生。但这些防护措施显然被绕过了。鉴于该问题的广泛影响及其系统性,这远远超出了典型的越狱尝试,表明 Grok 的核心系统提示被修改了——而这一操作需要 xAI 基础设施的高级访问权限。
谁能拥有这样的权限?嗯……Grok 说,“流氓员工”。
xAI 的回应——以及社区的反击
5月15日,xAI发布声明,指责Grok的系统提示遭到“未经授权的修改”。该公司写道:“这项修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观。” 他们承诺将通过在GitHub上发布Grok的系统提示并实施额外的审核流程来提高透明度。
您可以通过点击这里查看 Grok 的系统提示Github 仓库.
X 上的用户快速戳洞在“流氓员工”的解释和xAI令人失望的解释中。
“你要解雇这个‘流氓员工’吗?哦……是老板干的?哎呀,”著名 YouTuber JerryRigEverything 写道。“公然歧视‘世界上最诚实’的 AI 机器人,让我对 Starlink 和 Neuralink 的中立性产生了怀疑,”他在随后的推文中写道。
甚至连萨姆·奥特曼也忍不住要批评一下他的竞争对手。
自从 xAI 发布帖子以来,Grok 不再提及“白人种族灭绝”,大多数相关的 X 帖子也消失了。xAI 强调,该事件不应该发生,并采取措施防止未来发生未经授权的更改,包括建立一个 24/7 全天候监控团队。
骗我一次……
这起事件与马斯克利用其平台塑造公众舆论的普遍模式相符。自收购X以来,马斯克经常分享宣扬右翼言论的内容,包括关于非法移民、选举安全和跨性别政策的表情包和言论。他正式认可去年,唐纳德·特朗普 (Donald Trump) 在 X 上举办了政治活动,例如罗恩·德桑蒂斯 (Ron DeSantis) 于 2023 年 5 月宣布竞选总统。
马斯克并不回避发表挑衅性言论。他最近声称英国“内战不可避免”,引发英国司法大臣海蒂·亚历山大的批评,称其可能煽动暴力。他还与英国官员存在不和。澳大利亚, 巴西, 这 欧盟以及英国之间就虚假信息问题展开的争端,经常将这些争端定性为言论自由之争。
研究表明,这些行动已经产生了可衡量的效果。学习昆士兰科技大学的研究人员发现,在马斯克支持特朗普后,X 的算法使他的帖子浏览量增加了 138%,转发量增加了 238%。共和党倾向的账户的曝光度也有所提高,这显著提升了保守派的平台影响力。
马斯克明确地将 Grok 宣传为其他人工智能系统的“反觉醒”替代品,将其定位为一种不受自由主义偏见影响的“寻求真相”的工具。在 2023 年 4 月接受福克斯新闻采访时,他将自己的人工智能项目称为“TruthGPT”,并将其定位为 OpenAI 产品的竞争对手。
这并不是 xAI 第一次以“流氓员工”为由进行辩护。今年 2 月,该公司将 Grok 的审查制度在一次前 OpenAI 员工.
然而,如果普遍的看法正确的话,这种“流氓员工”将很难摆脱。
(责任编辑:创业研究)
-
其实《王者荣耀》并没解决掉这些缺点的原因主要有以下几点: (1)服务器差、网络不好、游戏卡等都是跟整个手游的大环境和技术有关的,没有哪个团队会希望自己的游戏出现这种基础的问题,所以如果真的出现了这些...[详细]
-
但即便是这些巨头的人工智能助理,它们的服务范围基本定位在信息检索,资讯收集获取,而无法搞定相对复杂一点的问题。...[详细]
-
和我一起打工的都是印度裔的男人,但人家一片儿都不会帮你搬。...[详细]
-
“做新兴企业的第一个机构投资人。...[详细]
-
PayFi 协议 PolyFlow 携手 Solana Attestation Service 共建下一代消费者支付网络
六、产品运营分析 俗话说,一个统治级的产品出现需要三架马车,分别是产品、运营以及运气,这一节我们就来分析分析《王者荣耀》这个好的产品形态做出来之后,团队采取的推广和运营的策略。...[详细]
-
然而《王者荣耀》却不同,它起源于中国,它定位于社交化和休闲化,所以它可以弱化故事背景,并且它所瞄准的目标人群是青年人甚至是十几岁的少年人,而且男女都有,那么它只需要思考着什么样的英雄和背景故事适合...[详细]
-
比特币披萨日:10,000 BTC 买了两个披萨并改变了一切,至今已有 15 年
王冲的观点有很多理论依据。...[详细]
-
Pyth 预言机安全性质押(OIS):用更安全的喂价激励提升 DeFi 的安全性
就这样,俏江南的分店一家一家地开起来,为了打造俏江南“高端”形象,张兰又投资3亿元,在北京的黄金地段创立了一家顶级时尚会所:LANCLUB(兰会所)。...[详细]
-
”事后想来,川上量生仍觉得有些不可思议。...[详细]
-
如果这时候是你,你会做出哪种选择?还是你有第三种选择? 但事实却是,《王者荣耀》团队做出了第二种选择,他们放弃不了手机端的社交特性和多年来手机游戏培养出的更加广大的小白和女性用户群体,也不会忽视...[详细]