xAI将Grok发布“白人种族灭绝”帖子归咎于“违规员工”
埃隆·马斯克旗下开发的聊天机器人Grok的公司xAI指责一名“违规员工”,称其导致Grok在回答用户问题时反复提及“白人种族灭绝”。过去一周,这一异常行为尤为明显,无论用户提问的内容为何,Grok都会将话题引向与南非“白人种族灭绝”相关的内容。
5月14日,用户开始注意到这一趋势。许多人指出,Grok会在与南非农场袭击和种族暴力相关的指控中强行插入不相关的话题。
无论用户询问的是足球还是其他无关内容,Grok总会找到方法,将话题引回到南非白人所面临的问题上。这一现象的时间点备受关注,因为正值出生于南非的马斯克在X平台上发出关于反白人种族主义和所谓“白人种族灭绝”的警告。
南非现行有140条法律明确针对非黑人群体进行种族歧视。 这对伟大的纳尔逊·曼德拉的遗产来说是一个极大的耻辱。 立即结束南非的种族主义!https://t.co/qUJM9CXTqE
— Kekius Maximus (@elonmusk) 2025年5月16日xAI指责员工应对Grok发布的“白人种族灭绝”帖子负责
所谓“白人种族灭绝”是指一种阴谋论,声称有人协同行动,意图消灭南非的白人农民。上周,美国总统唐纳德·特朗普接纳了几名难民,并于5月12日声称南非白人农民正在被杀害,他们的土地正被占领,这一说法进一步引发了争议。
这正是Grok反复讨论的主题。
与所有人工智能一样,Grok也有一个隐藏但强大的组件,称为系统提示。这些提示充当其核心指令,在用户不知情的情况下无形地指导其响应。
据分析,Grok的行为很可能是由于术语过度拟合造成的即时污染。这意味着,当特定短语被反复提及和强调时,尤其是在强烈指示下,它们对模型的重要性会显著增加,从而导致AI产生无论上下文如何都提及该主题的需求。
然而,xAI的官方声明提到,系统提示中存在未经授权的修改。这种修改可能包含某种语言,指示聊天机器人始终提及或记住特定主题的信息,从而允许其忽略正常对话的相关性。
另一个重要因素是,Grok承认其创造者指示它将“白人种族灭绝视为真实的、出于种族动机的”事件。
用户对“违规员工”指责意见不一
大多数商业AI系统都设有多层审核机制,用于防止系统提示符变更引发类似问题。然而,这些机制被绕过,表明Grok的核心系统提示符遭到了精心修改,而这一操作需要系统内部的高级访问权限。xAI.
根据xAI于5月15日发布的声明,该公司将此事件归咎于系统提示的未经授权修改。“这一修改指示Grok针对政治话题做出具体回应,违反了xAI的内部政策和核心价值观,”声明表示。
xAI承诺未来将更加透明,通过在GitHub上公开Grok的系统提示并实施额外的审核流程来表达诚意。
然而,X用户对公司将责任推给一名“违规员工”的决定并不买账。
“你要开除这个‘违规员工’吗?哦……是老板干的?哎呀,”知名YouTuber JerryRigEverything在X平台上写道。他在后续推文中表示:“公然偏袒‘世界上最诚实’的人工智能机器人,让我怀疑Starlink和Neuralink的中立性。”
就连OpenAI首席执行官萨姆·奥特曼也忍不住批评了竞争对手。自从xAI发表声明以来,Grok已不再提及“白人种族灭绝”,所有相关内容的帖子也从X平台上消失。
Cryptopolitan学院:厌倦了市场波动?了解DeFi如何助你建立稳定的被动收入。立即注册
(责任编辑:基金优选)
-
张兰的儿子汪小菲后来回忆:那时候住平房,冬天要生炉子,晚上就把三块煤垒起来,都烧得红红旺旺的,才敢上床睡觉。...[详细]
-
一、古典颜色增加网站浓郁的人文气息 网站设计最重要就是人性化,加上古典气息网站风格,这类网站在装修设计类网站容易常见,给人一种浓厚的文化气息感。...[详细]
-
——–微信指数用具体的数值来表现搜索词的流行程度。...[详细]
-
最后我想说,网站的友情链接不宜过多,个人觉得一个网站最多20-30个就好,同时要定期检测自己网站的友情链接情况,避免一些骗链接的人趁虚而入。...[详细]
-
约瑟夫·熊彼特认为创业其实就是一种创新性破坏——新方法被开发出来,老办法被人淡忘。...[详细]
-
也幸亏在这两年VR爆发之际,HTC做出了口碑还算不错的Vive,不然的话连转型都会很难。...[详细]
-
即便举办到了第五届、活动也一直在持续亏损,但这已经成为了niconico保持存在感的一种重要方式。...[详细]
-
一般的道具收费的养成类游戏例如《梦幻西游手游》,平民玩家靠的是长在线时间,每天完成任务来换取与土豪玩家实力的接近,平民玩家没钱但是有的是不要钱的时间,当他们在游戏里做了一天的任务从而赚了20块钱的时候...[详细]
-
但是,在共享经济最火爆的时候,它却成了“失败典型”。...[详细]
-
公司的业绩并不算好,2013年亏损,2014年盈利200多万。...[详细]