2026年6月12日,美国下令Anthropic关停Fable 5与Mythos 5。公司因安全理由不充分表示异议并担忧行业停滞。
2026年6月12日下午5时21分(美国东部时间),Anthropic收到了一项改变行业轨迹的政府指令。美国政府引用国家安全权限,发布了一项极具杀伤力的出口管制指令,要求立即停止所有外国国民访问 Fable 5 和 Mythos 5 模型。这一禁令的覆盖面之广令人震惊:它不仅针对美国境外的全球用户,还涵盖了美国境内的所有外籍人士,甚至包括 Anthropic 内部的外籍员工。这意味着公司必须在内部切断核心研发人员对自己作品的访问权限。为了彻底执行合规要求,Anthropic 不得不向全球所有客户停用这两个顶级模型。公司同时确认,除这两个特定型号外,其他 Anthropic 模型的使用暂不受此指令影响。
关于“越狱”的争议
此次强力干预的核心理由是针对“越狱”技术的国家安全顾虑。然而,政府最初仅向公司提供了关于潜在漏洞的口头证据。在后续对政府提供的演示技术进行评估后,Anthropic 认为这些所谓的漏洞仅涉及极少数已知的次要缺陷。其技术逻辑相对简单,在目前市面上其他公开可用的模型中,即便不使用任何特殊的绕过技术,也能轻易重现类似的缺陷。特别需要指出的是,这些发现并不能为 Mythos 5 提供任何特有的能力提升。因此,公司认为政府所掌握的证据并非 Fable 5 或 Mythos 5 所特有的安全威胁,而是行业模型普遍存在的特征。
Anthropic 的安全架构
为了构建坚实的防御体系,Fable 5 在上线前的数周内,便与美国政府、英国人工智能安全研究所 及多家私人第三方机构展开了深度协作。内外部团队累计进行了1000s小时的红队测试,旨在全方位探测安全盲区。测试结果表明,Fable 5 的防护机制在有效性上显著超越了此前部署的任何模型。截至目前,尚未有测试者发现能解锁大规模网络能力的“通用越狱”方法。公司坦诚,完美的越狱抗性在当前技术条件下几乎无法实现,所有模型都可能在特定环境下遭遇非通用型漏洞。基于此,公司采取了“深度防御”策略,旨在极大提高攻击成本,并配合全天候监控快速阻断异常。为了研究并缓解此类风险,Anthropic 还执行了严格的客户数据保留政策,要求数据保留30天,尽管这显著增加了公司的运营成本。
行业影响与合规立场
讽刺的是,政府所担忧的“修复软件缺陷”等模型能力,在 OpenAI 旗下的 GPT-5.5 中早已属于标准功能。这些功能不仅被广泛公开,且每天都被全球的系统防御人员用来抵御真实的网络威胁。Anthropic 明确表示,虽然会严格遵守法律指令并移除访问权限,但并不认同因发现一个狭隘的潜在漏洞,就撤回已部署给100,000,000s用户的商用模型。公司担忧,若这一严苛且缺乏透明度的标准被推广到全行业,将实质性地导致所有前沿 AI 开发商的部署进程陷入停滞。Anthropic 强调,公司支持在透明、公平且基于技术事实的法定程序下进行安全监管,但认为此次突发指令严重背离了这些原则。目前,公司正全力与政府沟通以消除误解。
原文:https://www.anthropic.com/news/fable-mythos-access