突发：美国政府紧急下令关停Claude Fable 5与Mythos 5

2026年6月12日，美国下令Anthropic关停Fable 5与Mythos 5。公司因安全理由不充分表示异议并担忧行业停滞。

2026年6月12日下午5时21分(美国东部时间)，Anthropic收到了一项改变行业轨迹的政府指令。美国政府引用国家安全权限，发布了一项极具杀伤力的出口管制指令，要求立即停止所有外国国民访问 Fable 5 和 Mythos 5 模型。这一禁令的覆盖面之广令人震惊：它不仅针对美国境外的全球用户，还涵盖了美国境内的所有外籍人士，甚至包括 Anthropic 内部的外籍员工。这意味着公司必须在内部切断核心研发人员对自己作品的访问权限。为了彻底执行合规要求，Anthropic 不得不向全球所有客户停用这两个顶级模型。公司同时确认，除这两个特定型号外，其他 Anthropic 模型的使用暂不受此指令影响。

关于“越狱”的争议

此次强力干预的核心理由是针对“越狱”技术的国家安全顾虑。然而，政府最初仅向公司提供了关于潜在漏洞的口头证据。在后续对政府提供的演示技术进行评估后，Anthropic 认为这些所谓的漏洞仅涉及极少数已知的次要缺陷。其技术逻辑相对简单，在目前市面上其他公开可用的模型中，即便不使用任何特殊的绕过技术，也能轻易重现类似的缺陷。特别需要指出的是，这些发现并不能为 Mythos 5 提供任何特有的能力提升。因此，公司认为政府所掌握的证据并非 Fable 5 或 Mythos 5 所特有的安全威胁，而是行业模型普遍存在的特征。

Anthropic 的安全架构

为了构建坚实的防御体系，Fable 5 在上线前的数周内，便与美国政府、英国人工智能安全研究所及多家私人第三方机构展开了深度协作。内外部团队累计进行了1000s小时的红队测试，旨在全方位探测安全盲区。测试结果表明，Fable 5 的防护机制在有效性上显著超越了此前部署的任何模型。截至目前，尚未有测试者发现能解锁大规模网络能力的“通用越狱”方法。公司坦诚，完美的越狱抗性在当前技术条件下几乎无法实现，所有模型都可能在特定环境下遭遇非通用型漏洞。基于此，公司采取了“深度防御”策略，旨在极大提高攻击成本，并配合全天候监控快速阻断异常。为了研究并缓解此类风险，Anthropic 还执行了严格的客户数据保留政策，要求数据保留30天，尽管这显著增加了公司的运营成本。

行业影响与合规立场

讽刺的是，政府所担忧的“修复软件缺陷”等模型能力，在 OpenAI 旗下的 GPT-5.5 中早已属于标准功能。这些功能不仅被广泛公开，且每天都被全球的系统防御人员用来抵御真实的网络威胁。Anthropic 明确表示，虽然会严格遵守法律指令并移除访问权限，但并不认同因发现一个狭隘的潜在漏洞，就撤回已部署给100,000,000s用户的商用模型。公司担忧，若这一严苛且缺乏透明度的标准被推广到全行业，将实质性地导致所有前沿 AI 开发商的部署进程陷入停滞。Anthropic 强调，公司支持在透明、公平且基于技术事实的法定程序下进行安全监管，但认为此次突发指令严重背离了这些原则。目前，公司正全力与政府沟通以消除误解。

原文：https://www.anthropic.com/news/fable-mythos-access