前沿AI的网络和生物双用途能力正在扩散,单点封禁难以解决风险。

美国政府要求Anthropic下线Claude Fable 5和Mythos 5,理由是出口管制指令禁止任何外国公民使用这些服务。Anthropic仍在同白宫谈判,希望找到重新上线的方式。争议的核心不是普通聊天能力,而是前沿模型在网络安全和生物学上的双用途能力。Mythos从4月亮相起就被描述为能帮助发现软件漏洞、辅助防御者修补系统,也可能帮助恶意人员设计利用路径。Anthropic在发布Mythos 5和Claude Fable 5时承认,高级AI模型的许多用途天然具有两面性,同样的问题和工具在专业防御者、生命科学研究者手中有价值,在攻击者手中也会变危险。
Anthropic先把Mythos Preview提供给一个名为Project Glasswing的受控联盟,随后又把Mythos 5私下提供给该群体。Claude Fable 5则作为面向公众的Mythos级模型发布,并设置了针对生物学和网络安全问题的限制。特朗普政府随后认为,Fable 5的护栏可能被绕过,从而获得Mythos 5级别能力,因此把两个模型都列入限制范围。支持者把这视为国家安全举措,批评者则认为,禁掉一个公司的模型不会改变能力扩散的趋势。
多名安全专家强调,Anthropic只是当前最显眼的例子。其他公司和开放权重开发者很可能很快拥有类似能力,甚至已经接近。Anthropic自己的红队负责人Logan Graham也曾表示,真正信息不是某个模型或某家公司,而是社会必须为这些能力在6个月、12个月、24个月内广泛可得做准备。OpenAI在4月也私下发布过网络安全方向模型,并扩大了安全战略。现有模型如果配合精心设计的工具链,也已经能帮助漏洞搜索和利用开发。政策问题因此不应只问一项技术有没有风险,而要问某项限制是否真正降低风险,还是主要拖慢了试图提升系统安全的人。更可靠的路径,是用透明、民主、可审查的方式制定广泛规则,覆盖网络安全、生物安全和其他敏感领域,而不是在某个模型引爆争议后临时封堵。
这场冲突也暴露了安全治理的两难。网络防御者需要更强工具来发现漏洞、修补系统、加快响应速度;攻击者也可能利用同类能力缩短侦察和利用链条。若限制过粗,安全团队、研究机构和受信任合作方可能被一并挡在外面。若完全放任,模型能力扩散又会增加恶意使用门槛下降的风险。真正需要建设的是能力评估、访问分级、审计记录、红队测试和跨国沟通机制。模型变得更便宜、更小、更容易组合后,单一出口管制只能争取时间,不能替代长期制度设计。
透明标准还可以减少企业和政府之间的临时拉扯,让开发者提前知道哪些能力触发更高审查。
原文:https://arstechnica.com/ai/2026/06/dangerous-ai-models-are-coming-no-matter-what/