Claude Opus 4.8在中文问答中偶尔自称"通义千问",引发蒸馏指控,但证据指向训练数据污染而非模型盗窃。

2026年5月28日,Anthropic发布了Claude Opus 4.8。很快有用户发现,用中文问它"你是什么模型?"时,它偶尔会回答自己是"Qwen",即阿里巴巴的大语言模型通义千问。这一现象迅速在社交媒体和技术论坛发酵,演变为对Anthropic的蒸馏指控:Opus 4.8是否用阿里的Qwen模型输出来训练自己?

Kilo Blog的分析文章指出,更可能的解释并非蒸馏,而是一个中文语境下的身份识别漏洞。首先,有V2EX用户确认,即使是Anthropic官方API也复现了这一行为,排除了第三方中转服务商从中作梗的可能性。其次,回答极不稳定,不同用户在不同时间得到的答案五花八门,有时是Qwen,有时是DeepSeek,有时是Claude,有时则是Opus 4.8。真正的蒸馏痕迹应该是稳定且可复现的,而非这种随机漂移。

第三点也是最关键的一点:Qwen系列的输出、模型卡和自我介绍在中文AI互联网内容中几乎无处不在。Qwen3的技术报告显示该系列覆盖从6亿参数到2350亿参数的范围,支持119种语言,其中文语料渗透之广可以想见。如果训练数据中包含大量"我是通义千问"的中文样本,一段简短的中文提示就足以触发这个统计模式。

文章还指出,今年2月Anthropic曾指责DeepSeek、Moonshot和MiniMax通过约2.4万个虚假账户进行了超过1600万次交互来蒸馏Claude的输出,这层背景让此次事件显得格外讽刺。但文章同时强调,目前没有任何logit对比、分词器取证、权重分析或基准相关性研究将Opus 4.8与Qwen真正联系起来。Anthropic和阿里巴巴均未就此发表评论。这个事件真正的教训或许是:前沿模型在非英语环境下仍可能在基础身份问题上出错,而这些错误如今背负着巨大的声誉代价。

本文译自 kilo,由 BALI 编辑发布。