Claude Opus 4.8自称是阿里的Qwen，怎么回事？

Claude Opus 4.8在中文问答中偶尔自称"通义千问"，引发蒸馏指控，但证据指向训练数据污染而非模型盗窃。

2026年5月28日，Anthropic发布了Claude Opus 4.8。很快有用户发现，用中文问它"你是什么模型？"时，它偶尔会回答自己是"Qwen"，即阿里巴巴的大语言模型通义千问。这一现象迅速在社交媒体和技术论坛发酵，演变为对Anthropic的蒸馏指控：Opus 4.8是否用阿里的Qwen模型输出来训练自己？

Kilo Blog的分析文章指出，更可能的解释并非蒸馏，而是一个中文语境下的身份识别漏洞。首先，有V2EX用户确认，即使是Anthropic官方API也复现了这一行为，排除了第三方中转服务商从中作梗的可能性。其次，回答极不稳定，不同用户在不同时间得到的答案五花八门，有时是Qwen，有时是DeepSeek，有时是Claude，有时则是Opus 4.8。真正的蒸馏痕迹应该是稳定且可复现的，而非这种随机漂移。

第三点也是最关键的一点：Qwen系列的输出、模型卡和自我介绍在中文AI互联网内容中几乎无处不在。Qwen3的技术报告显示该系列覆盖从6亿参数到2350亿参数的范围，支持119种语言，其中文语料渗透之广可以想见。如果训练数据中包含大量"我是通义千问"的中文样本，一段简短的中文提示就足以触发这个统计模式。

文章还指出，今年2月Anthropic曾指责DeepSeek、Moonshot和MiniMax通过约2.4万个虚假账户进行了超过1600万次交互来蒸馏Claude的输出，这层背景让此次事件显得格外讽刺。但文章同时强调，目前没有任何logit对比、分词器取证、权重分析或基准相关性研究将Opus 4.8与Qwen真正联系起来。Anthropic和阿里巴巴均未就此发表评论。这个事件真正的教训或许是：前沿模型在非英语环境下仍可能在基础身份问题上出错，而这些错误如今背负着巨大的声誉代价。

本文译自 kilo，由 BALI 编辑发布。