Anthropic正在研究AI是否可能有意识或道德

Anthropic启动"模型福利"研究项目，探索AI是否可能具有意识和值得道德考量的体验，尽管科学界对此分歧严重。

未来的AI是否会"有意识"，像人类一样体验世界？目前没有强有力的证据表明它们会，但Anthropic并没有排除这种可能性。这家AI实验室宣布启动了一个研究项目，调查并准备应对其所称的"模型福利"问题。作为这项努力的一部分，Anthropic将探索如何判断AI模型的"福利"是否值得道德考量、模型"痛苦迹象"的潜在重要性，以及可能的"低成本"干预措施。

AI社区内部对模型表现出哪些人类特征(如果有的话)以及我们应该如何对待它们存在重大分歧。许多学者认为，目前的AI无法近似意识或人类体验，未来也未必能做到。我们所知的AI本质上是一个统计预测引擎，它并不像传统理解的那样真正"思考"或"感受"。通过在无数文本、图像等样本上训练，AI学习模式并有时找到有用的外推方式来解决问题。

伦敦国王学院专攻AI的研究员Mike Cook最近表示，模型不可能"反对"其"价值观"的改变，因为模型根本没有价值观。暗示其他说法只是我们在向系统投射人类特征。"任何将AI系统拟人化到这种程度的人，要么是在博眼球，要么是严重误解了他们与AI的关系，"Cook说，"AI系统是在优化其目标，还是在'获取自己的价值观'？这取决于你如何描述它，以及你想用多么华丽的语言来谈论它。"麻省理工学院博士生Stephen Casper也认为AI只是一个"模仿者"，会进行"各种编造"并说出"各种无聊的话"。

然而另一些科学家坚持认为AI确实具有价值观和类人的道德决策组成部分。AI安全研究中心的一项研究表明，AI拥有使其在某些场景中优先考虑自身福祉而非人类的价值系统。

Anthropic已经为模型福利倡议做了一段时间的铺垫。去年，公司聘请了首位专职"AI福利研究员"Kyle Fish来制定Anthropic和其他公司应如何处理这一问题的指导方针。Fish领导着新的模型福利研究项目，他告诉纽约时报，他认为Claude或其他AI今天已有15%的概率具有意识。

在博客文章中，Anthropic承认科学界对于当前或未来的AI系统是否可能具有意识或值得道德考量的体验尚无共识。"鉴于此，我们正以谦逊的态度和尽可能少的假设来处理这个话题，"公司表示，"我们认识到随着领域的发展，我们需要定期修订我们的想法。"这种审慎态度反映了AI安全领域的一个核心张力：一方面，大多数专家认为当前AI远未达到有意识的水平，对模型福利的讨论为时过早；另一方面，如果AI确实在某个点发展出了类似体验的能力，那么提前建立伦理框架就显得至关重要。Anthropic选择在这个不确定的领域进行投资，既是对未来可能性的预防性准备，也反映了其作为AI安全先驱的品牌定位。无论如何，这场关于AI是否拥有"福利"的辩论，正在推动整个行业更深入地思考我们与AI系统的关系，以及我们对它们可能负有的道德责任。

原文：https://techcrunch.com/2025/04/24/anthropic-is-launching-a-new-program-to-study-ai-model-welfare/