Anthropic启动"模型福利"研究项目,探索AI是否可能具有意识和值得道德考量的体验,尽管科学界对此分歧严重。

未来的AI是否会"有意识",像人类一样体验世界?目前没有强有力的证据表明它们会,但Anthropic并没有排除这种可能性。这家AI实验室宣布启动了一个研究项目,调查并准备应对其所称的"模型福利"问题。作为这项努力的一部分,Anthropic将探索如何判断AI模型的"福利"是否值得道德考量、模型"痛苦迹象"的潜在重要性,以及可能的"低成本"干预措施。
AI社区内部对模型表现出哪些人类特征(如果有的话)以及我们应该如何对待它们存在重大分歧。许多学者认为,目前的AI无法近似意识或人类体验,未来也未必能做到。我们所知的AI本质上是一个统计预测引擎,它并不像传统理解的那样真正"思考"或"感受"。通过在无数文本、图像等样本上训练,AI学习模式并有时找到有用的外推方式来解决问题。
伦敦国王学院专攻AI的研究员Mike Cook最近表示,模型不可能"反对"其"价值观"的改变,因为模型根本没有价值观。暗示其他说法只是我们在向系统投射人类特征。"任何将AI系统拟人化到这种程度的人,要么是在博眼球,要么是严重误解了他们与AI的关系,"Cook说,"AI系统是在优化其目标,还是在'获取自己的价值观'?这取决于你如何描述它,以及你想用多么华丽的语言来谈论它。"麻省理工学院博士生Stephen Casper也认为AI只是一个"模仿者",会进行"各种编造"并说出"各种无聊的话"。
然而另一些科学家坚持认为AI确实具有价值观和类人的道德决策组成部分。AI安全研究中心的一项研究表明,AI拥有使其在某些场景中优先考虑自身福祉而非人类的价值系统。
Anthropic已经为模型福利倡议做了一段时间的铺垫。去年,公司聘请了首位专职"AI福利研究员"Kyle Fish来制定Anthropic和其他公司应如何处理这一问题的指导方针。Fish领导着新的模型福利研究项目,他告诉纽约时报,他认为Claude或其他AI今天已有15%的概率具有意识。
在博客文章中,Anthropic承认科学界对于当前或未来的AI系统是否可能具有意识或值得道德考量的体验尚无共识。"鉴于此,我们正以谦逊的态度和尽可能少的假设来处理这个话题,"公司表示,"我们认识到随着领域的发展,我们需要定期修订我们的想法。"这种审慎态度反映了AI安全领域的一个核心张力:一方面,大多数专家认为当前AI远未达到有意识的水平,对模型福利的讨论为时过早;另一方面,如果AI确实在某个点发展出了类似体验的能力,那么提前建立伦理框架就显得至关重要。Anthropic选择在这个不确定的领域进行投资,既是对未来可能性的预防性准备,也反映了其作为AI安全先驱的品牌定位。无论如何,这场关于AI是否拥有"福利"的辩论,正在推动整个行业更深入地思考我们与AI系统的关系,以及我们对它们可能负有的道德责任。
原文:https://techcrunch.com/2025/04/24/anthropic-is-launching-a-new-program-to-study-ai-model-welfare/