AI声音侵权：声优起诉声音克隆公司

两位声优称一家人工智能公司未经许可创建了他们的声音克隆，并提起诉讼。公司否认有任何不当行为。

去年夏天，曼哈顿的保罗·斯凯·勒曼和琳妮娅·赛奇在驾车去医院的路上听了一档播客，讨论了人工智能的崛起及其对作家、演员和其他娱乐专业人士生计的威胁。这个话题对这对年轻的夫妇来说尤为重要。他们以声优为生，而人工智能技术正在开始生成听起来像真实的声音。

但是，播客有一个出人意料的转折。为了强调人工智能的威胁，主持人对一款名为Poe的聊天机器人进行了长时间的采访。它听起来就像勒曼先生。勒曼说：“他正在采访我的声音，谈论人工智能的危害以及它可能对娱乐行业造成的伤害。”“我们把车停了下来，坐在那里完全不敢相信，试图弄清楚刚刚发生了什么以及我们该怎么做。”

勒曼和赛奇现在正在起诉创建该机器人声音的公司。他们声称，位于加州伯克利的初创公司Lovo非法使用他们的声音录音来创建能与他们的声音工作竞争的技术。在听到勒曼先生的声音克隆在播客中后，这对夫妇发现Lovo还克隆了赛奇女士的声音。

该夫妇加入了越来越多的艺术家、出版商、计算机程序员和其他创作者的行列，他们起诉人工智能技术的制造商，称这些公司在创建最终可能取代他们在职场上的工具时未经许可使用了他们的作品。(《纽约时报》去年12月起诉了两家公司OpenAI及其合作伙伴微软，指控它们在构建在线聊天机器人时使用了其受版权保护的新闻文章。)

在周四提交的诉讼中，该夫妇称Lovo的匿名员工于2019年和2020年支付了一些声音片段给他们，但未透露这些片段将如何使用。

他们称，2019年成立的Lovo违反了联邦商标法和几个州的隐私法，通过推广他们的声音克隆。该诉讼寻求集体诉讼地位，勒曼先生和赛奇女士邀请其他声优加入。

他们的律师史蒂夫·科恩说：“我们不知道还有多少其他受影响的人。”代表该公司的律师大卫·凯斯表示，Lovo否认诉讼中的指控。他补充说，如果提供声音录音的所有个人都同意，“那就没有问题。”

该公司的首席执行官汤姆·李在去年的一集播客中表示，Lovo现在提供了一项分成计划，允许声优帮助公司创建自己的声音克隆，并获得这些克隆所赚钱的一部分。

SAG-AFTRA的法律总顾问杰弗里·贝内特说，这项诉讼似乎是首例。“这个诉讼将向人们——尤其是科技公司——展示存在你的声音权利，有一群人用自己的声音谋生，”他说。

2019年，勒曼先生和赛奇女士在Fiverr上宣传自己是声优，Fiverr是一个自由职业专业人士可以在其中宣传自己工作的网站。通过这个在线市场，他们经常被要求为商业广告、广播广告、在线视频、电子游戏和其他媒体提供声音工作。

当年，赛奇女士被一个匿名人士联系，支付了400美元为几个广播脚本录制声音，并解释说这些录音不会用于公共目的，诉讼引用了相关通信。
“这些是广播广告的测试脚本，”匿名人士说，根据诉讼。 “它们不会被外部公开，只会在内部使用，因此不需要任何形式的权利。”

七个月后，另一个未知人士联系了勒曼先生，要求类似的工作。勒曼先生还是一名电视和电影演员，他询问了这些片段将如何使用。根据诉讼中引用的通信，这个人多次表示这些片段仅用于研究和学术目的。勒曼先生获得了1200美元的报酬。(他提供的录音比赛奇女士的要长。)

2022年4月，勒曼先生发现了一段YouTube视频，讲述了乌克兰战争的情况，由一个听起来像他的声音叙述。“这是我的声音，谈论乌克兰俄罗斯冲突中的武器，”他说。 “我变得苍白——手臂上起鸡皮疙瘩。我知道我从未以那种顺序说过那些话。”

几个月来，他和赛奇女士努力理解发生了什么。他们聘请了律师帮助他们追踪制作YouTube视频的人是谁，以及勒曼先生的声音是如何再现的。但是YouTube频道的所有者似乎在印度尼西亚，他们无法找到这个人。然后，他们在去医院的路上听到了播客。通过播客《截止日期罢工谈话》，他们能够确定勒曼先生的声音克隆的来源。麻省理工学院的一位教授使用了Lovo的语音合成技术拼凑出了这个聊天机器人。

赛奇女士还发现了一段在线视频，其中该公司在2020年初在伯克利的活动中向投资者推销其语音技术。在视频中，一位Lovo高管展示了赛奇女士的合成版本声音，并将其与她真实声音的录音进行了比较。两者都与另一位不是她的女性的照片一起播放。

“我在他们的筹款视频中，”赛奇女士说。该公司此后筹集了超过700万美元，并声称在全球拥有超过200万客户。

勒曼先生和赛奇女士还发现，Lovo正在推广他们两人的声音克隆。在他们发出停止和解函后，该公司表示已将他们的声音克隆从网站上删除。但是勒曼先生和赛奇女士认为，驱动这些声音克隆的软件已经被公司的许多客户下载，并且仍然可以使用。

勒曼先生还质疑该公司是否已经将这对夫妇的声音与许多其他声音一起用于构建驱动其语音克隆系统的核心技术。语音合成器通常通过分析成千上万小时的口语来学习它们的技能，就像OpenAI的ChatGPT和其他聊天机器人通过分析互联网上搜集的大量文本来学习一样。

根据诉讼中的通信，Lovo承认已经使用了数千小时的数千个声音的录音来训练其技术。

代表Lovo的律师凯斯表示，公司使用了来自名为Openslr.org的可自由获取的英文录音数据库的音频来训练其人工智能系统。当被问及勒曼先生和赛奇女士的声音录音是否被用于训练技术时，他没有回应。“我们希望重新获得对我们声音的控制，对我们是谁的控制，对我们的职业的控制，”勒曼先生说。 “如果没有改变，我们希望代表其他人，这对他们发生了和即将发生的事情。”

原文： The New York Times