DeepMind宣布他们下一代AI将结合AlphaGo和大语言模型的能力

2016年，名为AlphaGo的人工智能程序在谷歌的DeepMind AI实验室创造了历史。现在，DeepMind的联合创始人兼首席执行官德米斯·哈萨比斯说，他的工程师们正在使用AlphaGo的技术来制造一个名为Gemini的AI系统，它将比OpenAI的ChatGPT更有能力。

DeepMind的Gemini仍在开发中，是一种大型语言模型，可以处理文本，与OpenAI的GPT-4类似。但哈萨比斯说，他的团队将把这种技术与AlphaGo中使用的技术结合起来，目标是给系统增加一些新的能力，比如规划或解决问题的能力。

“从高层来看，你可以把Gemini看作是结合了AlphaGo类型系统的一些优势和大型模型惊人的语言能力。我们还有一些新的创新，将会非常有趣。”Gemini是上个月在谷歌的开发者大会上首次亮相，当时该公司宣布了一系列新的AI项目。

AlphaGo是基于一种DeepMind开创性地使用的技术——强化学习——制造出来的。这种软件通过反复尝试和接收反馈来学习如何解决需要选择行动的难题，比如围棋或视频游戏。它还使用了一种称为树搜索的方法来探索和记住棋盘上可能的走法。语言模型的下一个重大飞跃可能涉及到它们在互联网和计算机上执行更多任务。

Gemini仍在开发中，这个过程将需要几个月的时间，哈萨比斯说。它可能花费数千万或数亿美元。OpenAI首席执行官Sam Altman在4月份表示，创建GPT-4花费了超过1亿美元。

自从ChatGPT问世以来，谷歌已经推出了自己的聊天机器人Bard，并将生成性AI引入了其搜索引擎和许多其他产品中。为了提升AI研究，该公司在4月份将哈萨比斯的部门DeepMind与谷歌主要的AI实验室Brain合并为Google DeepMind。哈萨比斯说，新团队将把两个在最近AI进展中具有基础性作用的实力派组织结合起来。“如果你看看我们在AI方面的位置，我会说80%或90%的创新都来自其中一个或另一个组织，过去十年里，两个组织都做了很多出色的事情。”

2014年，DeepMind被谷歌收购，之前它展示了一些令人印象深刻的结果，即使用强化学习来让AI进行简单的视频游戏。在接下来的几年里，DeepMind展示了这种技术能够做一些曾经被认为是独属于人类的事情——而且常常是以超人的技巧。当AlphaGo在2016年击败围棋冠军李世石时，许多AI专家都感到震惊，因为他们认为要过几十年才能让机器精通这样一个复杂的游戏。

训练一个像OpenAI的GPT-4这样的大型语言模型涉及到向机器学习软件——称为变换器——输入大量来自书籍、网页和其他来源的筛选过的文本。它使用训练数据中的模式来提高预测应该跟随一段文本的字母和单词的能力，这是一种简单的机制，但证明非常强大，可以回答问题和生成文本或代码。

制作ChatGPT和类似能力的语言模型的一个重要额外步骤是使用基于人类对AI模型答案的反馈的强化学习来提高其性能。DeepMind在强化学习方面的深厚经验可能会让其研究人员能够赋予Gemini新颖的能力。

哈萨比斯和他的团队也可能尝试用其他AI领域的想法来增强大型语言模型技术。DeepMind的研究人员涉及从机器人到神经科学等领域，本周早些时候，该公司展示了一种能够学习使用各种不同机器人手臂执行操作任务的算法。

从现实世界获得物理经验，就像人类和动物所做的那样，被广泛认为是对AI最重要的能力之一。语言模型通过文本间接地了解世界这一事实被一些AI专家视为一个主要限制。

哈萨比斯负责加速谷歌的AI工作，同时也要管理未知且可能严重的风险。最近语言模型的快速进步使许多AI专家(包括一些构建算法的人)担心这项技术是否会被用于恶意用途或变得难以控制。一些科技内部人士甚至呼吁暂停开发更强大的算法，以避免创造出危险的东西。

哈萨比斯说，AI潜在的巨大好处——比如在健康或气候等领域进行科学发现——使得人类不应该停止开发这项技术。他还认为，强制暂停是不切实际的，因为它几乎不可能执行。“如果做得正确，它将是有史以来对人类最有益的技术，”他说。“我们必须大胆而勇敢地追求这些东西。”

这并不意味着哈萨比斯鲁莽冲动。自从ChatGPT出现之前，DeepMind就一直在分析AI的潜在风险，并由该公司联合创始人之一Shane Legg领导了一个“AI安全”项目书。

https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/