领先全球 Google的最新AI可以把低分辨率图片变高清

majer @ 2021.09.07 , 04:57 下午

在美剧里，CIA或FBI的探员，可以要求技术人员放大模糊的照片并清晰化——显示一张脸，或一个车牌的细节。现在，谷歌最新的人工智能引擎，基于所谓的扩散模型，终于实现了这一技术。

这是一个很难的过程，因为从本质上讲，正在发生的事情是，使用一些基于其他类似图像的超级猜测，添加了相机最初没有捕捉到的图片细节。

这种技术被谷歌称为自然图像合成，具体到当下的特殊情况，被称为图像超分辨。你从一张小的、块状的、像素化的照片开始，最后得到了一些清晰、明确、自然的东西。它可能不完全匹配原件，但对一双人眼来说，它已足够接近真实。

谷歌实际上已发布了两大新的AI工具。第一个被称为SR3，即通过重复细化获得超级分辨率，它的工作原理是向图像中添加噪音或不可预测的因素，然后逆转过程并将其移除，就像图像编辑器可能试图锐化你的照片一样。

"扩散模型的工作原理是通过逐步添加高斯噪声来破坏训练数据，慢慢抹去数据中的细节，直到变成纯粹的噪声，然后训练一个神经网络来逆转这个破坏过程。"来自谷歌研究院的研究科学家Jonathan Ho和软件工程师Chitwan Saharia解释说。

通过一系列基于庞大的图像数据库的概率计算和机器学习的魔法，SR3能够设想出一个块状低分辨率图像的全分辨率版本是什么样子。你可以在谷歌发布在arXiv上的论文中阅读更多关于它的信息。

第二个工具是CDM，即级联扩散模型。谷歌将其描述为 "管道"，通过这些管道，扩散模型--包括SR3--可以被导向高质量的图像。

领先全球 Google的最新AI可以把低分辨率图片变高清

谷歌说，通过在不同的分辨率下使用不同的增强模型，CDM方法能够击败其他的图像升级方法。新的人工智能引擎在ImageNet上进行了测试，这是一个巨大的训练图像数据库，通常用于视觉对象识别研究。

SR3和CDM的最终结果令人印象深刻。在对50名人类志愿者进行的标准测试中，SR3生成的人脸图像被误认为真实照片的比例约为50%。

值得重申的是，这些增强的图像并非100%还原，而是基于高级概率公式的精心计算。

谷歌表示，扩散方法比其他选择产生更好的结果，后者包括生成对抗网络(GANs)——让两个神经网络相互对抗以完善结果。

谷歌对其新的人工智能引擎和相关技术作出了更大的承诺--不仅在人脸和其他自然物体的图像缩放方面，而且在概率建模的其他领域也是如此。

https://www.sciencealert.com/google-s-latest-photo-ai-makes-zoom-and-enhance-a-reality

[ 广告 ]

赞一个 (17)

煎蛋