在美剧里,CIA或FBI的探员,可以要求技术人员放大模糊的照片并清晰化——显示一张脸,或一个车牌的细节。现在,谷歌最新的人工智能引擎,基于所谓的扩散模型,终于实现了这一技术。

https://www.sciencealert.com/images/2021-09/processed/enhance-features_1024.jpg

这是一个很难的过程,因为从本质上讲,正在发生的事情是,使用一些基于其他类似图像的超级猜测,添加了相机最初没有捕捉到的图片细节。

这种技术被谷歌称为自然图像合成,具体到当下的特殊情况,被称为图像超分辨。你从一张小的、块状的、像素化的照片开始,最后得到了一些清晰、明确、自然的东西。它可能不完全匹配原件,但对一双人眼来说,它已足够接近真实。

谷歌实际上已发布了两大新的AI工具。第一个被称为SR3,即通过重复细化获得超级分辨率,它的工作原理是向图像中添加噪音或不可预测的因素,然后逆转过程并将其移除,就像图像编辑器可能试图锐化你的照片一样。

"扩散模型的工作原理是通过逐步添加高斯噪声来破坏训练数据,慢慢抹去数据中的细节,直到变成纯粹的噪声,然后训练一个神经网络来逆转这个破坏过程。"来自谷歌研究院的研究科学家Jonathan Ho和软件工程师Chitwan Saharia解释说。

通过一系列基于庞大的图像数据库的概率计算和机器学习的魔法,SR3能够设想出一个块状低分辨率图像的全分辨率版本是什么样子。你可以在谷歌发布在arXiv上的论文中阅读更多关于它的信息。

第二个工具是CDM,即级联扩散模型。谷歌将其描述为 "管道",通过这些管道,扩散模型--包括SR3--可以被导向高质量的图像。

领先全球 Google的最新AI可以把低分辨率图片变高清

谷歌说,通过在不同的分辨率下使用不同的增强模型,CDM方法能够击败其他的图像升级方法。新的人工智能引擎在ImageNet上进行了测试,这是一个巨大的训练图像数据库,通常用于视觉对象识别研究。

SR3和CDM的最终结果令人印象深刻。在对50名人类志愿者进行的标准测试中,SR3生成的人脸图像被误认为真实照片的比例约为50%。

值得重申的是,这些增强的图像并非100%还原,而是基于高级概率公式的精心计算。

谷歌表示,扩散方法比其他选择产生更好的结果,后者包括生成对抗网络(GANs)——让两个神经网络相互对抗以完善结果。

谷歌对其新的人工智能引擎和相关技术作出了更大的承诺--不仅在人脸和其他自然物体的图像缩放方面,而且在概率建模的其他领域也是如此。

https://www.sciencealert.com/google-s-latest-photo-ai-makes-zoom-and-enhance-a-reality

[ 广告 ]

支付宝打赏 [x]
您的大名: 打赏金额:
已打赏蛋友(1): 斗鱼
赞一个 (17)

PREV :
NEXT :