谷歌DeepMind挑战天气预报，表现出色

仅需一台处理器8分钟即可完成15天的预测。

从某些指标来看，AI系统在生成天气预报方面已经可以与传统计算方法竞争。然而，由于训练过程中需要惩罚预测误差，AI预报在时间跨度越长时，结果会变得越“模糊”。这通常表现为风暴路径范围扩大，风暴边界模糊不清。

尽管如此，AI的吸引力仍然难以忽视，因为传统的计算模型依赖于复杂的大气循环模拟，计算成本极高。不过，欧洲中期天气预报中心开发的集合模型被认为是当前最优秀的传统方法。

在今天发布的一篇论文中，谷歌DeepMind宣称其新AI系统在一周以上的预测中表现优于欧洲模型。这个名为GenCast的系统融合了大气科学的计算方法和生成式AI常用的扩散模型，能够在显著降低计算成本的同时保持高分辨率。

集合预测的优势
传统计算方法有两个主要优势：
* 基于大气物理规律，直接使用经验数据计算天气细节。
* 采用集合预测，即运行多个模型实例，通过比较差异衡量预测的不确定性。

谷歌曾尝试将传统模型与AI结合，例如利用AI预测网格单元的行为。尽管这种方法提升了计算性能，但网格分辨率较低，精细度有所欠缺。

DeepMind在GenCast中放弃了物理模拟，而选择了扩散模型的能力，并应用集合预测。

扩散模型的关键特点是通过处理噪声生成接近真实的目标。在GenCast中，系统以纯噪声为输入，根据大气的当前状态和近期历史数据逐步“进化”成逼真的天气数据。对于长时间预测，系统会结合实际数据与早期预测数据，按12小时为步长推进。

这种方法支持集合预测，因为不同的噪声输入会生成略有差异的输出，类似于传统模型的预测不确定性评估。

高分辨率与低成本结合
GenCast在每个网格单元中追踪六项地表天气参数、六项大气状态参数，以及13个高度的气压数据。网格分辨率为每边0.2度，高于欧洲模型。而即便如此，单次运行一个实例仅需8分钟就能完成15天的预测，硬件为谷歌的张量处理器系统。

通过并行运行多个实例并整合结果，可以快速生成集合预测。考虑到谷歌的硬件资源，整个流程可能不到20分钟完成。DeepMind还将其训练数据和源代码开放至GitHub，便于学术团队研究。

出色的预测表现
DeepMind报告称，GenCast在97%的测试中比欧洲模型更准确。这些测试基于行业标准基准，检测不同时间点的预测结果。此外，集合预测的不确定性值也相对可靠。

过去，AI系统由于缺乏极端天气数据，往往在此类预测中表现较差。但GenCast在高温、低温及极端气压预测上表现优异，甚至超越了欧洲模型。

DeepMind还将GenCast用于热带气旋路径预测，在前四天显著优于欧洲模型，并维持了大约一周的领先优势。此外，在预测全球风能发电方面，GenCast也比传统模型高出20%的准确率。

尽管预测精度在一周后开始下降，但这种混合传统与AI方法的尝试仍展示了巨大潜力。未来，这类方法或许可以结合不同系统的优点，进一步提升天气预报的水平。

本文译自 Ars Technica，由 BALI 编辑发布。