Google研究团队回顾JPEG XL标准十年研发历程,从Guetzli、Brunsli到PIK,开源实验一步步推高了图像编码的极限。

互联网运行在图像之上。自网络早期以来,视觉保真度与带宽之间就存在持续的张力。几十年来,业界依赖古老的JPEG标准来快速加载图像。它服务得相当出色,但随着显示器进入高动态范围(HDR)和广色域(WCG)时代,这一格式开始显露局限。

通往JPEG XL的道路并非直线。这是一场长达十年的探索,期间创造了一系列里程碑项目,在心理视觉建模、熵编码和优化领域测试了各种激进想法。

研究始于理解现有技术的边界。团队最先做的是让JPEG变得更好,从中学习其局限。WebP无损模式(2011年)引入了熵图像概念,一种利用辅助图像来协调主视觉数据静态熵码选择的创新方法。大约2014年,团队意识到原始数学压缩指标不够用,简单的心理视觉近似也在色彩丰富的环境中失效,于是构建了Butteraugli和XYB色彩空间来模拟人类视觉系统的边缘检测和对立色过程。

Guetzli(2016年)和Brunsli(2015年)将传统JPEG推向了极限。Guetzli是一个缓慢高密度感知编码器,利用Butteraugli寻找最佳量化表,将传统JPEG缩小20%到30%。Brunsli则专注于无损再压缩,允许用户重打包现有JPEG而不丢失任何原始数据。

到2017年,独立的工具已足够强大,是时候融合它们了。开源PIK将Brunsli的效率与Guetzli的心理视觉优化结合在一起,形成了提交给ISO标准机构的提案。最终JPEG XL标准合并了PIK和Cloudinary的FUIF提案,成为两全其美的方案。

JPEG XL诞生记

如今JPEG XL正被各行业迅速采用。摄影领域用于DNG 1.7和Apple ProRAW,医学领域被DICOM国际标准采纳,出版领域将集成到PDF和EPUB的未来版本中。Adobe软件、Apple iOS和macOS、Linux发行版和Windows均已提供原生支持。

JPEG XL诞生记

JPEG XL的故事证明了长期规划配合中间功能性里程碑的效力。一个小型研究团队可以通过快速迭代进行数千次实验来创新,整个行业最终可以驶向一个更高效、更美好的未来。

本文译自 googleblog,由 BALI 编辑发布。