“增强”试图从低分辨率图像中以数字方式提取额外信息。谷歌人工智能博客上的一篇新博文展示了一项新技术,该技术旨在以令人难以置信的效果提升低分辨率图像。
级联生成无条件的 1024x1024 人脸。
这篇题为“使用扩散模型生成高保真图像”的博文解释了谷歌研究人员如何开发出一对人工智能技术,可以拍摄低分辨率图像,并通过选择性破坏和重建原始输入图像来稳步提高分辨率。
将人像的分辨率从 64 x 64 像素增加到 1024 x 1024 像素的前后对比。
该过程的第一个组成部分是通过重复细化 ( SR3 ) 的超分辨率,“一种超分辨率扩散模型,将低分辨率图像作为输入,并从纯噪声构建相应的高分辨率图像。” 本质上,该模型将纯高斯噪声应用于低分辨率图像,然后再使用降噪技术有效地重建四倍于输入分辨率的近乎无噪声的图像。
然后,研究人员使用级联扩散模型 ( CDM ) 智能地将高斯噪声和模糊应用于输出图像,然后再次重复该过程。这项被谷歌称为“条件增强”的技术将图像质量提高到超过当前人工智能升级方法的程度,其中包括BigGAN-deep和VQ-VAE-2。
根据谷歌的说法,这项新技术“在缩放到输入低分辨率图像的 4 倍到 8 倍的分辨率时,在面部和自然图像的超分辨率任务上取得了强大的基准测试结果”。从上图可以看出,这意味着 64 x 64 像素的图像可以输出令人印象深刻的清晰 1024 x 1024 像素图像。
谷歌研究人员表示,这项技术“将扩散模型的性能推向了超分辨率和类条件 ImageNet 生成基准的最先进水平”,并指出他们“很高兴进一步测试扩散模型的极限各种各样的生成建模问题。
可以在Google AI 博客上 H T T P S : / / A I . G O O G L E B L O G . C O M / 2 0 2 1 / 0 7 / H I G H - F I D E L I T Y - I M A G E - G E N E R A T I O N - U S I N G . H T M L ? M = 1
出处:头条号 @飞鱼在浪屿