Розробники brain team розповіли в блозі google ai про досягнення компанії в області штучного інтелекту. Фахівці створили нову технологію масштабування зображень, здатну відтворити високоякісну фотографію зі знімка з низьким дозволом.

Для цього використовуються дві дифузійні моделі. Перша називається sr3 або супер-дозвіл за допомогою повторного уточнення. Вона приймає на вхід картинку з низькою роздільною здатністю, а потім поступово додає до неї шум, поки зображення не знайде чіткі форми. Модель вчиться, звертає процес назад, починаючи з початку і поступово видаляючи шум для досягнення заявленого результату.

Співробітники google виявили, що sr3 добре зарекомендувала себе при масштабуванні портретів і фотографій природи. При 8-кратному наближенні осіб модель видає результат краще таких генеративних алгоритмів, як pulse і fsrgan.

Другий підхід отримав назву cdm або модель умовно-класової дифузії. Вона відтворює високочетке зображення за допомогою даних imagenet.

Google опублікувала приклади роботи, демонструють каскадне масштабування зображень з низьким дозволом фотографії 32 × 32 збільшують до 64 × 64, а потім до 256 × 256, а фото розміром 64 × 64 — 256 × 256 до 1024 × 1024.