Нейросетевые модели

Конвейер обработки

Путь пикселя от ввода к результату

📥

Входное изображение

RAW / JPEG / PNG

→

🎨

Препроцессинг

Нормализация / Тайлинг

→

🧠

ИИ-модель

Инференс GPU

→

🔗

Сшивка тайлов

Blend / Overlap

→

📤

Результат

16-bit / HDR

Суперразрешение · Апскейлинг

Real-ESRGAN
v2.0

Enhanced Super-Resolution Generative Adversarial Network — генеративная сеть для слепого суперразрешения реальных фотографий с неизвестным типом деградации.

В отличие от классического ESRGAN, Real-ESRGAN обучен на синтетических парах с реалистичными деградациями: гауссовый шум, JPEG-артефакты, кинопленочное зерно, смаз, хроматические аберрации.

PyTorch 2.x RRDB × 23 блока Персептивные потери ×2 / ×4 / ×8 16.7M параметров FP16 / INT8

PSNR (Set5)32.94 dB

SSIM0.902

LPIPS (перцептуальное)0.051

Скорость · RTX 4070 · 1024px~0.8 с

Архитектура генератора: RRDB (Residual-in-Residual Dense Block) с 23 блоками, дискриминатор U-Net с добавлением спектральной нормализации.

Трансформер · Восстановление

SwinIR //
Image Restoration

Swin Transformer для восстановления изображений. Использует оконное мультиголовое самовнимание (W-MSA) с кросс-оконными сдвигами для захвата как локальных, так и глобальных зависимостей.

Идеально справляется с классическим шумоподавлением (AWGN), JPEG-артефактами и суперразрешением с явным масштабным коэффициентом.

Swin Transformer v2 96×96 окна L1 + Перцептивные потери 180 × RSTB блоков 11.8M параметров

Шумоподавление · σ=5031.67 dB

Убр. JPEG-артефактов · Q=1032.44 dB

SR ×4 · BSD10028.77 dB

Генеративная · Лица

GFPGAN
Face Restoration

Generative Facial Prior GAN — восстановление лиц с помощью предобученного StyleGAN2 в качестве «умного» prior'а. Модель знает, как должно выглядеть человеческое лицо на уровне фундаментальных статистических закономерностей.

StyleGAN2 prior Pyramid Restoration Channel Split Spatial FaceLib landmarks ~338M параметров

Возможности

✓ Восстановление глаз высокой детализации
✓ Текстура кожи без пластического эффекта
✓ Волосы, брови — каждый волосок
✓ Сохранение идентичности (identity preservation)
✓ До 8 лиц на изображении одновременно

Сравнение

Выберите правильную модель

Real-ESRGAN

ЗадачаАпскейлинг ×2–8

VRAM (мин.)4 ГБ

Скорость 4K~3 сек

ПортретыХорошо

ПейзажиОтлично

ДокументыОтлично

SwinIR

ЗадачаШум / JPEG / SR

VRAM (мин.)3 ГБ

Скорость 4K~2 сек

ПортретыОтлично

ПейзажиОтлично

ДокументыХорошо

GFPGAN

ЗадачаВосстановление лиц

VRAM (мин.)6 ГБ

Скорость 4K~5 сек

ПортретыНаилучшее

ПейзажиН/Д

ДокументыН/Д

Все метрики получены на тестовых датасетах Set5/BSD100/FFHQ при разрешении входного изображения 512×512. Скорость измерена на RTX 4070 при тайлинге 512px.

Нейросетевые архитектуры

Путь пикселя от ввода к результату

Real-ESRGANv2.0

SwinIR //Image Restoration

GFPGANFace Restoration

Возможности

Выберите правильную модель

Real-ESRGAN
v2.0

SwinIR //
Image Restoration

GFPGAN
Face Restoration