Machinelearning

⚡️ ControlNet ProMax: Обновление набора ControlNet++ для Stable Diffusion XL.

ControlNet++ - это набор моделей ControlNet, собранный на новой архитектуре и упакованный в один единый файл без необходимости скачивать дополнительные препроцессоры и наборы моделей.

Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который были добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint.

C учетом обновления, набор ControlNet ProMax выполняет 12 функций и 5 дополнительных методик редактирования изображений:

🟢

Openpose. Оценивает и аннотирует ключевые точки на теле, лице и руках человека, выполняет комплексную оценку позы;

🟢

Depth. Предназначен для задач оценки глубины;

🟢

Сanny. Обнаруживает края на изображениях с помощью детектора алгоритма Canny;

🟢

Lineart. Извлекает контуры объектов из изображений, в частности для создания реалистичного воспроизведения с уточнением толщин контуров;

🟢

AnimeLineart. Извлекает контуры, характерные для техник, используемых в аниме;

🟢

MLSD (Mobile Line Segment Detection). Выделяет линейные структуры;

🟢

Scribble. Обнаруживает неточные и неровные линии. Используется для имитации рисунков, похожих на скетчи;

🟢

HED (Holistically-Nested Edge Detection). Извлекает линии с мягкими краями. Он предварительно обрабатывает изображения, чтобы усилить или изолировать особенности линий для задач, требующих детального обнаружения краев или линий;

🟢

Pidi (Softedge). Выделяет линии мягких краев с использованием методов PiDiNet. Его цель - улучшить задачи анализа и обработки и предоставить уточненные исходные данные для дальнейшей обработки или анализа;

🟢

TEED. Извлекает линии мягких краев с помощью техники TEDDetector;

🟢

Segment. Выполняет визуальную сегментацию объектов и их частей;

🟢

Normal. Создает карту нормалей на основе визуально-вычислительного анализ глубины;

🟠

Tile Deblur. Устраняет размытие методом анализа наложенных плиток (Tiles) заданного размера (от 64х64 до 1024х1024);

🟠

Tile Variation. Генерирует вариации с небольшим изменением в деталях методом Tiles;

🟠

Tile Super Resolution. Кратно повышает разрешение методом анализа наложенных плиток;

🟠

Inpainting. Заменяет или добавляет объекты на существующее изображение;

🟠

Outpainting. Расширяет границы изображения, сохраняя общую композицию.

В архитектуре ControlNet++ были разработаны два новых модуля: Condition Transformer и Control Encoder, которые улучшают представление и обработку условий в модели.
Каждому условию назначается уникальный идентификатор типа управления, который преобразуется в эмбеддинги.
Condition Transformer позволяет обрабатывать несколько условий одновременно, используя один кодировщик и включает слой трансформера для обмена информацией между исходным изображением и условными изображениями.
Condition Encoder увеличивает количество каналов свертки для повышения представительной способности, сохраняя оригинальную архитектуру.
Также была использована единая стратегия обучения, которая одновременно оптимизировала сходимость для одиночных условий и управляла слиянием множественных условий, повышая устойчивость сети и ее способность к генерации качественных изображений.

▶️Набор ControlNet Pro Max может быть использован как в виде консольного инференса, так и в интерфейсе ComfyUI, где разработчиками были обновлены наборы нод для работы с моделями ControlNet.
ControlNet Pro Max поддерживает работу с любой генеративной моделью семейства Stable Diffusion XL. Поддержка семейства Stable Diffusion 3 находится в разработке.

📌Лицензирование : Apache-2.0 license

🟡

Модель на HF

🖥

Github [ Stars: 1.4K | Issues: 31 | Forks: 22]

@ai_machinelearning_big_data

#AI #ControlNet #ML #Diffusers #SDXL

Please open Telegram to view this post