Интересное что-то

Forwarded from whargarbl

Simple Diffusion Status

В пятый раз сменил механику ембедингов

Вопреки расхожему заблуждению пулед ембединги дают полную инфу о изображении а не только стиль - пруф - обучка только на пулед https://huggingface.co/AiArtLab/sdxs/blob/main/media/promo.png

Обучка на хайден слое - в противовес - теряет информацию о форме изображения. Те обучая на токенах собака // лежит // трава - мы обучаем как бы отдельно и собаку и лежит и трава

Проблема:
Пулед дает композицию но не содержит файн детайлс
Хайден теряют композицию и взаимосвязь между токенами

Также пулед в отличие от хайден дает мультиязычность. В пулед слое dog и собака - это вектора которые смотрят в одном и том же напрвлении. Но на уровне токенов - это уже разные вектора (сюрприз)

В четвертой иттерации я сделал их объединение штатным механизмом дифузерс - пулед был добавлен как доп слой текстовых ембедингов в кросс-этеншен

Тренилось хреново. Я заглянул под капот и с удивлением обнаружил линейную проекцию. Проще говоря тончайшую материю сжатого представления о тексте а очередной кастрировали топором

Пришлось придумать свою имплементацию - простую как палка - эффективную как стрела. Пулед кладу в нулевой токен. Теперь ембединг выглядит так:
- собака лежит на траве
- собака
- лежит
- трава

Обучка пошла сразу сильно веселее. Вернулась композиция. Вернулась мультиязычность и мелкие детали
Лосс падает // град не колосится

https://huggingface.co/AiArtLab/sdxs/blob/main/media/result_grid.jpg

Такой день

ЗЫ Брюллов работал над "Последний день Помпеи" - 6 лет
Художник не считал картину завершенной до тех пор пока ему не удалось добавить в картину глубину. Те вот типа все персонажи уже были прорисованы и драма вроде как на месте, но глубины не было. По легенде финальным штрихом стало добавления игры света и тени для камней на мостовой. Так вот - соединение пулед и хайден ембедов дает "глубину". Посмотрите на шлем астронавта в космосе - он трехмерный. Вот что важно

https://ru.wikipedia.org/wiki/%D0%9F%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BD%D0%B8%D0%B9_%D0%B4%D0%B5%D0%BD%D1%8C_%D0%9F%D0%BE%D0%BC%D0%BF%D0%B5%D0%B8

81 views13:02