Ai molodca 🤖
25.4K subscribers
696 photos
129 videos
2 files
149 links
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub. Образование для команд и студия: https://aimolodca.tilda.ws

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
В #Gen3 завезли img-to-video 😱

Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая полезная фича #Gen3 (и это не ключевые кадры)

Сижу, спокойно генерирую материал по большому проекту, вдруг замечаю новую вкладку first/last на загруженной картинке.

А это значит, что теперь можно использовать входящее изображение а) как начальный кадр ИЛИ б) как конечный.

Почему это важно? Когда я/мы используем нашу картинку как отправную точку (по классике), мы оказываемся заперты в её сетапе. Фундамента, от которого модель будет плясать. Поэтому я, например, тщательно подготавливаю расходники, зачищаю их, представляя, что там должно происходить.

Например, изображаю дрифт машины, но убираю весь дым. Потому что дым и дрифт должен дорисовать Gen-3, чтобы было натурально.

Когда входящее изображение финальное, это совсем другие правила. Мы можем взять готовое классное изображение, например, из Midjourney или Flux (скоро напишу про него), и представить в запросе, а что было до этого момента.

Сделал быстрый наглядный тест на арбузах (ем сейчас), с примитивным промтом: watermelon explosion, на одном и том же seed. А то всё слова, слова.
Ai molodca 🤖
В #Gen3 завезли img-to-video 😱 Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Почему в #Gen3 стоит брать ТОЛЬКО БЕЗЛИМИТНУЮ подписку. Боюсь представить сколько бы вышло долларов, если бы все это считалось по кредитам.
This media is not supported in your browser
VIEW IN TELEGRAM
#Gen3 только что выкатили video-to-video. Теперь можно грузить не только картинки на вход, но и видео до 10 секунд!

Быстрый тест на своем heygen аватаре показал, что под капотом что-то вроде контролнета: отлично сохраняет геометрию и детали. Продолжаю наблюдение. 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
Принес вам интересные примеры использования #Gen3 video2video из Твиттера (кажется, всю жизнь буду продолжать называть X Твиттером).

Как минимум, кажется хорошим инструментом для видео-прототипов: сделал болванку в Блендере или снял себя на телефон (с нужной геометрией), и сценка готова. Если бы еще были лоры, чтобы сохранять последовательность и вертикальное видео, было бы царски. Но поживем, увидим!
This media is not supported in your browser
VIEW IN TELEGRAM
Ради этого небольшого теста (динамики и множества объектов) #Gen3 пришлось побыть городским сумашедшим гуляющим с пультом от телевизора.
This media is not supported in your browser
VIEW IN TELEGRAM
#Kling обновился до версии 1.5, перестал шакалить лица, выдает 1080p и стал делать больше движения (больше, чем #Gen3). При этом, в отличие от Геннадия Ранавееча, в него по прежнему можно грузить вертикальные картинки, что для создателей контента — хлеб с маслом. Принесу вам сегодня тестов (накопилось 10к кредитов), по предварительному сравнению — Генку уделывает.

Конкуренция - класс! 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Заставка Улицы разбитых фонарей, но это Улица Сезам.

Сделал довольно проклятое, прогнав золотую классику через video-to-video #gen3. Специально не занимался черрипикингом, потому что галлюцинации здесь прекрасны. Ни о чем не жалею.
В #Gen3 (пока только турбо) НАКОНЕЦ-ТО завезли ключевые кадры. Почему это круто показывал здесь. Для примера, у меня было две картинки с аниме Дукалисом. Получилась кривая, но вполне себе анимация (на уровне второй серии "Cпирали", кто в курсе, тот в курсе).

P.S: когда нибудь закончу писать про видео, но не сегодня. Там еще китайцы отличный подгон сделали, подпимщики во всю тестируют его в комментариях.
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой тест (в молодежном стиле рок 80х) нового обновления #Gen3 Alpha Turbo — контроль камеры .

"Ну, нормально работает".

Еще один шаг в сторону контроля над видео, который пока идеален для приколов, но слаб для серьезных продакшен процессов.
This media is not supported in your browser
VIEW IN TELEGRAM
Доброе утро, друзья 🌹

Красивый сегодня осенний день. Небольшая, но приятная новость: в #Gen3 стало возможно создавать аж 20 секунд video-to-video. Полагаю, что этот порог будут и дальше увеличивать. Но, конечно, нужны лоры на стиль, чтобы это стало больше, чем просто приколом.

Улыбайтесь, друзья 🌹
Please open Telegram to view this post
VIEW IN TELEGRAM
В #Gen3 Turbo вышла функция видео аутпейнтинга, когда мы можем дорисовывать футаж за рамками загруженного горизонтального/вертикального видео (до 10 секунд). Простыми словами, превращать горизонтальное в вертикальное (и наооборот).

В приложении тест из якудзафикации Бригады. Горизонтальное в вертикальное, вертикальное в горизонтальное, повторить. По субтитрам и ватермарку можно оценить масштаб кадрирования.

Похоже новая функция может решать одну из значимых головных болей видео контентмэйкера: делать под мобильные телефоны и сторизы (вертикаль) или под компы (горизонталь). Жаль только 10 секунд, но для бодрых нарезок должно хватить.
SORA не нужна 🤨 (пока что)

Последние месяцы я плотно сижу на видеогенераторах, используя их в профессиональных проектах, поэтому буду выносить SORA из избы с этой позиции.

1. Большое количество брака. Из 10 генераций только 1 — ок. Остальное: галлюцинации, странные движения, а что-то вообще заблокировано из-за фантомного NSFW. Об этом второй пункт.

2. Драконовские фильтры. OpenAI очень боится, что вы будете создавать видео-криминал, поэтому выкрутило NSFW-фильтры на максимум, от чего этот криминал мерещится везде.

3. Цена. 200 долларов — не много для продакшена, но есть гораздо лучшие варианты по соотношению цена-качество. Тот же #KLING 1.5, который прекрасно генерит в 1080p, или #Gen3 с безлимитными генерациями.

Сэм Альтман в конце презентации, как бы немного извиняясь, сказал, что это только начало, как было с первыми версиями ChatGPT. Поэтому ждем. Как ждем и конкурентов, которые сейчас должны мощно усилиться. В любом случае мы, как пользователи, от этого в выигрыше. 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Runway #Gen3 добавили апскейл до 4к.

Причем как-то по тихому и незаметно (см. скриншот, где он спрятался). Теперь, по идее, можно генерировать видео не стыдного качества, которое годится для серьезного продакшена. Но так ли это? Об этом следующий пост с тестом.
4k.mp4
244.2 MB
Тест 4k апскейла #Gen3 и выводы.

Короче, две новости:

Хорошая: он действительно апскейлит генерации созданные в 720p.
Плохая: он действительно апскейлит генерации созданные в 720p.

Значение: что все кривое, косое, мутное, не идеальное, что выдаст вам Gen3 волшебным образом не исчезнет, а станет гораздо заметнее.

Но: Инструмент будет полезным, если само качество генераций подтянется, например, до флагмана Kling 1.6 и выше.

Сделал много тестов, но держите img-to-video красивого водопада, который на днях сфотографировал.