Ai molodca 🤖
25K subscribers
696 photos
120 videos
149 links
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub. Образование для команд и студия: https://aimolodca.tilda.ws

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
SORA не нужна 😅

Главная проблема визуальных моделей — это проблема контроля. Сделать красиво легко, а сделать как надо — это квест. С картинками проблему можно считать решённой (Controlnet, Dreambooth, IPAdapter и другие решения умельцев). С видео — пока всё только начинается.

Новая возможность #Luma — загружать не только начальный кадр, но и конечный, что позволяет делать генеративную интерполяцию (переход) между ними. Это кажется маленькой фишкой, но на самом деле это большой шаг к контролю, который, думаю, станет стандартом для многих (#Gen3 и прочих Клингов).

Если вы умеете в консистентную визуализацию и в целом круто управляете картиночными моделями, то перед вами открывается целое поле видео возможностей и СТОРИТЕЛЛИНГА. Я придумал уже с десяток способов интеграции в пайплайны с другими инструментами, и это даже при том, что пока генерации в Luma довольно сомнительного качества (пока что).

В приложении технический тест, где я использовал четыре кадра своего персонажа для презентаций, созданного в Dalle-3.

А вот-вот и Gen-3 выйдет, во многом не уступающий Соре по качеству. Так что последняя окажется в очень конкурентном поле.

What a time to be alive 🔥 (снова).
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Потратил 15 долларов на новый #Gen3 (чтобы это не пришлось делать вам).

Это будет короткий пост. Вывод — если вы вдруг решили попробовать свежий GEN-3 за 15 долларов в надежде делать SORA-like видосики, это делать НЕ СТОИТ.

1. Купленные кредиты сгорят за 10 минут экспериментов.

2. Вам очень повезёт, если у вас хотя бы что-то получится. В приложении — ЛУЧШИЙ результат (я генерил по 5 секунд, а не по 10, чтобы экономить кредиты). При этом изучил все доступные гайды по GEN-3 промтингу.

А что делать:

1. Брать вскладчину анлим за 100 долларов и спокойно экспериментировать. На безлимитном тарифе GEN-2 я сделал почти 2000 видео; если бы они считались по кредитам, я бы уже разорился.

2. Ждать, пока появятся img-to-video (кофаундер в Твиттере мне подтвердил, что скоро будет), кейфреймы, motion brush и прочие средства контроля. Иначе это пуньк, а не инструмент.
This media is not supported in your browser
VIEW IN TELEGRAM
В #Gen3 завезли img-to-video 😱

Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Новая полезная фича #Gen3 (и это не ключевые кадры)

Сижу, спокойно генерирую материал по большому проекту, вдруг замечаю новую вкладку first/last на загруженной картинке.

А это значит, что теперь можно использовать входящее изображение а) как начальный кадр ИЛИ б) как конечный.

Почему это важно? Когда я/мы используем нашу картинку как отправную точку (по классике), мы оказываемся заперты в её сетапе. Фундамента, от которого модель будет плясать. Поэтому я, например, тщательно подготавливаю расходники, зачищаю их, представляя, что там должно происходить.

Например, изображаю дрифт машины, но убираю весь дым. Потому что дым и дрифт должен дорисовать Gen-3, чтобы было натурально.

Когда входящее изображение финальное, это совсем другие правила. Мы можем взять готовое классное изображение, например, из Midjourney или Flux (скоро напишу про него), и представить в запросе, а что было до этого момента.

Сделал быстрый наглядный тест на арбузах (ем сейчас), с примитивным промтом: watermelon explosion, на одном и том же seed. А то всё слова, слова.
Ai molodca 🤖
В #Gen3 завезли img-to-video 😱 Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Почему в #Gen3 стоит брать ТОЛЬКО БЕЗЛИМИТНУЮ подписку. Боюсь представить сколько бы вышло долларов, если бы все это считалось по кредитам.
This media is not supported in your browser
VIEW IN TELEGRAM
#Gen3 только что выкатили video-to-video. Теперь можно грузить не только картинки на вход, но и видео до 10 секунд!

Быстрый тест на своем heygen аватаре показал, что под капотом что-то вроде контролнета: отлично сохраняет геометрию и детали. Продолжаю наблюдение. 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
Принес вам интересные примеры использования #Gen3 video2video из Твиттера (кажется, всю жизнь буду продолжать называть X Твиттером).

Как минимум, кажется хорошим инструментом для видео-прототипов: сделал болванку в Блендере или снял себя на телефон (с нужной геометрией), и сценка готова. Если бы еще были лоры, чтобы сохранять последовательность и вертикальное видео, было бы царски. Но поживем, увидим!
This media is not supported in your browser
VIEW IN TELEGRAM
Ради этого небольшого теста (динамики и множества объектов) #Gen3 пришлось побыть городским сумашедшим гуляющим с пультом от телевизора.
This media is not supported in your browser
VIEW IN TELEGRAM
#Kling обновился до версии 1.5, перестал шакалить лица, выдает 1080p и стал делать больше движения (больше, чем #Gen3). При этом, в отличие от Геннадия Ранавееча, в него по прежнему можно грузить вертикальные картинки, что для создателей контента — хлеб с маслом. Принесу вам сегодня тестов (накопилось 10к кредитов), по предварительному сравнению — Генку уделывает.

Конкуренция - класс! 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Заставка Улицы разбитых фонарей, но это Улица Сезам.

Сделал довольно проклятое, прогнав золотую классику через video-to-video #gen3. Специально не занимался черрипикингом, потому что галлюцинации здесь прекрасны. Ни о чем не жалею.
В #Gen3 (пока только турбо) НАКОНЕЦ-ТО завезли ключевые кадры. Почему это круто показывал здесь. Для примера, у меня было две картинки с аниме Дукалисом. Получилась кривая, но вполне себе анимация (на уровне второй серии "Cпирали", кто в курсе, тот в курсе).

P.S: когда нибудь закончу писать про видео, но не сегодня. Там еще китайцы отличный подгон сделали, подпимщики во всю тестируют его в комментариях.
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой тест (в молодежном стиле рок 80х) нового обновления #Gen3 Alpha Turbo — контроль камеры .

"Ну, нормально работает".

Еще один шаг в сторону контроля над видео, который пока идеален для приколов, но слаб для серьезных продакшен процессов.
This media is not supported in your browser
VIEW IN TELEGRAM
Доброе утро, друзья 🌹

Красивый сегодня осенний день. Небольшая, но приятная новость: в #Gen3 стало возможно создавать аж 20 секунд video-to-video. Полагаю, что этот порог будут и дальше увеличивать. Но, конечно, нужны лоры на стиль, чтобы это стало больше, чем просто приколом.

Улыбайтесь, друзья 🌹
Please open Telegram to view this post
VIEW IN TELEGRAM
В #Gen3 Turbo вышла функция видео аутпейнтинга, когда мы можем дорисовывать футаж за рамками загруженного горизонтального/вертикального видео (до 10 секунд). Простыми словами, превращать горизонтальное в вертикальное (и наооборот).

В приложении тест из якудзафикации Бригады. Горизонтальное в вертикальное, вертикальное в горизонтальное, повторить. По субтитрам и ватермарку можно оценить масштаб кадрирования.

Похоже новая функция может решать одну из значимых головных болей видео контентмэйкера: делать под мобильные телефоны и сторизы (вертикаль) или под компы (горизонталь). Жаль только 10 секунд, но для бодрых нарезок должно хватить.
SORA не нужна 🤨 (пока что)

Последние месяцы я плотно сижу на видеогенераторах, используя их в профессиональных проектах, поэтому буду выносить SORA из избы с этой позиции.

1. Большое количество брака. Из 10 генераций только 1 — ок. Остальное: галлюцинации, странные движения, а что-то вообще заблокировано из-за фантомного NSFW. Об этом второй пункт.

2. Драконовские фильтры. OpenAI очень боится, что вы будете создавать видео-криминал, поэтому выкрутило NSFW-фильтры на максимум, от чего этот криминал мерещится везде.

3. Цена. 200 долларов — не много для продакшена, но есть гораздо лучшие варианты по соотношению цена-качество. Тот же #KLING 1.5, который прекрасно генерит в 1080p, или #Gen3 с безлимитными генерациями.

Сэм Альтман в конце презентации, как бы немного извиняясь, сказал, что это только начало, как было с первыми версиями ChatGPT. Поэтому ждем. Как ждем и конкурентов, которые сейчас должны мощно усилиться. В любом случае мы, как пользователи, от этого в выигрыше. 👍
Please open Telegram to view this post
VIEW IN TELEGRAM