Media is too big
VIEW IN TELEGRAM
Фильтруем датасеты (ну или терабайты фото на съемных дисках😊)
Запилил workflow - фильтрует фото по условию. Если условие совпало, то сохраняет фото в отдельную папочку.
Проверил, хорошо понимает позы, пол, одежду, стили, персонажей. Остальное предлагаю проверить вам. Строил на qwen3-VL.
P.S. Если плохо определяет, меняйте модель на более жирную. В workflow добавил ссылки на скачивание, потому что я заботливый.
P.S.S. Есть функционал задавать условие через фото. У меня задач с ним не было, но работать должен.
Спасибо. Нефильтрованное😊☝️☝️
Workflow в комментах👇👇👇
Запилил workflow - фильтрует фото по условию. Если условие совпало, то сохраняет фото в отдельную папочку.
Проверил, хорошо понимает позы, пол, одежду, стили, персонажей. Остальное предлагаю проверить вам. Строил на qwen3-VL.
P.S. Если плохо определяет, меняйте модель на более жирную. В workflow добавил ссылки на скачивание, потому что я заботливый.
P.S.S. Есть функционал задавать условие через фото. У меня задач с ним не было, но работать должен.
Спасибо. Нефильтрованное😊☝️☝️
Workflow в комментах👇👇👇
2🔥23👍9
дAI потестить!
Делаем автоматическую раскадровку без сюжета Если в NanoBanana Pro дать промпт: Cделай следующий монтажный кадр, соблюдая правила крупностей и ракурсов То банан сам попытается создать следующий монтажный кадр. Зачем думать, когда можно не думать😊 P.S.…
Media is too big
VIEW IN TELEGRAM
Делаем автоматическую раскадровку без сюжета - 2
Проверил: действительно, в Mixboard завезли Nano Banan Pro.
Что это значит для нас:
Во-первых, теперь есть бесплатный доступ к генерациям Banana Pro, которые можно запускать параллельно. У меня получилось одновременно запустить до 9 штук — до лимитов я пока не достал.
Но куда интереснее во-вторых.
Теперь мы можем адаптировать промпт из этого поста или переписать промпт отсюда - и получить консистентную раскадровку из 9 кадров за 3 минуты.
Что звучало как помешательство, если бы я написал это месяцев 8 назад 😊
Промпты из видео:
P.S. Кто достанет до дна, напишите в комментах что там с лимитами.
Проверил: действительно, в Mixboard завезли Nano Banan Pro.
Что это значит для нас:
Во-первых, теперь есть бесплатный доступ к генерациям Banana Pro, которые можно запускать параллельно. У меня получилось одновременно запустить до 9 штук — до лимитов я пока не достал.
Но куда интереснее во-вторых.
Теперь мы можем адаптировать промпт из этого поста или переписать промпт отсюда - и получить консистентную раскадровку из 9 кадров за 3 минуты.
Что звучало как помешательство, если бы я написал это месяцев 8 назад 😊
Промпты из видео:
Сделай 9 фото:
Cделай следующий монтажный кадр, соблюдая правила крупностей и ракурсов
Сделай 9 фото:
1. Экстремально общий план (ELS): Субъект(ы) видны маленькими на фоне обширного окружения.
2. Общий план (LS): Полностью видные субъект(ы) или группа сверху донизу (от головы до ног / от колёс до крыши).
3. Средне-общий план (American / 3/4): Кадрирование по колени (для людей) или 3/4 вид объекта.
4. Средний план (MS): Кадрирование по пояс (или центральная часть объекта). Фокус на действии/взаимодействии.
5. Средний крупный план (MCU): Кадрирование по грудь. Более интимное представление главных субъектов.
6. Крупный план (CU): Плотное кадрирование лица или «фронта» объекта.
7. Экстремальный крупный план (ECU): Макро-деталь с акцентом на ключевую особенность (глаза, руки, логотип, текстура).
8. Нижний ракурс (взгляд снизу): Камера смотрит на субъект(ов) снизу, создавая эффект величия/доминирования.
9. Верхний ракурс (птичий глаз): Камера смотрит сверху вниз на субъект(ов).
P.S. Кто достанет до дна, напишите в комментах что там с лимитами.
🔥20👍8❤3
This media is not supported in your browser
VIEW IN TELEGRAM
Оказывается в Veo 3.1 можно экстендить любые видео по API (не только сделанные в VEO как во Flow).
Пользуйтесь https://fal.ai/models/fal-ai/veo3.1/fast/extend-video
Пользуйтесь https://fal.ai/models/fal-ai/veo3.1/fast/extend-video
1😁30❤2👍2🍓2
Я сегодня со сладким на ночь.
1. Удаляем потоком watermark с Gemini Nano Banana.
Скачиваем из релизов файл. Распаковываем в удобное место. Переносим на него фото из Nano Banana. Profit.
2. Скачиваем видео с sora без watermark.
Эксперт по бесплатному интернету @astrolog_expert запилил бота, сайт, приложение и расширение, которые могут скачать видео с сайта https://sora.chatgpt.com без watermark и совершенно бесплатно (пока??).
P.S. Господа, файлы я конечно проверял на virustotal, но все равно на свой страх и риск.
P.S.S. Как там у вас с праздничным настроением?
1. Удаляем потоком watermark с Gemini Nano Banana.
Скачиваем из релизов файл. Распаковываем в удобное место. Переносим на него фото из Nano Banana. Profit.
2. Скачиваем видео с sora без watermark.
Эксперт по бесплатному интернету @astrolog_expert запилил бота, сайт, приложение и расширение, которые могут скачать видео с сайта https://sora.chatgpt.com без watermark и совершенно бесплатно (пока??).
P.S. Господа, файлы я конечно проверял на virustotal, но все равно на свой страх и риск.
P.S.S. Как там у вас с праздничным настроением?
🔥18👍7🍓4❤2🤓1
дAI потестить!
Нашел для Veo парочку любопытных токенов: [montage cuts] [jump cuts] Если их вставить в промпт, внутри генерации появятся джамп каты, поэтому смонтировать следующий кадр становится намного проще. Ролик в примере сделан по алгоритму: 1. Вставил первый кадр…
Еще немного токенов для Veo
Нашел как управлять ракурсами в Veo внутри одного шота.
Для первого видео:
Для второго:
P.S. Veo хорошо понимает "киношную" терминологию, поэтому если у кого есть такие словечки в словарном запасе, кидайте в комменты.
Нашел как управлять ракурсами в Veo внутри одного шота.
Для первого видео:
Montage cuts:
[Master shot]
[Cutaway]
[Reverse shot]
Для второго:
Montage cuts:
[Master shot]
[Cutaway]
[CloseUp]
[Drone view]
P.S. Veo хорошо понимает "киношную" терминологию, поэтому если у кого есть такие словечки в словарном запасе, кидайте в комменты.
👍17🔥4👌1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Добрался до Kling O1
Тут не все так однозначно.
Вот 3 мануала:
O1 Image (Банана от Kling)
O1 Video (Смесь моделей из всего в видео)
O1 Elements (создать элемент для фото или видео по 4 фото)
Что я сделал. Взял промпты из мануала и прогнал со своим видео (немного адаптировал). Результаты тут ☝️. Ваше мнение жду тут👇.
Тут не все так однозначно.
Вот 3 мануала:
O1 Image (Банана от Kling)
O1 Video (Смесь моделей из всего в видео)
O1 Elements (создать элемент для фото или видео по 4 фото)
Что я сделал. Взял промпты из мануала и прогнал со своим видео (немного адаптировал). Результаты тут ☝️. Ваше мнение жду тут👇.
🤔4😁1
Подглядел у Gos (https://t.iss.one/gos_comfy/8395) пост про https://github.com/shootthesound/comfyUI-Realtime-Lora.
В двух словах — это нода, в которой можно уменьшать влияние определённых слоёв в LoRA. Очень полезно, когда используешь больше одной LoRA.
Но меня заинтересовало другое. Автор приводит пресеты, в которых видно, какие слои в моделях влияют на лицо персонажа.
В теории, тренировка только тех слоёв, которые отвечают за лицо персонажа, может сократить время обучения и повысить точность сходства персонажа (но это не точно).
Прикрепил скрины здесь — вдруг кому пригодится. Сам я, конечно же, проверять это не буду 😊
В двух словах — это нода, в которой можно уменьшать влияние определённых слоёв в LoRA. Очень полезно, когда используешь больше одной LoRA.
Но меня заинтересовало другое. Автор приводит пресеты, в которых видно, какие слои в моделях влияют на лицо персонажа.
В теории, тренировка только тех слоёв, которые отвечают за лицо персонажа, может сократить время обучения и повысить точность сходства персонажа (но это не точно).
Прикрепил скрины здесь — вдруг кому пригодится. Сам я, конечно же, проверять это не буду 😊
👍10🥰5