Ai molodca 🤖
25.4K subscribers
696 photos
126 videos
2 files
149 links
Кураторские AI генерации и полезности. Новый мир исследует @dobrokotov. Хаб: @AIMolodcaHub. Образование для команд и студия: https://aimolodca.tilda.ws

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
Нам далли секретное обновление ☀️

Работая с #Dalle3, заметил кое-что странное. Он стал генерировать гораздо больше текста на изображениях, иногда даже в генерациях проступают куски промта. Раньше можно было почти без ошибок создать небольшое словосочетание, а теперь - небольшой текст.

Получается, правда, мыльно (яркий пример - картинка с неоном), с косяками, но всё же. Теперь вы тоже знаете.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Лучший видео-генератор #KLING открыл доступ всем (но стал условно-платным) 😮

1. Теперь не нужен китайский номер телефона. Просто регистрируйтесь по почте на klingai.com.

2. Бесконечный сыр закончился, теперь генерация по кредитам, как в Gen-2/3. В день дают 66 кредитов и нельзя врубать быструю генерацию по ключевым кадрам.
- 1 генерация text-to-video, Img-to-video: 10 кредитов.
- 1 генерация по кейфремам: аж 35.

💳 Расценки следующие на данный момент.

1. Без подписки: 0 рублей/месяц
- Кредиты: 66 в день, ограниченные функции.

2. Золотая подписка: примерно 396 рублей/месяц
- Кредиты: 660 в месяц

3. Платиновая подписка: примерно 1596 рублей/месяц
- Кредиты: 3000 в месяц

4. Бриллиантовая подписка: 3996 рублей/месяц
- Кредиты: 8000 в месяц

В настоящее время действует 50% скидка на все тарифы.

Оплатить можно с WeChat или AliPay (с которым сейчас разбираюсь).

🍗 Жду видео-наводнения!
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Тридевятый архив: Бесконечный маршрут 💀

Новый файл. Купил подписку на #Kling и сжег на это все кредиты.

Буду рад репосту/комментам/отзывам.

Инструменты: Midjourney, Kling, ElevenLabs (звучки), CapCut.

Версия для ютуба.

#3x9архив
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
В рамках пятничного шитпостинга - музыкальная пауза 🍗
Please open Telegram to view this post
VIEW IN TELEGRAM
Kling vs Luma vs Gen-3 (промтинг и особенности so far, дополняется)

Готов поделиться с вами некоторыми наблюдениями на основе своего опыта и официальных гайдов.

😑 Актуально для Kling, Luma и Gen-3:

1. Модели не могут одновременно создать два сюжета или действия в рамках одной генерации. Фокусируйтесь на одном конкретном действии или изменении за раз.
2. Luma лучше справляется с интерполяцией между совершенно разными ключевыми кадрами, создавая логичную (иногда) последовательность. Kling чаще ошибается в таких случаях и требует наличия визуальных подсказок - общих деталей или объектов в кадрах (здесь, например, это приборная панель машины), чтобы правильно интерполировать между ними.
3. Фокусируйтесь на том, что должно быть в сцене, а не на том, чего не должно быть.
4. В целом все три модели схожи - по классике промтинга, четко описывайте желаемую сцену, избегая двусмысленности и сложных выражений.

😌 Рекомендации по промптингу:

1. Для Kling:
* Используйте короткие, простые предложения.
* Сосредоточьтесь на описании движения, а не на характеристиках объектов.
* Избегайте сложных идиом и культурно-специфических выражений. Не понятно, переводит ли он на китайский, но если да, смысл вашего английского или русского промта может измениться.
* Пример: Instead of "An elegant lady in an evening gown", write "A woman smoothly moving in a long dress".
* Есть теория, что Клинг охотнее ест упрощенный китайский.
* Экспериментируйте с ползунком креативности для баланса между точностью и интерпретацией. Установка ползунка на 0.5 дает сбалансированный результат, а на 1 — более точное следование промпту, но это нужно еще проверить.

2. Для Luma:
* Используйте "Enhance prompt" для улучшения ваших промптов. Работает почти всегда.
* Обязательно указывайте движение камеры, например: "A dramatic zoom in" или "An FPV drone shot". Иногда достаточно описать движение камеры + enchance prompt.

3. Для Gen-3:
* Структурируйте промпт по схеме: [camera movement]: [scene setup]. [additional details].
* Четко разделяйте информацию о движении камеры, описании сцены и дополнительных деталях.
* Повторяйте или усиливайте ключевые идеи в разных частях промпта.
* Пример: "Low angle static shot: The camera is angled up at a woman wearing all orange as she stands in a tropical rainforest with colorful flora. The dramatic sky is overcast and gray."

P.S: Обновил свою GPTшку, генерирующую промпты для видео-моделей по картинке. Теперь она более точная и предлагает сразу четыре варианта промпта на выбор. Кроме того, вы можете загрузить две картинки попросить написть для них переход. 🤨
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ДОЛОЙ УНЫНИЕ!
This media is not supported in your browser
VIEW IN TELEGRAM
В #Gen3 завезли img-to-video 😱

Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Видео-аватары цветут и пухнут 🙂

Только, к своему стыду добрался до легендарного #Heygen, в то время как появляется множество любопытных альтернатив.

В плане возможностей — нравится неочевидное — послушать свое звучание на любом языке мира.

В качестве теста, «Я рыба, а я пиво», но на 9 языках и рассказанная моим видео-аватаром (естественно, я это не снимал/не говорил).

Можно заметить муху , которая залетела на свежесть шутки в датасет. А я ушел учить французкий.
Please open Telegram to view this post
VIEW IN TELEGRAM
В рамках страданий вашего покорного слуги от оплаты всех видео нейронок, #промо пост AI канала от Сергея Булаева (@sergiobulaev). Сам подписан, канал хороший. За поддержку Сергею — благодарочка.

Автор — Сергей Булаев, создатель приложений Купи Батон и Взахлёб, а также проекта Lifehacker.ru. выйдя из последнего, и уволившись со всех работ, уехал на остров Самуи, чтобы дни напролет исследовать с AI. Сергей всю жизнь занимался контентом и хочет не упустить происходящую революцию в своей сфере.

Вот примеры постов:

🔶 Пример интеграции творчески мыслящей языковой модели и чётко исполняемого программного кода

🔶 Как происходит Fine Tuning?

🔶 Как влиять на сервильность моделей

🔶 Сборник авторских стилей художников и фотографов для использования с моделями

🔶 Как работает долгосрочная память в боте Ulcamp

🔶 Claude Engineer - агент на базе Claude с доступом к редактированию файлов и поиском

🔶 Последний сценарист - фильм о сценаристе который пишет сценарий с помощью модели, сценарий для которого написал ChatGPT-4
Новая полезная фича #Gen3 (и это не ключевые кадры)

Сижу, спокойно генерирую материал по большому проекту, вдруг замечаю новую вкладку first/last на загруженной картинке.

А это значит, что теперь можно использовать входящее изображение а) как начальный кадр ИЛИ б) как конечный.

Почему это важно? Когда я/мы используем нашу картинку как отправную точку (по классике), мы оказываемся заперты в её сетапе. Фундамента, от которого модель будет плясать. Поэтому я, например, тщательно подготавливаю расходники, зачищаю их, представляя, что там должно происходить.

Например, изображаю дрифт машины, но убираю весь дым. Потому что дым и дрифт должен дорисовать Gen-3, чтобы было натурально.

Когда входящее изображение финальное, это совсем другие правила. Мы можем взять готовое классное изображение, например, из Midjourney или Flux (скоро напишу про него), и представить в запросе, а что было до этого момента.

Сделал быстрый наглядный тест на арбузах (ем сейчас), с примитивным промтом: watermelon explosion, на одном и том же seed. А то всё слова, слова.
В честь самой обычной, 🥂 my dudes 🥂, среды - аттракцион: кидайте картинку в комментарии к посту - загружаю ее в Gen-3 и оправляю вам обратно видео. Без промтов, но можно указать финальным или начальным кадром является ваша картинка. Лучше кидать 16:9, будет кропать.
Please open Telegram to view this post
VIEW IN TELEGRAM
ФЛЮКСИМ 🤬

Несмотря на мой гиперфокус на видео, нельзя не отметить новую веху в генерации изображений. Новый Midjourney 6.1 — это, конечно, классное улучшение, и вскоре ожидается выпуск комбинированной версии с 3D и, возможно, даже видеомоделью.

Однако настоящим прорывом стал #Flux. Про него уже много написали другие авторы, и я вам советую почитать, как флюксит Сергей, начиная с этого поста и вниз.

Факты:

1) Сделан командой, покинувшей Stability AI.
2) Идеальное понимание запроса и длинных детальных промптов. На уровне DALL-E 3, а может быть выше.
3) Прекрасное качество, хоть и чуть не дотягивает до эстетики MJ 6.1.
4) OpenSource — можете курить его на своем компьютере.
5) Только вышел, а энтузиасты уже пишут и выпускают ControlNet, лоры и прочую классику для ультимативного контроля над процессом.

Итого, Flux — по сути, новый Stable Diffusion, который мы так ждали.

На своем опыте: я сейчас делаю большой проект, и расходники генерил в DALL-E 3 (понимание запроса), который потом перегонял в SD (чинил фотореализм). Как только вышел Flux, я на него полностью переключился, сократив пайплайн в два раза.

Если не ставить локально, то попробовать можно здесь. Или через Глиф.
Please open Telegram to view this post
VIEW IN TELEGRAM
Ai molodca 🤖
В #Gen3 завезли img-to-video 😱 Не так давно писал, что туда бессмысленно нести деньги. Но теперь можно. Леонид все еще думает — брать ли безлимит за 100 баксов, но я ушел разоряться тестировать.
Почему в #Gen3 стоит брать ТОЛЬКО БЕЗЛИМИТНУЮ подписку. Боюсь представить сколько бы вышло долларов, если бы все это считалось по кредитам.
Есть работа 🥂

Проблема: мне постоянно пишут с интересными фриланс-заказами, но на них нет времени.

Проблема 2: есть большое количество талантливых нейронщиков самых разных специализаций, которые не прочь заработать и поделать интересные проекты.

Решение: если вы из проблемы 2, заполните пожалуйста короткую форму ниже, о том, что умеете делать. Или пришлите ее тому самому специалисту.

Форма: https://forms.gle/iWVXcZxLcpN7NjTb8 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Этим проклятым видео я хочу протестировать новый формат донатных звездочек-реакций (вдруг у вас есть донатные звёздочки).
Очень крутая лора для #FLUX от начинающего канала (исправляю).