Уже показывал, что текст можно делать в любой стилистике. Но решил продемонстрировать еще одну возможность, на примере этих летних логотипов VAI. 🤓
Чтобы лучше контролировать формы, можно изначально скормить ИИ нужный силуэт, а затем уже сделать логотип с нужным наполнением.
Это работает как в Flux Kontext, так и в Sora.
Также работает с кириллицей: в Flux Kontext это работает хуже, потому что он не заточен под это. Бывают ошибки. А вот в Sora — без ошибок и с первого раза.
По традиции, хорошего завершения недели и отличных летних выходных!❤️
P.S. Решил ввести еще одну рубрику по воскресеньям. Скажите потом, нужно ли это или нет.🙃
@VAI_ART
#VAI_Gallery
Чтобы лучше контролировать формы, можно изначально скормить ИИ нужный силуэт, а затем уже сделать логотип с нужным наполнением.
Это работает как в Flux Kontext, так и в Sora.
Также работает с кириллицей: в Flux Kontext это работает хуже, потому что он не заточен под это. Бывают ошибки. А вот в Sora — без ошибок и с первого раза.
По традиции, хорошего завершения недели и отличных летних выходных!
P.S. Решил ввести еще одну рубрику по воскресеньям. Скажите потом, нужно ли это или нет.
@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤4
Подборка наиболее важных новостей в ИИ за неделю.
Решил начать вести рубрику по главным новостям недели в ИИ. Начало не особо богатое, но что имеем. Видимо все ушли на летние каникулы и релизов действительно значимых на этой неделе немного.
🔹 RunWay обновили одну из своих лучших фич - RunWay Act, теперь уже версия 2. Улучшен захвата движения, он теперь нового поколения со значительными улучшениями качества и поддержкой отслеживания головы, лица, тела и рук. Закинул в комментарии презентацию этого инструмента.
🔹 ChatGPT Agent — Deep Research и Operator теперь одно целое.
Внутри теперь единая модель которая может пользоваться всеми иснтрументами: текстовый и визуальный браузеры, терминал, прямой API доступ и коннекторы (Gmail, GitHub, etc.) — всё, что раньше жило раздельно в Operator и Deep Research, собрано в одном режиме. Агент теперь умеет заниматься и офисными задачами: генерировать редактируемые презентации и таблицы, обновлять их данными и подтягивать файлы (Docs/Slides/PowerPoint/Sheets) из подключённых облаков.
🔹 Suno v4.5+ — Про Suno уже давно хочу написать, но пока не успел. Один из лучших генераторов музыки и и песен обновился до версии 4.5. Предлагает улучшенную генерацию музыки с расширенными жанрами, более выразительными вокалами, детализированными звуками и улучшенной интерпретацией промтов. Теперь доступны длинные треки до 8 минут, а также новые инструменты, такие как
улучшенные каверы, вокальные оверлеи и генерация музыки по плейлистам. Улучшенная генерация и качество звука позволяют создавать сложные композиции с высокой детализацией и минимальными шумами, делая Suno 4.5 отличной платформой для студийного творчества
@VAI_ART
#VAI_News
Решил начать вести рубрику по главным новостям недели в ИИ. Начало не особо богатое, но что имеем. Видимо все ушли на летние каникулы и релизов действительно значимых на этой неделе немного.
🔹 RunWay обновили одну из своих лучших фич - RunWay Act, теперь уже версия 2. Улучшен захвата движения, он теперь нового поколения со значительными улучшениями качества и поддержкой отслеживания головы, лица, тела и рук. Закинул в комментарии презентацию этого инструмента.
🔹 ChatGPT Agent — Deep Research и Operator теперь одно целое.
Внутри теперь единая модель которая может пользоваться всеми иснтрументами: текстовый и визуальный браузеры, терминал, прямой API доступ и коннекторы (Gmail, GitHub, etc.) — всё, что раньше жило раздельно в Operator и Deep Research, собрано в одном режиме. Агент теперь умеет заниматься и офисными задачами: генерировать редактируемые презентации и таблицы, обновлять их данными и подтягивать файлы (Docs/Slides/PowerPoint/Sheets) из подключённых облаков.
🔹 Suno v4.5+ — Про Suno уже давно хочу написать, но пока не успел. Один из лучших генераторов музыки и и песен обновился до версии 4.5. Предлагает улучшенную генерацию музыки с расширенными жанрами, более выразительными вокалами, детализированными звуками и улучшенной интерпретацией промтов. Теперь доступны длинные треки до 8 минут, а также новые инструменты, такие как
улучшенные каверы, вокальные оверлеи и генерация музыки по плейлистам. Улучшенная генерация и качество звука позволяют создавать сложные композиции с высокой детализацией и минимальными шумами, делая Suno 4.5 отличной платформой для студийного творчества
@VAI_ART
#VAI_News
👍12❤1
ИИ становится умнее. А безопаснее? 🤖
В последнее время всё чаще слышу, что новые ИИ-модели выходят без должной проверки безопасности.
Почему так? Да потому что в гонке за вниманием важно выйти первым, а вопросы этики и контроля решат «потом».
А что же это значит? Какие риски?
🔹 Генерация вредного контента — ИИ может создать инструкции по оружию или даже призывы к насилию.
🔹 Дезинформация — ИИ генерирует ложь, но с такой уверенностью, как будто это правда.
🔹 Утечки данных и уязвимости — Некачественно проверенный код может привести к реальным угрозам.
Это только часть возможных проблем.
Мы еще не достигли уровня AGI (Artificial General Intelligence), где ИИ мыслит как человек, но даже сейчас видно, как обычная человеческая жадность и стремление к быстрому результату могут привести к определенным последствиям.
Хочется верить, что ИИ станет инструментом, который выведет нас в будущее.
Что будет дальше — покажет время. Но, если честно, это заставляет задуматься…🤔
@VAI_ART
#VAI_Notes
В последнее время всё чаще слышу, что новые ИИ-модели выходят без должной проверки безопасности.
Почему так? Да потому что в гонке за вниманием важно выйти первым, а вопросы этики и контроля решат «потом».
А что же это значит? Какие риски?
🔹 Генерация вредного контента — ИИ может создать инструкции по оружию или даже призывы к насилию.
🔹 Дезинформация — ИИ генерирует ложь, но с такой уверенностью, как будто это правда.
🔹 Утечки данных и уязвимости — Некачественно проверенный код может привести к реальным угрозам.
Это только часть возможных проблем.
Мы еще не достигли уровня AGI (Artificial General Intelligence), где ИИ мыслит как человек, но даже сейчас видно, как обычная человеческая жадность и стремление к быстрому результату могут привести к определенным последствиям.
Хочется верить, что ИИ станет инструментом, который выведет нас в будущее.
Что будет дальше — покажет время. Но, если честно, это заставляет задуматься…
@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👌2😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Сейчас таких роликов в сети очень много. Как я уже говорил, инструменты понемногу отходят на второй план, а на первый план выходит идея.
Сколько бы времени ушло на это раньше, если делать всё вручную?🫡
Сделано в Veo3.
Сколько бы времени ушло на это раньше, если делать всё вручную?
Сделано в Veo3.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👌2
В последнее время одним из художников, которым я особенно вдохновляюсь, стал Альберто Мьельго. Крутой мужик! 💪
Моя любовь к его стилю началась с Человека-паука: Через вселенные. Там сошлось всё — и уникальная стилистика, и сильный сюжет. Потом я увидел его работы для Netflix в Любовь, смерть и роботы — Свидетель, Джибаро. Уже тогда я подумал: «О, как-то это похоже на стиль Человека-паука». Но только позже узнал, что это один и тот же автор.
Отдельно стоит отметить Стеклоочиститель — проект, который он сделал с небольшой командой на коленке и за который получил «Оскар».
В игровой индустрии он тоже успел оставить свой след. Трейлер Watch Dogs: Legion я как-то пропустил и посмотрел только недавно, но Marathon я ждал с интересом. И когда увидел трейлер, сразу подумал: «Похоже на Мьельго». И потом узнал, что он также выступил там автором .
Это невероятно круто и по-настоящему свежее визуальное мышление. 🔥🔥🔥
На работе мы собрали подборку интересных стилистик, которые используем как референсы в производстве — и стиль Мьельго среди них.
Решил попробовать перенести его визуальный язык через ИИ. Получилось не всё, с чем я доволен, но, на мой взгляд, похоже.
@VAI_ART
#VAI_Gallery
Моя любовь к его стилю началась с Человека-паука: Через вселенные. Там сошлось всё — и уникальная стилистика, и сильный сюжет. Потом я увидел его работы для Netflix в Любовь, смерть и роботы — Свидетель, Джибаро. Уже тогда я подумал: «О, как-то это похоже на стиль Человека-паука». Но только позже узнал, что это один и тот же автор.
Отдельно стоит отметить Стеклоочиститель — проект, который он сделал с небольшой командой на коленке и за который получил «Оскар».
В игровой индустрии он тоже успел оставить свой след. Трейлер Watch Dogs: Legion я как-то пропустил и посмотрел только недавно, но Marathon я ждал с интересом. И когда увидел трейлер, сразу подумал: «Похоже на Мьельго». И потом узнал, что он также выступил там автором .
Это невероятно круто и по-настоящему свежее визуальное мышление. 🔥🔥🔥
На работе мы собрали подборку интересных стилистик, которые используем как референсы в производстве — и стиль Мьельго среди них.
Решил попробовать перенести его визуальный язык через ИИ. Получилось не всё, с чем я доволен, но, на мой взгляд, похоже.
@VAI_ART
#VAI_Gallery
❤8👍3
Forwarded from Data Secrets
О, на всеми любимом YouTube канале 3blue1brown впервые за долгое время вышло новое видео
Тема: диффузионные модели
За 40 минут автор в фирменном мультипликационном стиле буквально раскладывает по полочкам, как работают современные генераторы картинок и видео.
Сначала – основы. CLIP, эмбеддинги, скрытые пространства, архитектура ванильных диффузионных моделей. А потом уже рассказывается и про DDIM, и про устройство Dall E 2, и про conditioning, и про многое другое.
В общем получился довольно подробный ролик. Тем, кто в генерации новичок, посмотреть точно стоит. Профессионалам тоже советуем – чисто насладиться эстетикой😍
youtu.be/iv-5mZ_9CPY
Тема: диффузионные модели
За 40 минут автор в фирменном мультипликационном стиле буквально раскладывает по полочкам, как работают современные генераторы картинок и видео.
Сначала – основы. CLIP, эмбеддинги, скрытые пространства, архитектура ванильных диффузионных моделей. А потом уже рассказывается и про DDIM, и про устройство Dall E 2, и про conditioning, и про многое другое.
В общем получился довольно подробный ролик. Тем, кто в генерации новичок, посмотреть точно стоит. Профессионалам тоже советуем – чисто насладиться эстетикой
youtu.be/iv-5mZ_9CPY
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
На этой неделе ничего очень значительного не произошло, но вышли улучшенные версии уже существующих инструментов.
🔹 Qwen3 обновился. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
По сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Даже Kimi K2 про который писал недавно обходит, причем достаточно неплохо.
🔹 RunWay. Анонсировал инструмент Aleph, который должен появиться на днях. Aleph - это современная модель контекстного видео, открывающая новые горизонты многозадачной генерации визуальных эффектов, позволяющая выполнять широкий спектр операций редактирования исходного видео, таких как добавление, удаление и преобразование объектов, получение новых ракурсов сцены, изменение стиля и освещения, а также множество других задач. Прикрепил презентацию в комментарии.
🔹 Kling AI. Про который уже писал ранее. Kling AI Elements получил обновление. Позволяет генерировать видео на основе 1–4 изображений, автоматически объединяя их в единую динамическую сцену на основе вашей подсказки. Возможность добавлять, удалять или заменять элементы напрямую в интерактивном редакторе без использования внешних инструментов. Значительно улучшены согласованность сюжета, динамика и качество визуального рендеринга.
🔹 Midjourney. Недавно во всеми любимом генераторе ИИ изображений появилась возможность генерировать видео. Писал про него тут. Видео генератор понемногу развивается и обрастает интересными фишками. На этой неделе сделали возможность добавления последнего кадра. Теперь контролировать видео стало легче.
🔹Magnific AI. Новый тип апскейла – Precision (точность) – предлагает настройки для улучшения качества изображений. Уровень резкости, улучшает края и текстуры, повышая визуальную ясность, но высокие значения могут сделать изображение искусственным. Умные края с низкими значениями (7% - 12%) сохраняют оригинальное зерно, подходящее для фотографий или пленки, а высокие значения добавляют художественный или экспериментальный эффект. Настройка Ультра детализация повышает фокусировку и четкость, но при высоких значениях могут появляться артефакты, такие как гало или сдвиги контрастности, что делает изображение более искусственным. В данный момент апскейл работает в 2X, с возможностью увеличения изображения несколько раз.
🔹 Hedra запустили Live Avatars — это технология, позволяющая анимировать 3D-аватары в реальном времени прямо в браузере без установки. Система синхронизирует мимику и движения головы по видео с камеры, работает быстро и точно, поддерживает реалистичные и стилизованные лица, и легко интегрируется через LiveKit API. Это решение идеально для ассистентов и онлайн-презентаций — при этом стоит всего ~$0.05 за минуту, что делает его в десятки раз дешевле аналогов.
🔹ChatGPT. Новость, скорее всего, не новая, но в GPT при редактировании изображений наконец-то улучшили консистентность. Раньше, если просил добавить усы на фото (как пример), то система помимо усов сильно меняла само лицо. Сейчас работает гораздо лучше и практически не изменяет исходное изображение.
Что у вас? Может что - то пропустил?🧐
@VAI_ART
#VAI_News
🔹 Qwen3 обновился. Они выкатили свежий апдейт своего флагмана Qwen3-235B-A22B.Параметров стало большое (235B), но за один проход по архитектуре задействуют только 22B, отсюда название.
По сути Qwen3 сейчас одна из самых технологически продвинутых и открытых моделей на рынке, но мы с вами уже привыкли, что первенство может перехватываться иногда даже ежедневно. Даже Kimi K2 про который писал недавно обходит, причем достаточно неплохо.
🔹 RunWay. Анонсировал инструмент Aleph, который должен появиться на днях. Aleph - это современная модель контекстного видео, открывающая новые горизонты многозадачной генерации визуальных эффектов, позволяющая выполнять широкий спектр операций редактирования исходного видео, таких как добавление, удаление и преобразование объектов, получение новых ракурсов сцены, изменение стиля и освещения, а также множество других задач. Прикрепил презентацию в комментарии.
🔹 Kling AI. Про который уже писал ранее. Kling AI Elements получил обновление. Позволяет генерировать видео на основе 1–4 изображений, автоматически объединяя их в единую динамическую сцену на основе вашей подсказки. Возможность добавлять, удалять или заменять элементы напрямую в интерактивном редакторе без использования внешних инструментов. Значительно улучшены согласованность сюжета, динамика и качество визуального рендеринга.
🔹 Midjourney. Недавно во всеми любимом генераторе ИИ изображений появилась возможность генерировать видео. Писал про него тут. Видео генератор понемногу развивается и обрастает интересными фишками. На этой неделе сделали возможность добавления последнего кадра. Теперь контролировать видео стало легче.
🔹Magnific AI. Новый тип апскейла – Precision (точность) – предлагает настройки для улучшения качества изображений. Уровень резкости, улучшает края и текстуры, повышая визуальную ясность, но высокие значения могут сделать изображение искусственным. Умные края с низкими значениями (7% - 12%) сохраняют оригинальное зерно, подходящее для фотографий или пленки, а высокие значения добавляют художественный или экспериментальный эффект. Настройка Ультра детализация повышает фокусировку и четкость, но при высоких значениях могут появляться артефакты, такие как гало или сдвиги контрастности, что делает изображение более искусственным. В данный момент апскейл работает в 2X, с возможностью увеличения изображения несколько раз.
🔹 Hedra запустили Live Avatars — это технология, позволяющая анимировать 3D-аватары в реальном времени прямо в браузере без установки. Система синхронизирует мимику и движения головы по видео с камеры, работает быстро и точно, поддерживает реалистичные и стилизованные лица, и легко интегрируется через LiveKit API. Это решение идеально для ассистентов и онлайн-презентаций — при этом стоит всего ~$0.05 за минуту, что делает его в десятки раз дешевле аналогов.
🔹ChatGPT. Новость, скорее всего, не новая, но в GPT при редактировании изображений наконец-то улучшили консистентность. Раньше, если просил добавить усы на фото (как пример), то система помимо усов сильно меняла само лицо. Сейчас работает гораздо лучше и практически не изменяет исходное изображение.
Что у вас? Может что - то пропустил?
@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤1
Последнее время зарылся в какие-то эксперименты, которые не получается довести до конца.
И тут либо показывать то, что есть — потому что даже на этом этапе ИИ реально помогают в работе, либо ждать, пока инструменты доведут до рабочего состояния и уже показать в полную силу.🧐
Я выбрал второй вариант. Там реально неплохие штуки, и хочется показать их во всей красе.
Поэтому пачка постов уезжает на неопределённое время в стол.
Нормально. Едем дальше!💪
Чтобы немного перебить пустоту, покажу интересный способ, как сделать свой пак стикеров (в данном случае на основе своей фотографии).
Делается быстро и без особых проблем.
В Sora пишу такой промпт:
Этим мне Sora и нравится — можно просто писать как техническое задание, а не извращаться с промтингом.
Дальше прогнал через апскейлер. Мне нравится, как работает небольшая программка Upscayl, которая ставится на комп.
Чтобы вытащить что-то не очень шакальное — быстро, очень помогает.
В итоге получаем любой стикерпак за 10 минут.
Помню, как-то на один из проектов надо было делать стикеры для чата — на пак уходило пару дней. Сейчас, с ручными доработками, можно уложиться в полчаса - час.
Пользуйтесь!🔥 🔥 🔥
@VAI_ART
#VAI_Gallery
И тут либо показывать то, что есть — потому что даже на этом этапе ИИ реально помогают в работе, либо ждать, пока инструменты доведут до рабочего состояния и уже показать в полную силу.
Я выбрал второй вариант. Там реально неплохие штуки, и хочется показать их во всей красе.
Поэтому пачка постов уезжает на неопределённое время в стол.
Нормально. Едем дальше!
Чтобы немного перебить пустоту, покажу интересный способ, как сделать свой пак стикеров (в данном случае на основе своей фотографии).
Делается быстро и без особых проблем.
В Sora пишу такой промпт:
Серия стикеров в пиксель-арт стиле на основе референса. Туда войдут:
– шлёт поцелуй
– влюблённый
– злой
– задумчивый
– показывает язык
– смеётся
Расположи их в виде чёткой сетки с достаточными отступами по вертикали и горизонтали, чтобы стикеры не были обрезаны. Убедись, что стиль стикеров един для всего сета.
Сделай это всё на одном изображении и на прозрачном фоне.
Этим мне Sora и нравится — можно просто писать как техническое задание, а не извращаться с промтингом.
Дальше прогнал через апскейлер. Мне нравится, как работает небольшая программка Upscayl, которая ставится на комп.
Чтобы вытащить что-то не очень шакальное — быстро, очень помогает.
В итоге получаем любой стикерпак за 10 минут.
Помню, как-то на один из проектов надо было делать стикеры для чата — на пак уходило пару дней. Сейчас, с ручными доработками, можно уложиться в полчаса - час.
Пользуйтесь!
@VAI_ART
#VAI_Gallery
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤8👍6🔥2👌2