VAI
3.01K subscribers
441 photos
76 videos
4 files
124 links
15 лет в компьютерной графике, 6 лет - арт-директор.
Работал над десятками проектов.
Изучаю ИИ для развития и собираю здесь свой опыт, находки и эксперименты.
Присоединяйтесь!
Личный контакт - @AlexBakakin
Boosty - boosty.to/vai_art

AI l ИИ
Download Telegram
Конец недели — а значит, подводим итоги того, что вышло интересного. На самом деле в мире ИИ произошло не так много, но зафиксировать это всё же стоит.

🔹OmniHuman-1.5. Это новая модель для создания анимированных цифровых персонажей. Она может оживлять героя по фото, голосу или тексту: синхронизирует губы, подбирает жесты и мимику, делает движения плавными и осмысленными. В отличие от прошлых решений, OmniHuman-1.5 понимает контекст речи и эмоции, поэтому персонаж реагирует естественно: может петь, жестикулировать или взаимодействовать с другими героями в кадре, оставаясь при этом похожим на оригинал на протяжении всего видео.

🔹PixVerse V5. Это новая версия для создания видео из текста или картинок, которая делает видео более кинематографичными: движения стали плавнее и естественнее, картинка — чётче и реалистичнее, а цвета и стиль — стабильнее между кадрами. Он также хорошо понимает ваши инструкции, быстро генерирует ролики и теперь помогает легко создавать короткие истории, мемы или рекламу — не только для профессионалов, но и обычных пользователей

🔹Higgsfield добавили инструмент UGC Factory. Это новый инструмент от Higgsfield для автоматизированного создания стилизованного пользовательского видеоконтента. Он позволяет по простому шаблону выбрать сцену, загрузить изображение продукта или персонажа, а затем с помощью модели Nano Banana автоматически создать видеокадры с разными углами, композицией и вариациями. В результате вы получаете сразу серию keyframes для UGC-рекламы, с сохранённой целостностью логотипов и форм, синхронизированным голосом, движением и фоном. Особенно удобно для промороликов, обзоров и рекламных вставок без полноценной съёмки

🔹 Tencent представила HunyuanWorld-Voyager. Отголоски прошлой недели. Писал об это ранее. Так как увидел на сайте возможность генерации и прогулки по мирам. Но видимо официальный релиз случился только на этой неделе. Это ИИ, который из одной фотографии делает короткое видео с иллюзией 3D-движения камеры. Он одновременно генерирует картинку и карту глубины, а затем накапливает «мировой кэш» из точек, чтобы новые кадры выглядели согласованными при смене угла обзора. Настоящего 3D-мира внутри нет — это скорее умное подстраивание картинок, которое позволяет «ездить по фото» и создавать ощущение объемной сцены, хотя на деле это последовательность кадров, поддерживаемая точечными облаками. Закинул в комментарии презентацию.

🔹В Midjourney появилась новая вкладка Styles — это библиотека визуальных стилей, которые можно просматривать и применять к изображениям. Во вкладке доступны популярные и случайные стили с примерами, каждый из них подключается к промпту через параметр --sref. Понравившиеся варианты можно сохранять для дальнейшего использования, что упрощает поиск нужного визуального настроения и ускоряет работу с генерацией.

🔹Qwen3-Max-Preview. Это новая, мощная языковая модель от Alibaba с потрясающими характеристиками: у неё более 1 триллиона параметров, и она легко справляется с очень длинным контекстом (до ~262 000 токенов). Модель невероятно быстро отвечает, отлично подходит для сложных логических задач, программирования и работы сразу на английском и китайском языках. К сожалению, она закрыта (не опенсорс), и работает через платные API, но по качеству и скорости сравнима с лучшими коммерческими моделями вроде Claude и GPT. Можно попробовать тут и тут.

🔹 ElevenLabs. Вышел SFX v2: новая версия модели для генерации звуковых эффектов. Обновленная версия генератора звуковых эффектов. Теперь система создаёт звук студийного качества, намного лучше понимает текстовые описания и может генерировать эффекты, которые плавно зацикливаются без слышимых переходов. Улучшены алгоритмы, поэтому стало меньше артефактов, звук звучит естественнее и детальнее, а у пользователя появилось больше контроля над результатом. Это делает SFX v2 удобным инструментом как для профессионального саунд-дизайна, так и для быстрых креативных задач

P.S. Если думали, что я не заметил, то я заметил. Очень рад видеть вас всех тут. Завтра познакомимся 😉.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍158
Всем привет! Давайте еще раз понакомимся.

Я рад видеть тут столько новых и крутых людей! Думаю, чтобы было понятнее, что тут происходит, стоит немного написать о себе и о том, что я делаю.

Зовут меня Алексей, и я занимаюсь компьютерной графикой сколько себя помню. На днях исполнилось 15 лет с того момента, как я устроился на свою первую работу. Срок вроде бы большой, а по ощущениям всё ещё нахожусь где-то у подножья этой горы. Я много лет работал сначала над браузерными, а потом над мобильными играми. За плечами есть и несколько крупных проектов на ПК. Сейчас я ушел в сферу VR. Мы делаем шутер со свободным перемещением.

За эти годы я прошел путь от моделлера до арт-директора. Путь был долгий и извилистый, но я тут.

И за всё это время огонь внутри не погас. Я всё так же горю желанием двигаться вперёд и развиваться. Поэтому тяга узнавать новое так и осталась со мной. Появление ИИ стало для меня настоящим глотком свежего воздуха, как будто выпил энергетик🔥. Поэтому впился и очень много свободного времени посвящаю изучению этой темы.

Эта группа появилась как способ структурировать знания и вместе с тем обмениваться опытом и навыками. Хочется создать сообщество, где соберутся такие же увлеченные и горящие люди, с которыми будем вместе двигаться вперед!

Спасибо за доверие. Не подведу! ❤️

P.S. Я вижу, что вы пишете, но пока не успеваю ответить. Сейчас у меня аврал, нужно многое сделать и сдать. Но как только смогу, то обязательно всё прочитаю и отвечу.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2911👍4🤩1
🟥🟥🟥MiniMax запустил бесплатную неделю с 10 по 17 число. Hailuo - это один из лучших видеогенераторов, так что если хотели попробовать - самое время! Надо будет найти время и тоже по генерировать. 🤓

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111
Один из топовых 3D-генераторов Hitem3D обновился до новой версии. Обещают более высокое качество, а также добавили генерацию текстур. На бесплатном тарифе дают 100 кредитов, при этом одна генерация в новой версии стоит 40. Также 10 еще возьмет за генерацию текстуры. Развертка все еще оставляет желать лучшего. Как обычно - чем больше аккаунтов, тем больше возможностей. 🙂

Первые тесты показали, что результат действительно выглядит хорошо. Прибавилась детализация и формы стал контролировать намного лучше.

Ранее я уже сравнивал качество генерации тут. Можете сравнить старого и нового Логана. Я думаю разница сразу видна.

Хуже простраивает заднюю часть, даже по соотношению с предыдущей версией, но думаю поправят.

Судя по всему Hitem3D, на данный момент становится лучшим генератором моделей. Но нужно еще поковырять его.

Нужны более подробные тесты?

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9💯52🔥1
Пока я в запарах по проекту и пишу новые посты, давайте обсудим одну интересную тему. А именно - получится ли у ИИ заменить людей в процессе создания, на примере творчества? 🧐

Лично моё мнение: ИИ помогут убрать рутину в среднесрочной перспективе. Но даже это произойдёт не так скоро, чтобы полностью закрыть все рутинные задачи. А вот творчество они не заменят. Пока ИИ умеют только копировать - и делают это всё лучше, но всё же это остаётся копированием. Придумать что-то новое они пока не способны, и даже в будущем это будет для них сложной задачей.

Я также думаю, что не стоит бояться массового сокращения рабочих мест. Скорее всего привычные нам сейчас специальности трансформируются во что-то новое. Да, в любом трансформационном процессе кто-то пострадает, но чтобы не оказаться в этой группе, важно оставаться гибким и изучать новые направления и инструменты. Тогда шансы остаться востребованными вырастут в разы.

И нужно помнить: за всю историю человечества это далеко не первая техническая революция.

Уже жду момента, когда появятся темы вроде полностью хендмейд модель или рисунок, поэтому он стоит дороже. Представьте времена, когда разработчик будет гордиться тем, что игра создана полностью людьми, без применения ИИ и других технологий. Экологичная хендмейд-игра с зелёной наклейкой, звучит интересно. Думаю, такая ниша тоже найдёт своё место. 😎

Интересно ваше мнение. Что думаете по этому поводу?

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83👎2🤝2
Конец недели, а это значит у нас постоянная рубрика — новости недели. Пробежимся быстро по основным релизам.

🔹 Думаю, одной из главных новостей недели обновленная версия Seedream 4.0. Позволяет редактировать и генерировать изображения. По редактированию многие ставят как конкурента недавней Nanobanana. Как по мне неплохая сеть, но все же банана будет получше.
Создаёт картинки в 2K меньше чем за 2 секунды, поддерживает до 6 референсов для сохранения стиля или персонажей, умеет масштабировать до 4K, а также по простым текстовым командам можно менять фон, свет, стиль или убирать лишние объекты. Не бесплатная, уже доступна на всех агрегаторах по-типу Krea и тд. Презентация в комментариях.

🔹 Kling AI Avatar инструмент, который позволяет из одной фотографии и записи голоса сделать говорящего, эмоционального аватара: он синхронизирует губы, мимику, жесты, автоматически подбирает выражения и стиль речи. Поддерживается множество языков, высокое качество видео (HD / 1080p), всё работает быстро — идеален для социальных сетей, объяснительных роликов, маркетинга и даже образований. Презентация в комментариях.

🔹 В ближайшие недели YouTube запускает ИИ-дубляж видео на русский и другие языки. Будет доступно 30 языков.

🔹 EbSynth — это программа для создания визуальных эффектов, позволяющая изменять видео, редактируя один кадр. Не смотрел, но по презентации, которую скинул в комментарии, выглядит очень достойно.

🔹 Gemini теперь позволяет загружать аудиофайлы — подкасты, интервью, записи встреч и автоматически транскрибировать и суммировать их. То есть можно просто перетащить, например, двухчасовой MP3 и попросить выдавать ключевые моменты. Это уже доступно как часть функции Audio Understanding.

🔹 NotebookLM теперь переводит любой документ в подкаст или презентацию, а с обновлением добавили новые режимы генерации: можно выбрать краткий пересказ (Brief), подробный разбор (Deep Dive), критику текста (Critique) или даже сгенерированный «дебат» с аргументами за и против (Debate). Появились также Quiz и Flashcards — тесты и карточки для закрепления материала. И главное—видеопрезентации с озвучкой теперь работают на русском и ещё 80 языках.

🔹 Hitem3d обновился до новой версии. Писал тут про него. Тесты сделаю. Думаю, завтра все выложу.

🔹Qwen-3-ASR — новая модель для распознавания речи с очень высокими показателями точности. Она умеет автоматически определять язык и поддерживает английский, китайский, русский и ещё девять языков. Важная особенность — возможность подключить кастомный словарь: можно загрузить список имён, терминов или даже выдуманных слов, и модель начнёт корректно их распознавать без дополнительного обучения. В релизе особенно подчёркивается универсальность: система одинаково хорошо справляется и с обычной речью, и с нестандартными аудиозаписями. Единственный минус — веса пока не выложили, модель доступна только через API. Если же их опубликуют, это может стать отличным опенсорс решением для проектов по преобразованию речи в текст. Попробовать можно тут.

🔹Claude теперь умеет не только читать, но и создавать и редактировать файлы: PDF, таблицы, презентации и документы. Можно загрузить данные или текст, а Claude сам превратит их в готовый отчёт, таблицу с формулами или презентацию с графиками, а также конвертировать форматы. Всё это работает прямо в чате, доступно пока в планах Max, Team и Enterprise и позволяет быстро анализировать данные, строить визуализации и выпускать финальные материалы без перехода в сторонние редакторы

🔹Ну и ещё одна интересная новость от Apple: в новые AirPods добавили функцию синхронного перевода. Пока непонятно, насколько хорошо она работает, но сама идея звучит круто. Похоже, скоро языки можно будет и не учить—всё будет автоматически переводиться на нужный, а языковые барьеры начнут стремительно исчезать.

На этой неделе появились новые видео генераторы, и генераторы изображений. Но, думаю, об этом уже нет смысла подробно писать—рабочих решений и так очень много. Поэтому дальше буду рассказывать только о тех новинках, которые действительно чем-то выделяются.

@VAI_ART
#VAI_News
1👍105🔥1
Сделал быстрые тесты нового Hitem3D v1.5. Что можно сказать: по сравнению с предыдущей версией, как уже писал, он действительно стал лучше держать форму, добавили детализации и, самое главное, появились текстуры.

Из минусов - иногда детализация оказывается излишней и превращается в шум. На портретах форму лучше держит Sparc3D, а пальма выглядит аккуратнее в Hunuan3D - именно из-за того, что в Hitem3D детализация начинает портить меш и работает не в его пользу.

В целом это хорошее обновление, инструмент можно использовать для работы.

Интересно, что ситуация похожа на 2D-генераторы: под каждую задачу приходится выбирать отдельный ИИ - один лучше в одном, другой в другом.

Сейчас собираю прототип локации, и постоянно приходится переключаться между сервисами. Хочется уже чего-то универсального, а не десятки инструментов, которыми приходится жонглировать. Кстати, часть объектов сделал вообще в Tripo3D - неожиданно, но на определенных задачах версия 2.5 (последняя 3-я версия) показала себя лучше остальных ИИ.

@VAI_ART
#VAI_Practice
👍84🤝2
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥Последнее время заметил одну тенденцию: как только на рынке появляется какой-то новый инструмент, в ближайшие недели появляется куча аналогов. Причём работающих достаточно неплохо. С чем это связано — непонятно. Либо индустрия ИИ смотрит в одну сторону, и это просто совпадение. Либо на волне хайпа другие студии тоже пытаются отхватить немного внимания. Но во втором случае возникает вопрос: почему инструменты получаются достаточно качественными? Ведь за неделю вряд ли можно сделать что-то нормальное.

Это я к чему. Banana вышла всего две недели назад, а за это время уже появился третий инструмент с редактированием и неплохим качеством. На прошлой неделе вышел Seedream 4.0 — ИИ от TikTok. А вчера Reve обновилась и теперь тоже заявляет, что умеет редактировать. И, судя по примерам, делает это неплохо. (Если кто забыл, писал о ней вот тут.). Под капотом Claude для лучшего понимания запросов.

В отличие от Seedream 4.0, у Reve есть бесплатные генерации.

Пробуйте!

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥Ну, чтобы сразу не отходить, вышел Hunyuan3D в версии 3.0. Давно его ждал. 😱

Hunyuan3D 3.0 от Tencent — новая версия генератора 3D-моделей, которая значительно повысила точность геометрии (заявляют рост качества в три раза по сравнению с предыдущими версиями) и теперь доступна через комплексное решение Hunyuan 3D Studio, позволяющее пройти весь путь от концепта до анимации. Инструмент нацелен на то, чтобы удешевить и ускорить классический 3D-пайплайн, предлагая создание более детализированных ассетов и снижение ручной работы.

Когда это все тестировать, чисто риторический вопрос)

Тесты нужны?)

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥21
Конец недели, снова подводим итоги. Последние недели были очень загруженными — нужно было сделать много всего. Сейчас легче не стало, но, по крайней мере, основную часть работы я уже сделал. За это время попробовал в работе много новых инструментов. Постараюсь на следующей неделе подробнее рассказать, что и как получилось — опыт оказался очень интересным.

И так, на неделе было:

🔹 Многими любимый и в то же время многими не любимый ComfyUI решил выйти в онлайн. Поддерживается работа на мощных GPU — то есть теперь можно будет пользоваться им удалённо, на мощном железе, и, конечно же, не бесплатно .🙂 Пока доступен только лист ожидания.

🔹 Вышла новая версия Hunyuan3D — обновились до третьей. Улучшили передачу форм, повысили детализацию. В целом, один из самых сильных ИИ для 3D продолжает радовать и развиваться. Писал выше о нем.

🔹 Reve обновлял сайт и модель, которая теперь может и в редактирование изображений. Писал тут.

🔹 Luma Dream Machine представили новую модель генерации видео.Ray3 — это новая видеомодель, которая сочетает логическое мышление с генерацией HDR студийного уровня. Поддерживает 4K HDR (10–16 бит). Ray2 в свое время показывал неплохой результат в анимации. Я почитал людей, которые шарят за эту тему и по их словам модель разочаровала.

🔹 Mozart AI. Новый музыкальный сервис умеет генерировать и редактировать треки по текстовому промпту, референсу или кусочку аудио, поддерживает выбор провайдера (ElevenLabs или SongGen), создание отдельных партий и даже импровизацию на выделённом участке. В качестве референса можно указывать конкретного исполнителя или песню (правда, с «опасными» вариантами вроде RHCP иногда пусто). Внутри есть библиотека сэмплов и простая DAW с мультитреком и фильтрами. Экспорт доступен в WAV и MIDI с глубиной 16/24/32 бит, стемы обещают позже. На старте дают миллион кредитов, и после генераций баланс всё ещё полный — фактически сервис бесплатный. Закинул в комментарии презентацию.

🔹 Ну и сразу следующая новость. Suno, один из лучших ИИ в области музыки, скоро обновится до пятой версии. Очень интересно, какие новые возможности они добавят.

🔹 OpenAI выпустили GPT-5 Codex. Создана специально для программистов. Она умеет быстро и точно писать код по описанию, находить ошибки, предлагать улучшения, делать полноценный код-ревью и даже анализировать большие проекты. Codex поддерживает разные уровни сложности задач: может выдавать быстрые ответы на простые запросы или глубоко анализировать сложные системы. Работает в связке с IDE, терминалом и другими инструментами разработчиков, что делает его мощным помощником в реальных проектах.

🔹 Lucy Edit . Очередной редактор видео, но лично на мой взгляд вся технология еще настолько сырая, что годится только для создания локальных мемов. В комментария добавил презентацию.

🔹 Wan 2.2 14B Animate . Модель видео-диффузии от Wan AI, которую научили анимировать персонажей: ты даёшь фото персонажа + видео с движениями, и модель либо заставляет фото персонажа двигаться как в видео, либо заменяет персонажа в видео твоим персонажем. Она умеет точно копировать выражения лица и движения, сохранять стиль освещения и цвета сцены, что делает результат выглядящим натурально и красиво. С виду работает хорошо. Презентация в комментариях.

Может что-то упустил? 🤔

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
👍72🔥1🎉1
Последние несколько недель очень занят, уже писал, оправдываю пустоту тут в постах).

Хочу сделать пару заметок. Пока не могу показать сам результат, так как он не личный, а коммерческий.

Мы взялись делать новую игру, и раз уж всё новое, то решили начать применять процессы, выстроенные максимально через ИИ. Надо же когда-то начинать.

Было много интересного. Например, я первый раз получил полноценный концепт локации через генерации. Раньше ИИ делали кашу из объектов, и сложно было сделать что-то логичное. Но тут при использовании Sora и NanoBanana всё получилось. Не идеально (думаю, если ещё помучить его, можно было сделать прям хорошо, но я не стал заморачиваться), в любом случае лично для меня это прорыв.

Дальше персонажи и концепты. Сразу скажу, что мы немного пробовали делать концепты с разными художниками, но не очень получалось. Тут, возможно, мой косяк, так как не смог полностью передать идею. В связке Sora и Banana всё получилось. Более чем хорошо, лично я результатом концептов персонажей доволен. К посту прикреплены одни из получившихся.

Ну и самое интересное для меня, так как я изначально 3D-шник, это было попробовать всё это сгенерировать в 3D.

По персонажам было смоделировано тело, так как тела имеют одинаковый размер, и это важный момент. Но тут один раз сделал, и дальше немного меняй типы лап и т.д. Головы же генерировал, и они получились отлично. Мимика, характер, попадание - очень хорошие. Это один из самых важных моментов: попасть в характер, всё остальное уже больше технические моменты.

Ну и, соответственно, локация. Прототип был собран за 2 недели. Это от идеи «давайте начинать делать» и до финала. Все объекты с концепта получилось сгенерировать: что-то проще, что-то сложнее, некоторые вещи пришлось делить на подобъекты. Но всё получилось. А с умной ретопологией от Hunuyan и Tripo даже получилось сетку оптимизировать. Развёртка - да, всё ещё плохо. Но тут можно переразвёрнуть и перезапечь с одной модели на другую, то есть проблема не критичная. Конечно это все надо будет доводить до ума. Если получится, то покажу все как доработаем и выпустим.

Итого: 2,5 недели - и есть рабочий прототип локации и два персонажа. Раньше, если бы мне кто-то сказал про такое, я бы пальцем покрутил у виска, а сейчас это наши реалии. И инструменты будут только развиваться.

Ещё момент: часто читаю, что что-то не получается, и поэтому инструмент 💩. Но писал об этом уже давно, ещё раз продублирую: ИИ - это не волшебная палочка, а инструмент, который нужно изучать. Часто многие забывают про это.

Нужны более подробные разборы процессов?

P.S. Всем замечательных выходных! ❤️

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍22🔥136💩2👌1
Прошла неделе, а это значит, что подводим итоги. Неделя была неплохая по релизам, давайте кратко пройдемся.

🔹Вышла новая модель Qwen-3-Omni. универсальная модель от Alibaba, которая понимает и генерирует текст, работает с изображениями, кодом, а ещё умеет воспринимать аудио и видео. Проще говоря, это «всё-в-одном» ИИ, который может анализировать разные типы данных одновременно: от обычного текста и картинок до голосовых сообщений и видеороликов. Модель сделали быстрой и компактной, чтобы её можно было запускать не только в облаке, но и локально. Попробовать можно тут.

🔹 Kling обновился до версии 2.5. Сейчас обещают создание более плавные и реалистичные видео по тексту или картинке. Улучшенную передачу движения, сделали анимацию естественнее и добавили поддержку высокого качества кадров. Проще говоря, Kling 2.5 позволяет быстро получить сочные, кинематографичные ролики, которые выглядят ближе к настоящим, а не к «сырой» анимации из прошлых моделей. По тестам, что я видел, не все так гладко. Презентация в комментариях. Также закинул пример нейрогимнастики, которая теперь выглядит достаточно неплохо.

🔹 Suno, который и так впереди всех конкурентов на голову, обновился до версии 5.Это модель, которая умеет генерировать полноценные песни по текстовому запросу, референсу или загруженному фрагменту трека. В новой версии улучшили качество звучания, вокал стал более живым, а аранжировки — разнообразнее. Проще говоря, Suno 5 делает музыку ещё ближе к профессиональной студийной записи, так что экспериментировать с созданием треков стало удобнее и интереснее.

🔹 Вышла новая версия открытой модели Wan 2.5. это обновлённая версия генератора видео от Wan AI, которая стала быстрее и стабильнее, а главное — научилась выдавать более детализированные и плавные ролики. Модель лучше справляется с движением персонажей, камерой и сложными сценами, сохраняя целостность объектов и стиля. Проще говоря, Wan 2.5 позволяет получать качественные кинематографичные видео, которые выглядят естественнее и ближе к настоящей съёмке. Можно протестировать тут.

🔹За последнее время обновились все топовые генераторы по 3d. Так произошло и с Rodin Gen-2. Это модель для 3D-генерации, которая умеет превращать изображения или текстовые описания в полноценные трёхмерные объекты с формой и текстурами. В новой версии улучшили детализацию, сделали геометрию чище и добавили больше реализма в материалы. Проще говоря, Rodin Gen-2 позволяет быстро получать готовые 3D-модели для игр, анимации или визуализации без долгого ручного моделинга.

🔹 ИИ понемногу переходят в целые сервисы, которые обещают полностью закрывать потребности в своей сфере. Так произошло с Hunyuan Studio и Suno Studio. Первые обещают закрывать полный пайплайн по 3d, вторые по созданию музыки/песен. Пока выглядит сомнительно, но по крайней мере понятно направление куда это все планирует развиваться. Закинул обе презентации в комментарии.

🔹 HunyuanImage 3.0 — это новая версия генератора картинок от Tencent, которая стала работать быстрее и точнее: изображения получаются более детализированными, с лучшей анатомией и естественным светом. Модель поддерживает разные стили — от реализма до анимации, умеет работать с текстовыми описаниями и референсами. Проще говоря, HunyuanImage 3.0 позволяет создавать более качественные и «живые» картинки без долгих доработок. Протестировать можно тут.

🔹 Google выпустили инструмент "Learn Your Way". Это персонализированный репетитор, который поможет вам усвоить любую тему. Протестировать можно тут.

🔹 OpenAI в ближайшее время грозятся выпустить несколько новых продуктов. Все оч. ждут Sora 2. Надеюсь так оно и будет. Так как Sora уже под устарела, а работает очень хорошо.

🔹 Один из проектов, которые OpenAI обозначили это ChatGPT – Pulse. Новая функция от OpenAI, которая делает ChatGPT не просто «на запрос», а сверх-ассистентом: каждый день модель сама собирает по твоим разговорам, подключённым приложениям (календарь, почта) и интересам визуальные карточки с полезными обновлениями — новости, идеи, напоминания. Пока только на Pro аккаунтах.

@VAI_ART
#VAI_News
👍96
Вчера было немного времени, посидел с позами. Как же круто, что не нужно ничего выставлять - просто говоришь «поставь в такую позу», и он делает. Да, некоторые детали могут теряться, но в целом это всё равно очень круто.

Показал примеры и решили попробовать поставить детских персонажей в позы персонажей из другой нашей игры. Ну я и попробовал - всё работает.

Оружие я подгрузил отдельной картинкой и попросил заменить.

Как же это всё упрощает жизнь!

И речь не только про концепты же. Нужна на фотографии другая поза. Закинул пример и все готово 🫡.

@VAI_ART
#VAI_Notes
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83👎1🤯1
🟥🟥🟥Король умер - да здравствует новый король! Вышел Claude 4.5 Sonnet. По таблице видно, что он обходит все предыдущие модели, даже GPT-5.

Платный и нужен VPN.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1
Media is too big
VIEW IN TELEGRAM
🟥🟥🟥 Вышла Sora 2!

Большую часть своей работы я делаю на базе генератора изображений в Sora. Будет очень интересно посмотреть, на что способна новая версия. Если ее довезут)

Качество видео очень сильно прокачали. Добавили генерацию звука, липсинг и тд. Уровень, конечно, нужно еще будет тестировать. Так как после первой версии остался маленький осадок. Когда они выкатили очень сырую версию.

Пока США и Канада.

@VAI_ART
#VAI_News
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍43🥴2