VAI – Telegram

💫

Вышла GPT-5 [блог]

• Гораздо точнее и быстрее отвечает, умеет думать сложнее, глубже понимает контекст.
• Сильно прокачан в программировании, может создавать красивые и работающие веб-приложения и игры
• Писать тексты стал не просто лучше, а с душой: стихи, рассказы, даже сложные структуры без шаблонов.
• В медицине теперь точнее, умнее, предупреждает о проблемах и помогает разбираться в сложных вопросах, но не заменяет врача.
• Может работать с картинками, видео и другими типами данных, понимает не только текст.
• Есть лёгкий режим для большинства задач и глубокое мышление для сложных вопросов. GPT сам решает, когда что использовать.
• Контекст до миллиона токенов
• Меньше галлюцинаций и не пытается угодить, а даёт честные ответы.

Важное:
• Бесплатные пользователи: базовый доступ, с ограничениями.
• Plus: больше запросов и возможностей.
• Pro: расширенное мышление, точные и глубокие ответы.
• Так же доступ через API.

GPT-5 доступен уже сегодня.

@tips_ai #news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤5

686 views17:24

VAI

Век живи — век учись!

🧐

Сейчас такое большое количество инструментов, что не успеваешь понять, куда их можно применить. Появилось что-то новое, а ты ещё и со старым не успел всё протестировать. Поэтому некоторые вещи, даже лежащие на поверхности, могут просто не замечаться.

Я периодически занимаюсь поиском людей на проект, и иногда это может занимать больше времени, чем хотелось бы. Сидишь вручную, перебираешь ArtStation, Behance и тд. в поисках кандидатов.

Так было и с последней вакансией. Сел я вечером поискать сотрудника на задачи и подумал: а почему бы не попробовать сделать это через ChatGPT? Написал запрос с определёнными условиями. Скинул ссылки сайтов где искать, чтобы получить список подходящих кандидатов. И на моё удивление — получилось! Через минуту у меня был список из 30 человек, подходящих под заданные условия. Отобрал тех, кто точно подходит, и написал сразу пятерым. Итого — 10 минут и 5 писем. А обычно на это уходили часы. 🔥

Как же круто, что при должном подходе сейчас можно оптимизировать очень многие процессы! Нужно лишь понимать инструменты и иногда включать голову. 🙃

Ну и речь не только про поиск кандидатов. Такой подход можно применить к чему угодно: хотите что-то купить на Avito или Ozon — задаёте условия поиска, и через минуту у вас уже есть отсортированный список нужного. Это может экономить часы, а порой и целые дни вашего времени. 🔥

P.S. Обложка была сгенерирована в GPT-5, по первым тестам он стал лучше генерировать изображения, но дольше раза в 2-3.

@VAI_ART
#VAI_Notes

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8🔥3❤1

651 viewsedited 07:18

VAI

Я вернулся! Отдохнул, надеюсь сил теперь хватит надолго! За 2 недели накопилось некоторое количество новостей. Давайте пройдемся по ним!

🔹Genie 3. Искусственный интеллект от Google, создающий интерактивные миры по текстовому описанию.
Google DeepMind представило третье поколение своей революционной модели искусственного интеллекта – Genie 3.
Эта модель способна генерировать полноценные интерактивные трехмерные миры на основе простого текстового запроса, открывая новые горизонты для создания игр, симуляций и виртуального опыта. В комментарии закинул как сгенерированные люди внутри симуляции мира гуляют по симуляции внутри симуляции (в которой вы можете погулять сидя в своей симуляции).

🔹Midjourney запустили режим HD Video для подписчиков Pro и Mega. Продолжают развивать свой видеогенератор и пополнять его новыми фишками.

🔹GPT-5 уже здесь. Делился ссылкой на него ранее.

🔹Также OpenAI разродились двумя опенсорсными моделями, на 120b и 20b параметров. Модели рассуждающие, но нет мультимодальности, картинки и тем более звук модели не воспринимают.

🔹Suno. Скоро запустит Suno–Studio. Многодорожечное создание, экспорт в MIDI и многое другое. Становится более гибким и делает вектор на профессионалов и управляемость.

🔹ElevenLabs. Запустили Eleven Music. Заходят на поляну Suno. Инструмент, который позволяет создавать музыкальные композиции по текстовому описанию.

🔹Minimax Speech 2.5. Генератор речи от Минимакс(TTS):
По сравнению с версией Speech 02, выпущенной в мае, Speech 2.5 обладает тремя новыми фишками:
более высокой выразительностью речи на нескольких языках, более реалистичным воспроизведением голоса и широким охватом 40 языков.

🔹Grok 4, видимо на фоне появления GPT-5 также открыл доступ для бесплатных пользователей. Одна из самых сильных языковых моделей, которая может так же в редактирование и генерацию изображений.

🔹Matrix-Game 2.0 - опенсорс ответочка на Genie 3 от Google. Генерирует контент в 25 фпс, про разрешение и качество скромно умалчивают.
Можно обучать на своих видосах и получать на выходе миры, размером под 7-8 гиг, по которым можно бегать.

🔹Wonder Studio. Облачная платформа для нейро мокапа, снова появился бесплатный тариф с 300 кредитами/мес, которых хватит на 15 секунд обработки живых кадров/анимации или 30 сек нейро мокапа.

🔹Rodin Gen-2. Пока не дали, но обещают что-то интересное в 3d генерации. Сегментацию геометрии, неплохие детали и полноценные текстуры.

🔹Tripo3d. Давно туда не заходил так как появились неплохо работающие 3d генераторы. Появилось много нового, например ретопология модели, но я тестил ретоп в Hunyuan 3d и там было пока все не очень. Тут же надо тестировать. А так значительно прокачал качество генерации 3D — теперь модели стали детальнее, особенно в лицах и сложной геометрии. В обновлении появилась возможность загружать собственные модели (glb, obj, fbx, stl), использовать улучшенный инструмент Pro-Refine для доработки геометрии и текстур.

🔹В Google добавили эксперементальный AI Mode
Теперь там есть Canvas: можно прямо внутри поиска собирать планы, списки дел, готовиться к поездкам и тд. Пишете промпт, жмете Create Canvas, и получаете набор структурированных карточек. Можно загружать свои файлы расписания, PDF, фотки.
Также появился Search Live: теперь можно показывать модели фотки, видео или сразу транслировать с камеры. Плюс система умеет делить сложные вопросы на подтемы и искать по каждому лучшие ответы с источниками.
Пока все тестируют в Штатах через Labs, но скоро будет доступно всем. В будущем обещают добавить интеграцию с Google Drive, рисовать графики по запросу и помогать с бронированиями.

🔹Higgsfield набирает обороты: ребята выкатили функцию Draw-to-Video — по сути видео-фотошоп, где можно загрузить картинку, нарисовать поверх стрелки и детали, а система сама оживит сцену. Плюс появился Product-to-Video: достаточно показать предмет и задать действие, и он превращается в кинематографичный ролик без лишних промптов. Работает со всеми топ-моделями (MiniMax, Veo 3 и тд). Скинул в комментарии пример.

И в конце будет небольшой опрос.

@VAI_ART
#VAI_News

❤4👍3

679 viewsedited 17:00

VAI

Нужна ли рубрика с новостями?

Anonymous Poll

Лёх, ну кто это будет читать? Кидай по одной новости, как нормальные люди

47 voters613 views17:00

VAI

Нашёл небольшую шпаргалку по свету для генераций. В комментариях прикрепил гугл-таблицу — можно просто скопировать и вставить себе в промпт.🔥

@VAI_ART
#VAI_Notes

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥11👌4❤3

653 viewsedited 10:58

VAI

Не GPT единым! Крутая новость!

🔥

Qwen(разработка Alibaba) вчера под вечер релизнули собственную Image Edit модель

Qwen Image 20B была выпущена 4 августа и является основной моделью. В свою очередь, версия Edit предназначена специально для редактирования изображений: изменения стиля, корректировки деталей, добавление или удаление объектов, а также изменение поз и других элементов.

Если кому то интересно веса и гитхаб .

Теперь у нас есть еще один опенсорсный редактор изображений, и судя по примерам, он вполне хороший. Пока, как я понял, кириллица не поддерживается в редактировании на самих изображениях, но думаю, со временем это добавят.

Так же можно попробовать в чате (в нем есть ограничения).

@VAI_ART
#VAI_News

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍4

819 views07:41

VAI

Решил рассмотреть одну достаточно простую тему — создание баннеров, карточек и тому подобного, что включает в себя сразу изображение и текст, используя референс.
Конечно, это не имеет прямого отношения к творчеству, но сам процесс достаточно простой. Плюс, не всегда можно быть очень креативным, а сам процесс отличается от подбора референсов и использования принципа "кради как художник" лишь тем, что благодаря современным инструментам это можно сделать значительно быстрее и проще. 🧐

В общем, расскажу, как легко создать что-то по уже готовому референсу.

Как это сделать:

● ищу подходящий референс — тот, который нравится и подходит под задачу
● загружаю его в ИИ, который может расшифровать изображение и разложить его на промпт. Я обычно использую GPTChat, но есть и куча др. сервисов. Дополняю запрос уточнениями, чтобы ИИ обратило внимание на важные детали, такие как цвет, композиция, которые мне нужны. Это улучшает результат
● переношу получившийся промпт и референс в Sora. Референс важен, потому что, помимо текста, он помогает Sora точнее ориентироваться и создавать результат, приближенный к нужному

И всё — на выходе получаем изображение, похожее на референс.

💪

Дальше, если нужно:

● хотите добавить текст? Просто указывайте его в описании или добавьте позже в Photoshop
● меняйте промпт, если хотите изменить цвет, форму и другие параметры
● добавляйте дополнительные объекты. Для этого можно использовать такие инструменты, как Flux Kontext, например, чтобы на изображение добавить именно то, что вам нужно
● небольшие правки руками в Photoshop или похожих программах
● пройдите апскейлером, и получите финальный дизайн

Этот процесс можно варьировать, настраивать и адаптировать под любые задачи, но главный плюс — минимальное время, которое вы затратите для достижения результата.

Берите на вооружение и пользуйтесь!

🔥

P.S. Оба изображение были сгенерированы.

@VAI_ART
#VAI_Practice

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤1

753 viewsedited 08:49

VAI

🟥

Новости на ночь!

Google открыл бесплатный доступ к Veo 3 — генератору видео, который наделал много шума.

На один аккаунт доступно всего 6 попыток, но, как мы знаем, чем больше аккаунтов, тем больше шансов 😉

Акция действует только в выходные. Если давно хотели протестировать Veo 3 — самое время.

👉 Попробовать можно здесь.

P.S. Я уже протестировал — всё работает. Нужен VPN.

@VAI_ART
#VAI_News

Please open Telegram to view this post

VIEW IN TELEGRAM

Gemini

‎Google Gemini

Meet Gemini, Google’s AI assistant. Get help with writing, planning, brainstorming, and more. Experience the power of generative AI.

👍5🔥3

673 viewsedited 19:04

VAI

Как я понял из опроса, большинству самых активных участников группы (кстати, спасибо за активность!) хочется, чтобы рубрика новостей была. Меньшая часть высказалась за то, чтобы новости публиковались по мере их появления.
У обоих вариантов есть свои плюсы и минусы. Поэтому я думаю попробовать вести единый новостной формат, но немного доработать его. Например, добавлять заголовки вроде «3D» или «Видеогенераторы», чтобы можно было сразу читать именно ту часть, которая интересна.
Так информация будет лучше структурирована, а всё новостное полотно за неделю станет проще воспринимать.

К новостям! Их не так много — разве что после прошлой недели, когда вышел генератор миров в Genie 3, внезапно прорвалось целое множество подобных решений. Но всё же давайте кратко пройдемся.

🔹Qwen выпустили опенсорсную модель, которая предназначена специально для редактирования изображений: изменения стиля, корректировки деталей, добавление или удаление объектов, а также изменение поз и других элементов.

🔹DeepSeek-V3.1. Наш любимый DeepSeek обновился до новой версии. Все давно ждут новое поколение этой LLM, но, если верить новостям, у ребят хватает проблем: от окупаемости (ведь модель опенсорсная) до перехода на новые чипы для обучения. Отдельная боль для китайцев — то, что американцы, почувствовав конкуренцию, начали жестко регулировать рынок чипов. Надеюсь, они справится со всеми трудностями и еще не раз нас удивит. А пока они немного подтянули и улучшили свою основную версию модели.

🔹В сети активно обсуждают новую модель для редактирования изображений, но пока никто не знает, откуда она появилась, кто её создал и главное — почему её назвали Nano Banana 🙂. По тестам, которые я видел, работает она очень неплохо: местами даже Qwen, GPTChat или Flux Kontext выглядят хуже.

Ждём объяснений и официальных заявлений. Пока же протестировать её можно только в одном месте. Это lmarena.ai-это публичная веб-платформа для независимого сравнения и оценки моделей через парное голосование сообщества.
Пользователи вводят один и тот же запрос двум анонимным моделям, выбирают лучший ответ — после чего раскрывается, какая модель победила, и рейтинг обновляется.

🔹Rodin Gen-2 вышел в бету. Один из неплохих 3д генераторов. Не смог найти только где запрос кидать на доступ. Если найдете, то кидайте)

🔹Kling 2.1. В крайней версии одного из самых лучших видео генераторов появилась возможность добавления первого и последнего кадра. На примерах, которые видел получается очень неплохой морфинг и переходы. Прикрепил один из примеров в комментарии.

🔹Runway. Одна из моделей для видео генераций. Видимо устали бороться с конкурентами и решили стать платформой(по типу Krea), на которой можно использовать и другие модели. Также выпустили свою версию создание игровых миров.

🔹Mirage 2. Реально работающий генератор игровых миров в браузере от компании Dynamics Lab, позволяющий создавать и исследовать 3D-миры в реальном времени на основе загруженных изображений. Система работает на текстовых промптах: вы можете начать, например, с пейзажа Дикого Запада, а затем с помощью команд преобразовать его в городской пейзаж. Mirage 2 поддерживает мультиплеер и позволяет сохранять и делиться игровыми мирами с другими пользователями.

🔹Worldlabs. Еще одна модель генерации миров, которая создает их из обычных изображений, выводя генеративный ИИ на новый, пространственный уровень. Пока в бэтке.

Да что говорить я даже в Hunyuan3d нашел возможность генерировать миры. Видимо какой то тренд, в общем как и писал неделя генераторов миров ).

@VAI_ART
#VAI_News

🔥5❤3👍2

798 viewsedited 12:29

VAI

Для тех, кто хочет запускать у себя опенсорсные модели, составил (исходя из рейтингов и своего опыта) два списка. 😎

Локальные приложения для запуска моделей на своём компьютере (удобно и без сложных настроек):

🔹 LM Studio — удобный UI для запуска LLM (LLama, Gemma, Qwen, DeepSeek и тд.) локально и приватно
🔹 Jan.ai — open-source чат-ассистент, работающий offline, который также позволяет запустить на своем компьютере разные опенсорсные модели
🔹 Ollama — простой локальный фреймворк с GUI и CLI, подходит для Mac/Windows/Linux

По локальным из списка также уже есть приложения с предустановленными моделями. Т.е. вам даже искать ничего не надо. Нашли нужную модель в списке - нажали скачать - можно пользоваться.🔥

Сервисы облачных GPU по API:

🔹 Runpod — облачная платформа для запуска AI-моделей с GPU за пару минут
🔹 Vast.ai — маркетплейс аренды GPU
🔹 Immers.cloud — облачные серверы с RTX и Tesla, посекундная тарификация и отличная производительность

Так как ИИ требует серьёзных вычислительных ресурсов, сторонние сервисы предоставляют свои мощности в аренду. У них есть разные тарифы, и это очень удобно, если нужно сделать что-то быстро и относительно недорого. Сразу скажу: это не реклама, а реально работающие и полезные сервисы, которые могут помочь в работе.

Пишите, если знаете ещё хорошие и достаточно простые способы устанавливать и использовать опенсорсные решения в области ИИ. 🤔

@VAI_ART
#VAI_Notes

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🔥3👌1

930 views08:09

VAI

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Может быть боян, но я в отпуске насохранял себе интересных новостей, вывалю их на вас, возможно кто-то не видел.

Интересная ИИ-фишка теперь есть в Adobe Illustrator - называется Turntable.

То есть можно поворачивать ПЛОСКИЙ вектор в 3Д! Вокруг своей оси.
ИИ дорисует третье измерение (бока, спину).

Работает неидеально, контура иногда дрожат или едут, но сама фишка удивляет.

Ну и конечно, лучше брать нейтральный фон (отсутствие оного), четкие контуры и простые объекты, которые были в датасете для обучения.

@cgevent

🔥5👍3❤1👌1

950 views12:06

VAI

This media is not supported in your browser

VIEW IN TELEGRAM

🟥

🟥 Сегодня разошелся 😀. Но не могу не поделиться еще одной новостью.

Писал в новостях за прошлую неделю про редактор изображений под названием Nano - Banana.

Nano Banana — это новая модель от Google (все таки Google, долго шифровались) для редактирования изображений с помощью искусственного интеллекта. Она позволяет не только создавать картинки с нуля по описанию, но и аккуратно редактировать уже готовые фото: менять детали, добавлять или убирать объекты, комбинировать два изображения. Главное — она хорошо понимает текстовые запросы и сохраняет важные детали (например, лицо человека или стиль сцены).

Сам еще много его не тестировал. По первым тестам достаточно неплохо редактирует изображения.

Из плюсов выкатили его бесплатно (скорее всего с ограничениями). Из минусов нужен VPN (желательно США или Канада).

Если кто-то потестит его, выкладывайте свои результаты.

Смотреть тут.

Ну и сервисы вроде Krea и других тоже начали внедрять к себе. Если у кого-то есть доступ — можно попробовать..

@VAI_ART
#VAI_News

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥2

1.75K viewsedited 14:52

About

Blog

Apps

Platform