Please open Telegram to view this post
VIEW IN TELEGRAM
😁50🤣15👍7❤1
OpenAI улучшила генерацию изображений: текст и детали стали точнее
Это не DALL-E, а новая система, работающая по другому принципу. [Источник]
Разберем по пунктам:
🔘 Точность генерации выросла: модель правильно привязывает цвета, формы и другие атрибуты к объектам. Если раньше нейросети путались с 5–8 элементами, теперь GPT‑4o может обрабатывать до 10-20 различных объектов.
🔘 Текст в изображениях — проблема всех генераторов, но и здесь сделали рывок. Подписи, схемы, комиксы, меню ресторанов — текст наконец-то стал читаемым и понятным.
🔘 Метод генерации отличается: вместо диффузионных моделей используется авторегрессионный подход, который создает изображение поэтапно. Это позволяет улучшить детализацию и рендеринг текста, но увеличивает время генерации.
🔘 Можно загружать изображения, дорабатывать их, уточнять детали — модель учитывает контекст чата и предыдущие запросы.
Обновление уже раскатывают пользователям Plus, Pro, Team и Free. API для разработчиков — скоро. Проверяем [тут]
⚠️ Видео переведены.
UPD: у кого в ChatGPT не появилась функция - она переехала в [Sora]
@tips_ai #news
Это не DALL-E, а новая система, работающая по другому принципу. [Источник]
Разберем по пунктам:
Обновление уже раскатывают пользователям Plus, Pro, Team и Free. API для разработчиков — скоро. Проверяем [тут]
UPD: у кого в ChatGPT не появилась функция - она переехала в [Sora]
@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31🔥12❤11
Tips AI | IT & AI
OpenAI улучшила генерацию изображений: текст и детали стали точнее Это не DALL-E, а новая система, работающая по другому принципу. [Источник] Разберем по пунктам: 🔘 Точность генерации выросла: модель правильно привязывает цвета, формы и другие атрибуты к…
Помимо вчерашней обновы, OpenAI [открыли] бесплатную онлайн-платформу с курсами по ИИ.
В ней есть:
– Вводные уроки для новичков
– Гайды по промт-инжинирингу
– Курсы по разработке собственных моделей
– Материалы о карьере в сфере ИИ
Платформа будет регулярно пополняться новыми курсами, а также вебинарами и очными мероприятиями.
Среди партнеров — университеты, некоммерческие организации и компании.
| Ссылка на [платформу].
@tips_ai #news
В ней есть:
– Вводные уроки для новичков
– Гайды по промт-инжинирингу
– Курсы по разработке собственных моделей
– Материалы о карьере в сфере ИИ
Платформа будет регулярно пополняться новыми курсами, а также вебинарами и очными мероприятиями.
Среди партнеров — университеты, некоммерческие организации и компании.
| Ссылка на [платформу].
@tips_ai #news
🔥29👍12❤7
Gemini 2.5 Pro — новая «рассуждающая» экспериментальная модель от Google
Вчера практически в одно и то же время с OpenAI Google релизнули Gemini 2.5 Pro [Источник].
В рейтинге [LMArena] вышла на первое место с 1443 баллами. Прошлые лидеры рейтинга — Grok 3 и GPT-4.5.
Главные особенности:
🔘 В самом сложном бенчмарке [Последний экзамен человечества] Gemini 2.5 Pro набирает 18,8% — «размышляющая» версия Gemini 2.0 набирала всего 7,2%, o3-mini-high — 14%.
🔘 Gemini 2.5 Pro опережает всех в точных науках и математике и показывает как минимум сопоставимые результаты в программировании.
🔘 Контекстное окно — 1 млн токенов (около 2-2,5 тыс. страниц PDF), разработчики планируют расширить его до 2 млн токенов.
🔘 Модель может обрабатывать аудио и видео, понимает изображения, но генерировать картинки не умеет.
🔗 Gemini 2.5 Pro уже доступна бесплатно в [Google AI Studio].
@tips_ai #news #tools
Вчера практически в одно и то же время с OpenAI Google релизнули Gemini 2.5 Pro [Источник].
В рейтинге [LMArena] вышла на первое место с 1443 баллами. Прошлые лидеры рейтинга — Grok 3 и GPT-4.5.
Главные особенности:
@tips_ai #news #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥9❤7
Midjourney V7 выйдет на следующей неделе.
Честно, не понимаю, как они собираются держаться на плаву и тем более без API. Единственная надежда — сверхкачество.
Но вы видели цены за их подписки? $30 в месяц за 15 часов генераций в Fast time и безлимит в Relax Mode (это только standard plan). А за $20 в GPT тебе и Sora без ограничений, и генерация картинок с хорошим качеством прямо в диалоге и выбор разных моделей под задачи text2text с deepresearch.
При этом у Midjourney до сих пор сложные промты — я, например, так и не разобрался, как их писать без шаблонов. Посмотрим, чем ответят.
@tips_ai
Честно, не понимаю, как они собираются держаться на плаву и тем более без API. Единственная надежда — сверхкачество.
Но вы видели цены за их подписки? $30 в месяц за 15 часов генераций в Fast time и безлимит в Relax Mode (это только standard plan). А за $20 в GPT тебе и Sora без ограничений, и генерация картинок с хорошим качеством прямо в диалоге и выбор разных моделей под задачи text2text с deepresearch.
При этом у Midjourney до сих пор сложные промты — я, например, так и не разобрался, как их писать без шаблонов. Посмотрим, чем ответят.
@tips_ai
👍36🔥8🫡5🗿3
This media is not supported in your browser
VIEW IN TELEGRAM
Китайцы выпустили мультимодальные модели QVQ-Max и Qwen2.5-Omni
🗺 [QVQ-Max] — модель, которая не просто видит изображение, но ещё и анализирует, рассуждает и решает задачи.
Что с ней можно:
🔘 Детально разбирать изображения: анализировать сцены, текст и объекты.
🔘 Делать выводы на основе данных, прогнозировать события.
🔘 Анализировать данные, кодить, генерировать контент и просить помощи по учебе.
🗺 [Qwen2.5-Omni] — флагманский мультимодальный ИИ. Он видит, слышит, говорит и пишет, а ещё оснащён архитектурой Thinker-Talker:
🔘 Thinker — мозг модели, отвечающий за анализ текста, видео и аудио.
🔘 Talker — «речь» модели, которая создаёт текст и голос в реальном времени.
Еще есть голосовой и видео-чат в реальном времени, но общается только на англ и китайском.
🔗 Доступно бесплатно [тут], но только зарегистрированным пользователям.
@tips_ai #news #tools
Что с ней можно:
Еще есть голосовой и видео-чат в реальном времени, но общается только на англ и китайском.
@tips_ai #news #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍13❤6
This media is not supported in your browser
VIEW IN TELEGRAM
На Huggingface есть аналог Cursor
Если вы кодите, ну или вайбкодите, можете потестить этот инструмент [DeepSite]. Демка работает на свежем DeepSeek-V3-0324 бесплатно.
При этом умеет:
🔘 Генерировать приложения, сайты и игры.
🔘 Исправлять баги, рефакторить код и дописывать недостающие модули.
🔘 Автоматически хостить проекты.
От вас нужен только текстовый запрос с идеей для игры, приложения и т.п.
На видео пример, как генерирует простенькие игры с интерфейсом, которые можно тут же потестить.
@tips_ai #tools
Если вы кодите, ну или вайбкодите, можете потестить этот инструмент [DeepSite]. Демка работает на свежем DeepSeek-V3-0324 бесплатно.
При этом умеет:
От вас нужен только текстовый запрос с идеей для игры, приложения и т.п.
На видео пример, как генерирует простенькие игры с интерфейсом, которые можно тут же потестить.
@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍16❤12
Раньше побеждал тот, кто лучше пишет код. Скоро будет побеждать тот, кто сможет его продать.
Много раз слышал, что ИИ заменит маркетологов. На деле будет всё наоборот.
🔘 Сегодня написать код стало просто и дёшево.
🔘 Реальная ценность теперь не в том, чтобы написать код, а в умении привлечь внимание, упаковать и продать продукт.
🔘 AI-инструменты упростили маркетинг в 10 раз, но тем самым повысили конкуренцию и подняли планку качества.
🔘 Автоматизировать можно задачи, но не мышление, стратегию и эмпатию.
Маркетинг становится сложнее и ценнее, чем создание самого продукта.
@tips_ai #thoughts
Много раз слышал, что ИИ заменит маркетологов. На деле будет всё наоборот.
Маркетинг становится сложнее и ценнее, чем создание самого продукта.
@tips_ai #thoughts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51😁9❤6🤡4🫡4🔥2🤣2
Если вы работаете с ИИ и ищете удобный способ интеграций нескольких моделей, стоит приглядеться к OpenRouter.
| [OpenRouter] — агрегатор, дает доступ к различным LLM через единый API. Не нужно интегрировать каждую модель по отдельности — всё можно делать с помощью одного интерфейса. Платформа поддерживает GPT-4, Claude, Llama, Mistral, PaLM, и др.
Из плюсов:
🔘 Простой и универсальный API — вы получаете доступ к сотням моделей от разных провайдеров через единую точку интеграции без сложных настроек.
🔘 Прозрачные цены — платите только за токены, которые используете. Цены от $0.0001 до $0.06 за 1000 токенов в зависимости от модели.
🔘 Удобный выбор — можно выбрать модель по скорости, стоимости, качеству генерации или специализации.
🔘 Доступ к новинкам — новые модели появляются сразу после их выхода.
Свои нюансы тоже есть:
🔘 Нет доступа к кастомизированным версиям моделей (например, GPT-4 Turbo с Vision).
OpenRouter хорош для быстрого тестирования и экспериментов с ИИ-моделями. Для продакшн-решений всё же стоит учитывать цену, т.к. в некоторых случаях прямое сотрудничество с провайдером может быть выгоднее.
@tips_ai #tools
| [OpenRouter] — агрегатор, дает доступ к различным LLM через единый API. Не нужно интегрировать каждую модель по отдельности — всё можно делать с помощью одного интерфейса. Платформа поддерживает GPT-4, Claude, Llama, Mistral, PaLM, и др.
Из плюсов:
Свои нюансы тоже есть:
OpenRouter хорош для быстрого тестирования и экспериментов с ИИ-моделями. Для продакшн-решений всё же стоит учитывать цену, т.к. в некоторых случаях прямое сотрудничество с провайдером может быть выгоднее.
@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15❤6🔥3
Runway внезапно выпустили новую модель Gen-4 [Блог]
Обещают прорыв по всем фронтам, но главный плюс — консистентность.
Gen-4 по одной референсной картинке воспроизводит персонажа в разных условиях, при этом предметы остаются неизменными при смене окружения. Также физика и движения стали натуральнее, чем в прошлых версиях, а картинка в целом — более кинематографичной.
🔗 Потестить можно [тут]
Обновление доступно подписчикам Runway Pro. У меня уже появилась новая моделька, так что кидайте свои промпты, будем проверять, так ли хороша обнова.
@tips_ai #news
Обещают прорыв по всем фронтам, но главный плюс — консистентность.
Gen-4 по одной референсной картинке воспроизводит персонажа в разных условиях, при этом предметы остаются неизменными при смене окружения. Также физика и движения стали натуральнее, чем в прошлых версиях, а картинка в целом — более кинематографичной.
Обновление доступно подписчикам Runway Pro. У меня уже появилась новая моделька, так что кидайте свои промпты, будем проверять, так ли хороша обнова.
@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍13❤6