Tips AI | IT & AI
21.1K subscribers
2.16K photos
1.26K videos
23 files
1.82K links
Авторский канал про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь.

Пишу только то, что сам считаю интересным. Автор: @igortru

Информация по рекламе: @tipsprbot

РКН: https://clck.ru/3FrWDx
Download Telegram
Tips AI | IT & AI
OpenAI улучшила генерацию изображений: текст и детали стали точнее Это не DALL-E, а новая система, работающая по другому принципу. [Источник] Разберем по пунктам: 🔘Точность генерации выросла: модель правильно привязывает цвета, формы и другие атрибуты к…
Помимо вчерашней обновы, OpenAI [открыли] бесплатную онлайн-платформу с курсами по ИИ.

В ней есть:
– Вводные уроки для новичков
– Гайды по промт-инжинирингу
– Курсы по разработке собственных моделей
– Материалы о карьере в сфере ИИ

Платформа будет регулярно пополняться новыми курсами, а также вебинарами и очными мероприятиями.

Среди партнеров — университеты, некоммерческие организации и компании.

| Ссылка на [платформу].

@tips_ai #news
🔥29👍127
Gemini 2.5 Pro — новая «рассуждающая» экспериментальная модель от Google

Вчера практически в одно и то же время с OpenAI Google релизнули Gemini 2.5 Pro [Источник].

В рейтинге [LMArena] вышла на первое место с 1443 баллами. Прошлые лидеры рейтинга — Grok 3 и GPT-4.5.

Главные особенности:
🔘В самом сложном бенчмарке [Последний экзамен человечества] Gemini 2.5 Pro набирает 18,8% — «размышляющая» версия Gemini 2.0 набирала всего 7,2%, o3-mini-high — 14%.
🔘Gemini 2.5 Pro опережает всех в точных науках и математике и показывает как минимум сопоставимые результаты в программировании.
🔘Контекстное окно — 1 млн токенов (около 2-2,5 тыс. страниц PDF), разработчики планируют расширить его до 2 млн токенов.
🔘Модель может обрабатывать аудио и видео, понимает изображения, но генерировать картинки не умеет.

🔗Gemini 2.5 Pro уже доступна бесплатно в [Google AI Studio].

@tips_ai #news #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥97
Midjourney V7 выйдет на следующей неделе.

Честно, не понимаю, как они собираются держаться на плаву и тем более без API. Единственная надежда — сверхкачество.

Но вы видели цены за их подписки? $30 в месяц за 15 часов генераций в Fast time и безлимит в Relax Mode (это только standard plan). А за $20 в GPT тебе и Sora без ограничений, и генерация картинок с хорошим качеством прямо в диалоге и выбор разных моделей под задачи text2text с deepresearch.

При этом у Midjourney до сих пор сложные промты — я, например, так и не разобрался, как их писать без шаблонов. Посмотрим, чем ответят.

@tips_ai
👍36🔥8🫡5🗿3
This media is not supported in your browser
VIEW IN TELEGRAM
Китайцы выпустили мультимодальные модели QVQ-Max и Qwen2.5-Omni

🗺[QVQ-Max] — модель, которая не просто видит изображение, но ещё и анализирует, рассуждает и решает задачи.

Что с ней можно:
🔘Детально разбирать изображения: анализировать сцены, текст и объекты.
🔘Делать выводы на основе данных, прогнозировать события.
🔘Анализировать данные, кодить, генерировать контент и просить помощи по учебе.

🗺[Qwen2.5-Omni] — флагманский мультимодальный ИИ. Он видит, слышит, говорит и пишет, а ещё оснащён архитектурой Thinker-Talker:

🔘Thinker — мозг модели, отвечающий за анализ текста, видео и аудио.
🔘Talker — «речь» модели, которая создаёт текст и голос в реальном времени.

Еще есть голосовой и видео-чат в реальном времени, но общается только на англ и китайском.

🔗Доступно бесплатно [тут], но только зарегистрированным пользователям.

@tips_ai #news #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍136
This media is not supported in your browser
VIEW IN TELEGRAM
На Huggingface есть аналог Cursor

Если вы кодите, ну или вайбкодите, можете потестить этот инструмент [DeepSite]. Демка работает на свежем DeepSeek-V3-0324 бесплатно.

При этом умеет:
🔘Генерировать приложения, сайты и игры.
🔘Исправлять баги, рефакторить код и дописывать недостающие модули.
🔘Автоматически хостить проекты.

От вас нужен только текстовый запрос с идеей для игры, приложения и т.п.

На видео пример, как генерирует простенькие игры с интерфейсом, которые можно тут же потестить.

@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍1612
Раньше побеждал тот, кто лучше пишет код. Скоро будет побеждать тот, кто сможет его продать.

Много раз слышал, что ИИ заменит маркетологов. На деле будет всё наоборот.

🔘Сегодня написать код стало просто и дёшево.

🔘Реальная ценность теперь не в том, чтобы написать код, а в умении привлечь внимание, упаковать и продать продукт.

🔘AI-инструменты упростили маркетинг в 10 раз, но тем самым повысили конкуренцию и подняли планку качества.

🔘Автоматизировать можно задачи, но не мышление, стратегию и эмпатию.

Маркетинг становится сложнее и ценнее, чем создание самого продукта.

@tips_ai #thoughts
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51😁96🤡4🫡4🔥2🤣2
Если вы работаете с ИИ и ищете удобный способ интеграций нескольких моделей, стоит приглядеться к OpenRouter.

| [OpenRouter] — агрегатор, дает доступ к различным LLM через единый API. Не нужно интегрировать каждую модель по отдельности — всё можно делать с помощью одного интерфейса. Платформа поддерживает GPT-4, Claude, Llama, Mistral, PaLM, и др.

Из плюсов:
🔘Простой и универсальный API — вы получаете доступ к сотням моделей от разных провайдеров через единую точку интеграции без сложных настроек.
🔘Прозрачные цены — платите только за токены, которые используете. Цены от $0.0001 до $0.06 за 1000 токенов в зависимости от модели.
🔘Удобный выбор — можно выбрать модель по скорости, стоимости, качеству генерации или специализации.
🔘Доступ к новинкам — новые модели появляются сразу после их выхода.

Свои нюансы тоже есть:
🔘Нет доступа к кастомизированным версиям моделей (например, GPT-4 Turbo с Vision).

OpenRouter хорош для быстрого тестирования и экспериментов с ИИ-моделями. Для продакшн-решений всё же стоит учитывать цену, т.к. в некоторых случаях прямое сотрудничество с провайдером может быть выгоднее.

@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
👍156🔥3
Runway внезапно выпустили новую модель Gen-4 [Блог]

Обещают прорыв по всем фронтам, но главный плюс — консистентность.

Gen-4 по одной референсной картинке воспроизводит персонажа в разных условиях, при этом предметы остаются неизменными при смене окружения. Также физика и движения стали натуральнее, чем в прошлых версиях, а картинка в целом — более кинематографичной.

🔗 Потестить можно [тут]

Обновление доступно подписчикам Runway Pro. У меня уже появилась новая моделька, так что кидайте свои промпты, будем проверять, так ли хороша обнова.

@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍136
Генерировать картинки в ChatGPT теперь можно бесплатно.

Отличный день, чтобы наделать мемов и артов в стиле Ghibli.

Наберём 30🔥— вечером скину крутой промт со стилями!

@tips_ai #news
1🔥130👍1
Media is too big
VIEW IN TELEGRAM
Как сохранить стиль и копировать дизайн в ChatGPT.

Как сохранить и повторить стиль картинок или брендов? Вот промт, который анализирует дизайн, сохраняет его в JSON-файл, а потом позволяет проще генерировать новые изображения в том же стиле.

Промт:
Analyze the provided images and create a "brand style profile" in the form of a JSON object. This profile should extract and describe the visual identity, structure, and aesthetic rules shown in the images, in a way that allows an AI to recreate similar visuals in the same style, but for entirely different content. Do not include or reference any specific subjects, logos, products, people, text, or brand names present in the input. Your job is to isolate and document the style, layout principles, and design system used, so it can be reapplied to different content while maintaining the same visual language.

The JSON should include, but not be limited to:

Color usage: dominant tones, gradients, or palettes
Typography style: font mood (bold, modern, playful, clean, etc.), placement, and usage hierarchy
Lighting & vibe: energetic / moody / clean / vibrant / soft / etc.
Subject placement: centered / floating / grouped / perspective / rotated / etc.
Background style: abstract / gradient / textured / scenic / etc.
Composition layout: symmetrical / rule of thirds / collage / exploded view / etc.
Branding elements: use of overlays, strokes, glows, shapes, burst effects, or other visual motifs
Visual tone: bold / casual / premium / loud / minimal / playful / etc.
Post-processing style: contrast, saturation, shadows, glow, noise, etc.
General style tags: genre/feel, e.g., "sports aesthetic", "editorial look", "clean tech", "pop art", etc.
The output must be a well-structured JSON that an AI can use to recreate visuals in the same stylistic language, regardless of the actual subject matter.


Как это работает:
1️⃣Вставьте промт в ChatGPT и загрузите 1-5 референсных изображений.
2️⃣Полученный текст скопируйте в блокнот и сохраните как .json файл.
3️⃣В новом чате включите генерацию изображений и загрузите этот .json файл.
4️⃣Добавьте свое изображение или просто опишите его промтом.

Этот промт для удобства, чтобы создавать свою библиотеку стилей, которую можно быстро использовать в любое время.

@tips_ai #гайд #promt
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥66👍2414
Смотрите, как ИИ анализирует экран в реальном времени с Gemini Live для Android!

Первое видео — с переводом, второе — оригинал.

Google еще в [декабре] анонсировала Project Astra, но пока доступ к нему есть только у избранных. Первыми обновление получают владельцы Pixel и Galaxy S25, а также подписчики Google One AI.

@tips_ai #news
👍18🔥93
Универсальный суперагент

В бета-версии вышел [Genspark Super Agent], который может автономно думать, планировать и выполнять повседневные задачи: конвертировать YouTube-видео в презентацию, проанализировать данные, задизайнить и много чего ещё, подробнее в [блоге].

В ролике показали, как агент запланировал поездку, сам обзвонил все рестораны и забронировал места 📲

Работает на системе Mixture-of-Agents, которая использует сразу несколько моделей: GPT-4o, o1, Claude, Gemini, DeepSeek, ElevenLabs.

Также тут есть генераторы
🔘Видео: Kling 1.6, PixVerse 3.5, DreamMachine, Veo 2, Hunyuan.
🔘Изображения: FLUX, Ideogram, Recraft, Dall-e 3, Imagen 3.

Ежедневно дают 200 бесплатных кредитов, а единственный платный тариф Plus $25/мес.

🔗Ссылка [тут].

@tips_ai #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍38🔥129🤡1🫡1