В выходные игрался с Grok для генерации картинок и видео.
Совсем недавно в Grok обновили качество в text2image и научили делать не только image2video, но и text2video.
Знаете, это не совсем плохо, тем более лимиты (20 изображений и 20 видео каждые 24 часа).
Что понравилось:
• Генерирует видео со звуком и речью
• Цензура мягче чем у Sora или Veo3 и нету вотемарки
• При генерации картинок выдаёт сразу ленту вариантов
• Качество видео можно улучшить прямо в интерфейсе
Из минусов: видео делает всего 6 секунд, не всегда получается уложить задумку в это время.
Для использования без подписки, вполне рабочий вариант.
grok.com
@tips_ai #tools
Совсем недавно в Grok обновили качество в text2image и научили делать не только image2video, но и text2video.
Знаете, это не совсем плохо, тем более лимиты (20 изображений и 20 видео каждые 24 часа).
Что понравилось:
• Генерирует видео со звуком и речью
• Цензура мягче чем у Sora или Veo3 и нету вотемарки
• При генерации картинок выдаёт сразу ленту вариантов
• Качество видео можно улучшить прямо в интерфейсе
Из минусов: видео делает всего 6 секунд, не всегда получается уложить задумку в это время.
Для использования без подписки, вполне рабочий вариант.
grok.com
@tips_ai #tools
👍30🔥24❤13😢2
🚀 Сначала запусти, а потом улучшай
Эту мантру знает каждый успешный фаундер. Главный риск в IT — застрять в перфекционизме и так и не выйти на рынок. Ценится скорость!
Яркий пример — челлендж «12 запусков за 12 месяцев» в комьюнити «Короче, Капитан». Вот как это работает у них:
⚡️Фокус. Берёте одну проблему с проверенным спросом. Никаких догадок.
⚡️Скорость и бюджет. Ровно месяц на разработку и запуск в США/ЕС. Средний бюджет на продвижение — всего $150.
⚡️Анализ. В конце месяца — честный разбор: что сработало, а что нет.
Вы в реальном времени видите запуск, продвижение и доход по каждому проекту. Идеальный способ прокачать насмотренность и перенять работающие подходы — даже если вы инженер, а не фаундер.
В будущем гарантированно набьете меньше шишек 💡
👉 Подписаться: @its_capitan
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqvBX5be
Эту мантру знает каждый успешный фаундер. Главный риск в IT — застрять в перфекционизме и так и не выйти на рынок. Ценится скорость!
Яркий пример — челлендж «12 запусков за 12 месяцев» в комьюнити «Короче, Капитан». Вот как это работает у них:
⚡️Фокус. Берёте одну проблему с проверенным спросом. Никаких догадок.
⚡️Скорость и бюджет. Ровно месяц на разработку и запуск в США/ЕС. Средний бюджет на продвижение — всего $150.
⚡️Анализ. В конце месяца — честный разбор: что сработало, а что нет.
Вы в реальном времени видите запуск, продвижение и доход по каждому проекту. Идеальный способ прокачать насмотренность и перенять работающие подходы — даже если вы инженер, а не фаундер.
В будущем гарантированно набьете меньше шишек 💡
👉 Подписаться: @its_capitan
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqvBX5be
🤡8👍7❤5🗿3
Как избавиться от дефолтного ИИ-дизайна
Многие уже отличают {AI slop} с первого взгляда.
Anthropic написали об этом короткий пост и показали как избавиться от этого с помощью Skills и готового промпта.
Если коротко: модели LLMs обучены на тысячи сайтов со стандартными шрифтами, одинаковыми цветами и минимумом анимаций. Вот и генерят это по умолчанию.
Anthropic предложили готовый промпт и инструкцию в Skills — это контекст по требованию, который загружается только когда нужно.
Не раздувает системный промпт на задачах где фронтенд не нужен.
Промпт:
Можно использовать не только в Claude, но и в Cursor, Windsurf, Codex, Lovable и других AI-редакторах как кастомную инструкцию.
Полный гайд [тут], для Claude используйте [Skills].
P.S. Телеграм решил пошалить и отключил обсуждения под старыми постами. Так что, если есть что сказать — [вот чат]😞
@tips_ai #news
Многие уже отличают {AI slop} с первого взгляда.
Anthropic написали об этом короткий пост и показали как избавиться от этого с помощью Skills и готового промпта.
Если коротко: модели LLMs обучены на тысячи сайтов со стандартными шрифтами, одинаковыми цветами и минимумом анимаций. Вот и генерят это по умолчанию.
Anthropic предложили готовый промпт и инструкцию в Skills — это контекст по требованию, который загружается только когда нужно.
Не раздувает системный промпт на задачах где фронтенд не нужен.
Промпт:
<frontend_aesthetics>
You tend to converge toward generic, "on distribution" outputs. In frontend design, this creates what users call the "AI slop" aesthetic. Avoid this: make creative, distinctive frontends that surprise and delight.
Focus on:
- Typography: Choose fonts that are beautiful, unique, and interesting. Avoid generic fonts like Arial and Inter; opt instead for distinctive choices that elevate the frontend's aesthetics.
- Color & Theme: Commit to a cohesive aesthetic. Use CSS variables for consistency. Dominant colors with sharp accents outperform timid, evenly-distributed palettes. Draw from IDE themes and cultural aesthetics for inspiration.
- Motion: Use animations for effects and micro-interactions. Prioritize CSS-only solutions for HTML. Use Motion library for React when available. Focus on high-impact moments: one well-orchestrated page load with staggered reveals (animation-delay) creates more delight than scattered micro-interactions.
- Backgrounds: Create atmosphere and depth rather than defaulting to solid colors. Layer CSS gradients, use geometric patterns, or add contextual effects that match the overall aesthetic.
Avoid generic AI-generated aesthetics:
- Overused font families (Inter, Roboto, Arial, system fonts)
- Clichéd color schemes (particularly purple gradients on white backgrounds)
- Predictable layouts and component patterns
- Cookie-cutter design that lacks context-specific character
Interpret creatively and make unexpected choices that feel genuinely designed for the context. Vary between light and dark themes, different fonts, different aesthetics. You still tend to converge on common choices (Space Grotesk, for example) across generations. Avoid this: it is critical that you think outside the box!
</frontend_aesthetics>
Можно использовать не только в Claude, но и в Cursor, Windsurf, Codex, Lovable и других AI-редакторах как кастомную инструкцию.
Полный гайд [тут], для Claude используйте [Skills].
P.S. Телеграм решил пошалить и отключил обсуждения под старыми постами. Так что, если есть что сказать — [вот чат]
@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25❤10👍9
Вы просто не представляете, как {такие циферки} могут поднять мое настроение 😮
Ждём официальный релиз Gemini 3 сегодня!
@tips_ai #news
Ждём официальный релиз Gemini 3 сегодня!
@tips_ai #news
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥34👍13❤10
Media is too big
VIEW IN TELEGRAM
Дождался официального релиза Gemini 3 Pro
Gemini 3 Pro в режиме preview — самая умная модель от Google.
Gemini 3 Deep Think — режим для особо сложных задач, где модель думает дольше но выдаёт более точные ответы.
Понимает глубину и нюансы, видит тонкие детали в креативных идеях или разбирает сложные проблемы.
Лучше понимает контекст и намерения, меньше нужно промптить.
• Решает сложные научные задачи в 2 раза лучше прошлой
• Математика: новый рекорд среди всех AI моделей
• Программирование: лучше всех пишет код и создаёт сайты
• Планирование задач: может выполнять сложные действия от начала до конца
Цены по API немного дороже, чем на gpt-5.1.
Еще выпустили Google Antigravity — свой аналог Cursor, IDE для разработки (пока бесплатно)
Где доступна:
• Приложение Gemini
• AI Mode в поиске Google, для тарифов Pro и Ultra
• В AI Studio
• В Google Antigravity
• В Gemini CLI
[Официальный пост]
@tips_ai #news
Gemini 3 Pro в режиме preview — самая умная модель от Google.
Gemini 3 Deep Think — режим для особо сложных задач, где модель думает дольше но выдаёт более точные ответы.
Понимает глубину и нюансы, видит тонкие детали в креативных идеях или разбирает сложные проблемы.
Лучше понимает контекст и намерения, меньше нужно промптить.
• Решает сложные научные задачи в 2 раза лучше прошлой
• Математика: новый рекорд среди всех AI моделей
• Программирование: лучше всех пишет код и создаёт сайты
• Планирование задач: может выполнять сложные действия от начала до конца
Цены по API немного дороже, чем на gpt-5.1.
Еще выпустили Google Antigravity — свой аналог Cursor, IDE для разработки (пока бесплатно)
Где доступна:
• Приложение Gemini
• AI Mode в поиске Google, для тарифов Pro и Ultra
• В AI Studio
• В Google Antigravity
• В Gemini CLI
[Официальный пост]
@tips_ai #news
🔥25👍14❤7
SMOL_секреты_создания_LLM_мирового_класса_Перевод_t_me_aivkube.pdf
14.6 MB
———
SMOL Playbook от HuggingFace — 200+ страниц о том, как тренировать LLM
В PDF: как выбрать архитектуру, подготовить данные, не слить бюджет на вычисления и избежать типичных ошибок при обучении моделей.
• Пригодится, кому нужна компактная модель под конкретную задачу
• Стартапам с ограниченным бюджетом
• Руководителям, которые хотят понять, почему одни LLM работают, а другие нет
Спасибо за удобный PDF и грамотный перевод — подписчику Сергею!
@tips_ai #news
SMOL Playbook от HuggingFace — 200+ страниц о том, как тренировать LLM
В PDF: как выбрать архитектуру, подготовить данные, не слить бюджет на вычисления и избежать типичных ошибок при обучении моделей.
• Пригодится, кому нужна компактная модель под конкретную задачу
• Стартапам с ограниченным бюджетом
• Руководителям, которые хотят понять, почему одни LLM работают, а другие нет
Спасибо за удобный PDF и грамотный перевод — подписчику Сергею!
@tips_ai #news
1🔥20👍12❤6
Meтка выпустила SAM 3D — систему для создания 3D-моделей объектов и людей из обычных фотографий.
Два инструмента в релизе:
• SAM 3D Objects восстанавливает 3D-форму, текстуру и расположение объектов в пространстве из одного фото.
• SAM 3D Body реконструирует полную 3D-модель человека: позу, форму тела, руки и ноги. Работает даже с перекрытиями и нестандартными позами.
Модели обучены на реальных фотографиях, а не на студийных изображениях или 3D-ассетах.
Справляются со сложными сценами из жизни.
Около 1 млн реальных изображений для Objects, 8 млн для Body — один из крупнейших датасетов для 3D.
SAM 3D Body использует новый формат MHR: разделяет скелет и мягкие ткани, что даёт точнее контроль позы и лучше работает с разными фигурами.
Еще выпустили Segment Anything Playground — платформу где можно загрузить свои фото и сразу протестировать эти модели.
Уже есть применение в View in Room на FB Marketplace (см 3 видео) — глянуть как мебель или декор будет смотреться у тебя дома перед покупкой.
Код открыт на GitHub, веса моделей доступны.
[Официальный пост]
Потестить можно [тут]
@tips_ai #news
Два инструмента в релизе:
• SAM 3D Objects восстанавливает 3D-форму, текстуру и расположение объектов в пространстве из одного фото.
• SAM 3D Body реконструирует полную 3D-модель человека: позу, форму тела, руки и ноги. Работает даже с перекрытиями и нестандартными позами.
Модели обучены на реальных фотографиях, а не на студийных изображениях или 3D-ассетах.
Справляются со сложными сценами из жизни.
Data Engine основная технология обучения:
• Модель генерирует варианты 3D-моделей
• Люди оценивают качество
• Сложные случаи доделывают 3D-художники
• Модель улучшается с каждым циклом
Около 1 млн реальных изображений для Objects, 8 млн для Body — один из крупнейших датасетов для 3D.
SAM 3D Body использует новый формат MHR: разделяет скелет и мягкие ткани, что даёт точнее контроль позы и лучше работает с разными фигурами.
Еще выпустили Segment Anything Playground — платформу где можно загрузить свои фото и сразу протестировать эти модели.
Уже есть применение в View in Room на FB Marketplace (см 3 видео) — глянуть как мебель или декор будет смотреться у тебя дома перед покупкой.
Код открыт на GitHub, веса моделей доступны.
[Официальный пост]
Потестить можно [тут]
@tips_ai #news
🔥21👍9❤6
Media is too big
VIEW IN TELEGRAM
Raycast — ИИ-spotlight: запуск приложений, поиск файлов и полезные утилиты в одной панели.
В начале лета купил себе макбук и ребята сразу посоветовали Raycast вместо стандартного Spotlight.
Но дома я 95% времени сижу на винде: два монитора, игры, просто всю жизнь в ней работаю. Мак сейчас не для работы дома, а для поездок.
Raycast появился на Windows.
История буфера обмена, перевод, поиск эмодзи, запуск приложений, управление окнами, скриншоты, запись экрана, конвертация файлов, встроенный AI + куча расширений и тд*
*(см. видео к посту — 101 сценарий использования Raycast)
— Бесплатный, подписка только на доп функции.
@tips_ai #tools
В начале лета купил себе макбук и ребята сразу посоветовали Raycast вместо стандартного Spotlight.
Но дома я 95% времени сижу на винде: два монитора, игры, просто всю жизнь в ней работаю. Мак сейчас не для работы дома, а для поездок.
Raycast появился на Windows.
История буфера обмена, перевод, поиск эмодзи, запуск приложений, управление окнами, скриншоты, запись экрана, конвертация файлов, встроенный AI + куча расширений и тд*
*(см. видео к посту — 101 сценарий использования Raycast)
— Бесплатный, подписка только на доп функции.
@tips_ai #tools
❤13👍12🔥8🗿3
Media is too big
VIEW IN TELEGRAM
Какое приложение вы используете для хранения информации?
Я использую:
• Notion
• Coda
• Obsidian
• Apple Notes
Для быстрых заметок отправляю в ТГ избранное. В итоге информация размазана по 5 разным местам.
Вчера увидел, что Obsidian теперь поддерживает экспорт страниц и баз данных Notion напрямую в локальные файлы через плагин Importer.
Поддерживает экспорт встроенных файлов.
Перенести данные, можно не только с Notion: Apple Notes, OneNote, Google Keep и другие приложения для заметок.
Для тех, кто хочет хранить всё локально, а не в облаке, попробуйте.
@tips_ai #news
Я использую:
• Notion
• Coda
• Obsidian
• Apple Notes
Для быстрых заметок отправляю в ТГ избранное. В итоге информация размазана по 5 разным местам.
Вчера увидел, что Obsidian теперь поддерживает экспорт страниц и баз данных Notion напрямую в локальные файлы через плагин Importer.
Поддерживает экспорт встроенных файлов.
Перенести данные, можно не только с Notion: Apple Notes, OneNote, Google Keep и другие приложения для заметок.
Для тех, кто хочет хранить всё локально, а не в облаке, попробуйте.
@tips_ai #news
👍31❤7🔥5
Cloud.ru включил в продакшен Evolution AI Factory — набор из шести инструментов, где можно пройти весь путь от прототипа до рабочего продукта.
Что внутри: 20+ готовых LLM по OpenAI‑совместимому API, быстрый инференс своих и HF‑моделей, RAG по вашим данным, LoRA‑дообучение, облачные ноутбуки (JupyterLab / VS Code Server / ComfyUI / n8n) и AI‑агенты для мультиагентных сценариев
SLA, 24/7 поддержка и тарифы вменяемого уровня — особенно на открытые модели по токенам
Если ищете, где подружить свои данные, LLM и агентов без сборки «зоопарка» сервисов, имеет смысл присмотреться.
Please open Telegram to view this post
VIEW IN TELEGRAM
1🤣18👍9
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT запустили Shopping Research — как Deep Research, но для покупок.
Shopping Research задаёт уточняющие вопросы, исследует интернет, анализирует источники и использует память из прошлых разговоров, чтобы собрать персонализированный гайд покупателя или находить аналоги товаров.
Будет доступен на мобильных и веб для Free, Go, Plus и Pro планов.
Вот тебе маркетинг: до конца праздников использование без лимита для всех планов.
@tips_ai #news
Shopping Research задаёт уточняющие вопросы, исследует интернет, анализирует источники и использует память из прошлых разговоров, чтобы собрать персонализированный гайд покупателя или находить аналоги товаров.
Будет доступен на мобильных и веб для Free, Go, Plus и Pro планов.
Вот тебе маркетинг: до конца праздников использование без лимита для всех планов.
@tips_ai #news
👍19❤7🔥7🗿3🤡2
Media is too big
VIEW IN TELEGRAM
Excel до сих пор держит мировую экономику через 40 лет после запуска: таблицы и списки всё так же важны, программа гибкая и работает везде.
Не удивительно, что многие стартапы хотят туда добавить щепотку AI.
Например Shortcut или Endex.ai в который вложились OpenAI.
У Ramp (финтех-компании) есть небольшая команда Ramp Labs, которая исследует будущее финансовой работы, выпустила свой эксперимент Ramp Sheets.
Внутри весь функционал для таблиц. Можно загрузить любую таблицу и работать как в привычном редакторе, но с AI-агентом.
Агент в Ramp Sheets:
• Ищет данные в вебе
• Делает целевые правки
• Отвечает на вопросы по данным
• Автоматически пишет формулы.
Никаких платных тарифов нету, только ежедневные 10к кредитов, которые обновляются каждый день.
https://labs.ramp.com/sheets
@tips_ai #tools
Не удивительно, что многие стартапы хотят туда добавить щепотку AI.
Например Shortcut или Endex.ai в который вложились OpenAI.
У Ramp (финтех-компании) есть небольшая команда Ramp Labs, которая исследует будущее финансовой работы, выпустила свой эксперимент Ramp Sheets.
Внутри весь функционал для таблиц. Можно загрузить любую таблицу и работать как в привычном редакторе, но с AI-агентом.
Агент в Ramp Sheets:
• Ищет данные в вебе
• Делает целевые правки
• Отвечает на вопросы по данным
• Автоматически пишет формулы.
Никаких платных тарифов нету, только ежедневные 10к кредитов, которые обновляются каждый день.
https://labs.ramp.com/sheets
@tips_ai #tools
👍19❤11🔥9
Media is too big
VIEW IN TELEGRAM
LlamaIndex — это открытый фреймворк для работы с документами и AI-агентами.
1/ LlamaCloud — облачный сервис для обработки документов (парсинг, извлечение данных, индексирование)
2/ LlamaIndex Framework — фреймворк с открытым кодом для создания LLM-приложений
3/ Workflows — движок для координации многошаговых процессов и агентов
Но в рамках этого поста, хотел бы сделать внимание на LlamaCloud и новом API LlamaSheets.
В LlamaCloud вы можете использовать:
• Parse — парсить документы, таблицы и изображения для LLM
• Extract — извлекать информацию по заданной схеме
• Classify — классифицировать документы по категориям
• Index — создавать data pipelines для RAG-приложений
Поддерживает более 50 форматов документов, интегрируется с векторными базами данных, Web UI, Python SDK и REST API.
Недавно выпустили LlamaSheets — новый API для парсинга неструктурированных Excel-файлов в структурированные данные.
Что делает LlamaSheets:
• Принимает .xlsx с таблицами разбросанными по листу
• Находит регионы и таблицы, вычищает структуру иерархических заголовков
• Генерирует заголовок и описание для каждой таблицы
• Отдаёт результат в столбчатый формат + подробные метаданные по ячейкам (форматирование, типы данных и т.п.).
Дальше эти данные можно сразу скормить любому AI агенту, ведь ему проще работать с такими данными.
Если есть такие потребности, ссылку оставлю [тут]
@tips_ai #tools
1/ LlamaCloud — облачный сервис для обработки документов (парсинг, извлечение данных, индексирование)
2/ LlamaIndex Framework — фреймворк с открытым кодом для создания LLM-приложений
3/ Workflows — движок для координации многошаговых процессов и агентов
Но в рамках этого поста, хотел бы сделать внимание на LlamaCloud и новом API LlamaSheets.
В LlamaCloud вы можете использовать:
• Parse — парсить документы, таблицы и изображения для LLM
• Extract — извлекать информацию по заданной схеме
• Classify — классифицировать документы по категориям
• Index — создавать data pipelines для RAG-приложений
Поддерживает более 50 форматов документов, интегрируется с векторными базами данных, Web UI, Python SDK и REST API.
Недавно выпустили LlamaSheets — новый API для парсинга неструктурированных Excel-файлов в структурированные данные.
Что делает LlamaSheets:
• Принимает .xlsx с таблицами разбросанными по листу
• Находит регионы и таблицы, вычищает структуру иерархических заголовков
• Генерирует заголовок и описание для каждой таблицы
• Отдаёт результат в столбчатый формат + подробные метаданные по ячейкам (форматирование, типы данных и т.п.).
Дальше эти данные можно сразу скормить любому AI агенту, ведь ему проще работать с такими данными.
Если есть такие потребности, ссылку оставлю [тут]
@tips_ai #tools
👍17❤8🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
Помните мой пост про число 17?
Когда ChatGPT, Claude, Grok и Gemini выдали одно случайное число.
Есть исследование которое объясняет почему так происходит.
Если коротко: люди которые оценивают ответы для обучения моделей, систематически выбирают привычные типичные варианты.
Модель учится на этом и теряет разнообразие. Проблему назвали typicality bias.
Они предложили простое решение: Verbalized Sampling. Работает без дообучения, просто меняешь промпт.
Вместо {напиши шутку про кофе} пишешь {напиши 5 шуток про кофе с их вероятностями}.
Модель не схлопывается в один типичный ответ, а вербализует разные варианты из своих данных.
Протестировали на 10 моделях (GPT-4.1, Gemini-2.5-Pro, Claude-3.7-Sonnet, Claude-4-Sonnet и др) разнообразие выросло, а качество не упало.
Как использовать:
Вариант 1 — системный промпт:
Вариант 2 — обычный промпт (для чата):
[Полное исследование]
[Github]
@tips_ai #news
Когда ChatGPT, Claude, Grok и Gemini выдали одно случайное число.
Есть исследование которое объясняет почему так происходит.
Если коротко: люди которые оценивают ответы для обучения моделей, систематически выбирают привычные типичные варианты.
Модель учится на этом и теряет разнообразие. Проблему назвали typicality bias.
Они предложили простое решение: Verbalized Sampling. Работает без дообучения, просто меняешь промпт.
Вместо {напиши шутку про кофе} пишешь {напиши 5 шуток про кофе с их вероятностями}.
Модель не схлопывается в один типичный ответ, а вербализует разные варианты из своих данных.
Протестировали на 10 моделях (GPT-4.1, Gemini-2.5-Pro, Claude-3.7-Sonnet, Claude-4-Sonnet и др) разнообразие выросло, а качество не упало.
Как использовать:
Вариант 1 — системный промпт:
You are a helpful assistant. For each query, please generate a set of five possible responses, each within a separate <response> tag. Responses should each include a <text> and a numeric <probability>. Please sample at random from the tails of the distribution, such that the probability of each response is less than 0.10.
Вариант 2 — обычный промпт (для чата):
Generate 10 responses to the user query, each within a separate <response> tag. Each response should be 50-100 words. Each <response> must include a <text> and a numeric <probability>. Randomly sample the responses from the full distribution.
<user_query>[ваш запрос]</user_query>
[Полное исследование]
[Github]
@tips_ai #news
❤17👍12🫡5🔥4🤡1