This media is not supported in your browser
VIEW IN TELEGRAM
Есть полезный MCP от Chrome DevTools —> помогает автоматизировать рутину в браузере.
Claude Code, Codex, Cursor, Gemini CLI и др. смогут:
> проверить, быстро ли грузится сайт
> заглядывать в структуру страниц
> подсветить ошибки прямо в браузере
> повторить действия пользователя (клики, формы, навигация)
> подсказать, почему что-то не работает (логи, запросы)
> найти косяки в верстке и стилях
> замерить скорость и предложить, как ускорить
—> Github | Blog
@tips_ai #tools
Claude Code, Codex, Cursor, Gemini CLI и др. смогут:
> проверить, быстро ли грузится сайт
> заглядывать в структуру страниц
> подсветить ошибки прямо в браузере
> повторить действия пользователя (клики, формы, навигация)
> подсказать, почему что-то не работает (логи, запросы)
> найти косяки в верстке и стилях
> замерить скорость и предложить, как ускорить
—> Github | Blog
@tips_ai #tools
👍27🔥11❤6🫡2
GitHub тоже выкатил свой Copilot CLI.
Перенесли своего агента кодирования GitHub Copilot в терминал.
Первая подписка в тарифе Pro на 30 дней бесплатна, дальше 10$
Еще не активировал, но надеюсь он будет так же хорош, как Claude Code, в плане вызова инструментов и как gpt-5 codex, в плане использования токенов.
@tips_ai #news
Перенесли своего агента кодирования GitHub Copilot в терминал.
1/ Установка через npm:npm install -g @github/copilot
2/ Авторизоваться, используя свою учетную запись GitHub.
3/ Начать можно только с тарифами Copilot Pro, Pro+, Business или Enterprise.
Первая подписка в тарифе Pro на 30 дней бесплатна, дальше 10$
Еще не активировал, но надеюсь он будет так же хорош, как Claude Code, в плане вызова инструментов и как gpt-5 codex, в плане использования токенов.
@tips_ai #news
👍14❤8🔥5
Сейчас лучшие агенты для разработки софта постепенно становятся лучшими агентами вообще для всего.
И лидер сейчас Droids, заняли 1 место в Terminal-Bench — это сложный и общий бенчмарк для программной разработки.
Сегодня Droids доступен всем с любой моделью и в любом интерфейсе: CLI, IDE, Slack, Linear или браузер.
Terminal-Bench проверяет не только умение написать кусок кода.
Там задачи шире: обновить легаси-проект, отладить окружение, обучить AI-модель, управлять облачной инфраструктурой.
И на всём этом Droids обгоняют Claude Code и Codex CLI.
Обычно AI платформы ставят рамки: один агент, одна модель, один интерфейс, а они сделали наоборот: бери любую модель, любой IDE и работай хоть локально, хоть в облаке.
Для кастомизации есть headless режим: можно прикрутить скрипты или триггеры и запускать Droids под конкретные процессы команды.
Похвастались, что агент в продакшне у крупных компаний: MongoDB, EY, Bayer, Zapier, Clari, что у них:
• новые фичи выходят в 31 раз быстрее
• миграции занимают на 96,1% меньше времени
• on-call инциденты закрываются на 95,8% быстрее
• у разработчиков остаётся больше времени на архитектуру и дизайн.
И объявили, что привлекли $50 млн инвестиций от NEA, Sequoia Capital, J.P. Morgan, Nvidia.
В общем посмотрим, можно попробовать бесплатно в течение месяца [app.factory.ai]
@tips_ai #news
И лидер сейчас Droids, заняли 1 место в Terminal-Bench — это сложный и общий бенчмарк для программной разработки.
Сегодня Droids доступен всем с любой моделью и в любом интерфейсе: CLI, IDE, Slack, Linear или браузер.
Terminal-Bench проверяет не только умение написать кусок кода.
Там задачи шире: обновить легаси-проект, отладить окружение, обучить AI-модель, управлять облачной инфраструктурой.
И на всём этом Droids обгоняют Claude Code и Codex CLI.
Обычно AI платформы ставят рамки: один агент, одна модель, один интерфейс, а они сделали наоборот: бери любую модель, любой IDE и работай хоть локально, хоть в облаке.
Для кастомизации есть headless режим: можно прикрутить скрипты или триггеры и запускать Droids под конкретные процессы команды.
Похвастались, что агент в продакшне у крупных компаний: MongoDB, EY, Bayer, Zapier, Clari, что у них:
• новые фичи выходят в 31 раз быстрее
• миграции занимают на 96,1% меньше времени
• on-call инциденты закрываются на 95,8% быстрее
• у разработчиков остаётся больше времени на архитектуру и дизайн.
И объявили, что привлекли $50 млн инвестиций от NEA, Sequoia Capital, J.P. Morgan, Nvidia.
В общем посмотрим, можно попробовать бесплатно в течение месяца [app.factory.ai]
@tips_ai #news
🔥17❤9👍9🤣3
Антропики радуют, вышел Claude Sonnet 4.5 — лучшая модель кодирования.
Не только пишет код, но и уверенно справляется с компьютером, сложными задачами и математикой.
Что в релизе:
• В Claude Code появились чекпоинты (можно откатиться назад, как в Git).
• Появился плагин для VS Code и обновлённый терминал.
• В Claude API завезли память и контекстное редактирование → агенты могут работать дольше и с большими задачами.
• В приложениях теперь можно прямо в чате создавать файлы: документы, таблицы, слайды.
• Расширение для Chrome открыли для части пользователей.
Самое интересное Claude Agent SDK. Это тот же движок, на котором у них работают агенты. Теперь его можно взять и строить своих.
По тестам Sonnet 4.5 шагнул вперёд:
• держит фокус на задачах по 30+ часов
• на бенчмарках по использованию компьютера поднялся с 42% до 61% за 4 месяца
• эксперты в финансах, медицине и праве отмечают, что он реально лучше понимает предметку
Плюс они подтянули безопасность: меньше лести, обманов и бредовых ответов, защита от prompt injection стала серьёзнее.
И небольшой бонус: эксперимент Imagine with Claude. Там модель в реальном времени придумывает софт на ходу, без заранее прописанных функций. Доступно для Max-подписчиков.
Claude Sonnet 4.5 сегодня доступен всем
Стоимость по API не изменилась: $3 / $15 за миллион токенов, как у Sonnet 4.
@tips_ai #news
Не только пишет код, но и уверенно справляется с компьютером, сложными задачами и математикой.
Что в релизе:
• В Claude Code появились чекпоинты (можно откатиться назад, как в Git).
• Появился плагин для VS Code и обновлённый терминал.
• В Claude API завезли память и контекстное редактирование → агенты могут работать дольше и с большими задачами.
• В приложениях теперь можно прямо в чате создавать файлы: документы, таблицы, слайды.
• Расширение для Chrome открыли для части пользователей.
Самое интересное Claude Agent SDK. Это тот же движок, на котором у них работают агенты. Теперь его можно взять и строить своих.
По тестам Sonnet 4.5 шагнул вперёд:
• держит фокус на задачах по 30+ часов
• на бенчмарках по использованию компьютера поднялся с 42% до 61% за 4 месяца
• эксперты в финансах, медицине и праве отмечают, что он реально лучше понимает предметку
Плюс они подтянули безопасность: меньше лести, обманов и бредовых ответов, защита от prompt injection стала серьёзнее.
И небольшой бонус: эксперимент Imagine with Claude. Там модель в реальном времени придумывает софт на ходу, без заранее прописанных функций. Доступно для Max-подписчиков.
Claude Sonnet 4.5 сегодня доступен всем
Стоимость по API не изменилась: $3 / $15 за миллион токенов, как у Sonnet 4.
@tips_ai #news
❤23🔥16👍7🫡2😢1
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI показали Sora 2
Их первая получилась не очень, я один раз в прошлом году попробовал и больше не прикасался.
Сейчас хотят конкурировать с Veo3.
Что нового:
• Контроль над сценами: можно описывать несколько шотов подряд.
• Звук и речь: фон, диалоги, эффекты — синхронно с видео.
• Камео: можно загрузить себя (короткая запись в приложении) и вставлять в любые ролики.
• Поддерживает стили от кинематографа до аниме.
Еще запустили приложение Sora (на iOS). Там можно генерить видео, делать ремиксы чужих и обмениваться роликами с друзьями.
Сейчас Sora 2 доступна в США и Канаде, позже — всем.
Будет работать для Plus, но с лимитами. Pro 200$ в ChatGPT получат доступ к улучшенной версии Sora 2 Pro.
Больше примеров Sora 2 в комментах.
@tips_ai #news
Их первая получилась не очень, я один раз в прошлом году попробовал и больше не прикасался.
Сейчас хотят конкурировать с Veo3.
Что нового:
• Контроль над сценами: можно описывать несколько шотов подряд.
• Звук и речь: фон, диалоги, эффекты — синхронно с видео.
• Камео: можно загрузить себя (короткая запись в приложении) и вставлять в любые ролики.
• Поддерживает стили от кинематографа до аниме.
Еще запустили приложение Sora (на iOS). Там можно генерить видео, делать ремиксы чужих и обмениваться роликами с друзьями.
Сейчас Sora 2 доступна в США и Канаде, позже — всем.
Будет работать для Plus, но с лимитами. Pro 200$ в ChatGPT получат доступ к улучшенной версии Sora 2 Pro.
Больше примеров Sora 2 в комментах.
@tips_ai #news
👍10❤8🔥8🤣2🫡1
Бенчмарков для LLM сейчас очень много. От математики и кодинга до эмпатии модели.
Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.
Среди всего, что есть, я чаще смотрю именно их:
LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.
EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.
Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.
LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.
SWE-Bench — для программистов.
Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.
OpenRouter — удобно смотреть, что популярно и что используют.
Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.
@tips_ai #tools
Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.
Среди всего, что есть, я чаще смотрю именно их:
LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.
EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.
Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.
LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.
SWE-Bench — для программистов.
Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.
OpenRouter — удобно смотреть, что популярно и что используют.
Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.
@tips_ai #tools
👍16❤7🔥4🫡1
Я редко делюсь промптами в канал — не вижу в этом смысла.
Сами LLM умеют придумывать и улучшать их лучше, чем я или кто-то ещё. Лучше заняться контекстом.
Хотя, мой пост набрал 862 репоста, а может стоит продолжать…
Самый простой способ — это создать свой своего личного промпт-инженера в Custom GPT и прикрутите к нему официальный гайд по промптам или возьмите готовые GPTs
Практически все, кто выпускает новые модели, делятся руководствами.
Например, у GPT-5 есть целый мануал на сайте OpenAI Cookbooks. Или у Google руководство по NanoBanano.
Загляните еще в prompts.chat — это первый и известный справочник промптов с 135к звезд на GitHub. Еще на этот сайт, захожу иногда.
Я перестал копить золотую коллекцию промптов, чаще всего сам наговариваю, но если нужно выкладывать в канал, дайте знать.
@tips_ai #prompt
Сами LLM умеют придумывать и улучшать их лучше, чем я или кто-то ещё. Лучше заняться контекстом.
Хотя, мой пост набрал 862 репоста, а может стоит продолжать…
Самый простой способ — это создать свой своего личного промпт-инженера в Custom GPT и прикрутите к нему официальный гайд по промптам или возьмите готовые GPTs
Практически все, кто выпускает новые модели, делятся руководствами.
Например, у GPT-5 есть целый мануал на сайте OpenAI Cookbooks. Или у Google руководство по NanoBanano.
Загляните еще в prompts.chat — это первый и известный справочник промптов с 135к звезд на GitHub. Еще на этот сайт, захожу иногда.
Я перестал копить золотую коллекцию промптов, чаще всего сам наговариваю, но если нужно выкладывать в канал, дайте знать.
@tips_ai #prompt
1👍34🔥15❤4🤡4🗿2😢1
Media is too big
VIEW IN TELEGRAM
Генерация изображений, работа в телекоме и... ваш будущий коллега? 🤖
Сбер приглашает погрузиться в мир реального ИИ — не фантастики, а рабочих инструментов, которые уже сегодня творят чудеса.
Ждем на митапе всех, кто хочет быть на острие технологий! Общение, нетворкинг и кофе-брейк прилагаются😉
Встречаемся 9 октября в 18:30 в Технохабе Сбера!
Регистрация на митап
Сбер приглашает погрузиться в мир реального ИИ — не фантастики, а рабочих инструментов, которые уже сегодня творят чудеса.
Ждем на митапе всех, кто хочет быть на острие технологий! Общение, нетворкинг и кофе-брейк прилагаются😉
Встречаемся 9 октября в 18:30 в Технохабе Сбера!
Регистрация на митап
❤8👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
У Perplexity вышел браузер Comet для всех пользователей
Кто постеснялся встать в очередь на передачу инвайтов или еще не получил инвайт, то сейчас можете скачать по ссылке.
Но без подписки Perplexity делать нечего, я активировал её на год тут.
@tips_ai #news
Кто постеснялся встать в очередь на передачу инвайтов или еще не получил инвайт, то сейчас можете скачать по ссылке.
Но без подписки Perplexity делать нечего, я активировал её на год тут.
@tips_ai #news
👍13🔥7🗿4