Tips AI | IT & AI
21.6K subscribers
2.2K photos
1.3K videos
23 files
1.86K links
Авторский канал про сервисы и технологии IT и AI, которые могут упростить (или не совсем) жизнь.

Пишу только то, что сам считаю интересным. Автор: @igortru

Информация по рекламе: @tipsprbot
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Есть полезный MCP от Chrome DevTools —> помогает автоматизировать рутину в браузере.

Claude Code, Codex, Cursor, Gemini CLI и др. смогут:

> проверить, быстро ли грузится сайт
> заглядывать в структуру страниц
> подсветить ошибки прямо в браузере
> повторить действия пользователя (клики, формы, навигация)
> подсказать, почему что-то не работает (логи, запросы)
> найти косяки в верстке и стилях
> замерить скорость и предложить, как ускорить

—> Github | Blog

@tips_ai #tools
👍27🔥116🫡2
GitHub тоже выкатил свой Copilot CLI.

Перенесли своего агента кодирования GitHub Copilot в терминал.

1/ Установка через npm: npm install -g @github/copilot
2/ Авторизоваться, используя свою учетную запись GitHub.
3/ Начать можно только с тарифами Copilot Pro, Pro+, Business или Enterprise.


Первая подписка в тарифе Pro на 30 дней бесплатна, дальше 10$

Еще не активировал, но надеюсь он будет так же хорош, как Claude Code, в плане вызова инструментов и как gpt-5 codex, в плане использования токенов.

@tips_ai #news
👍148🔥5
Сейчас лучшие агенты для разработки софта постепенно становятся лучшими агентами вообще для всего.

И лидер сейчас Droids, заняли 1 место в Terminal-Bench — это сложный и общий бенчмарк для программной разработки.

Сегодня Droids доступен всем с любой моделью и в любом интерфейсе: CLI, IDE, Slack, Linear или браузер.

Terminal-Bench проверяет не только умение написать кусок кода.

Там задачи шире: обновить легаси-проект, отладить окружение, обучить AI-модель, управлять облачной инфраструктурой.

И на всём этом Droids обгоняют Claude Code и Codex CLI.

Обычно AI платформы ставят рамки: один агент, одна модель, один интерфейс, а они сделали наоборот: бери любую модель, любой IDE и работай хоть локально, хоть в облаке.

Для кастомизации есть headless режим: можно прикрутить скрипты или триггеры и запускать Droids под конкретные процессы команды.

Похвастались, что агент в продакшне у крупных компаний: MongoDB, EY, Bayer, Zapier, Clari, что у них:

• новые фичи выходят в 31 раз быстрее
• миграции занимают на 96,1% меньше времени
• on-call инциденты закрываются на 95,8% быстрее
• у разработчиков остаётся больше времени на архитектуру и дизайн.

И объявили, что привлекли $50 млн инвестиций от NEA, Sequoia Capital, J.P. Morgan, Nvidia.

В общем посмотрим, можно попробовать бесплатно в течение месяца [app.factory.ai]

@tips_ai #news
🔥179👍9🤣3
Антропики радуют, вышел Claude Sonnet 4.5 — лучшая модель кодирования.

Не только пишет код, но и уверенно справляется с компьютером, сложными задачами и математикой.

Что в релизе:
• В Claude Code появились чекпоинты (можно откатиться назад, как в Git).
• Появился плагин для VS Code и обновлённый терминал.
• В Claude API завезли память и контекстное редактирование → агенты могут работать дольше и с большими задачами.
• В приложениях теперь можно прямо в чате создавать файлы: документы, таблицы, слайды.
• Расширение для Chrome открыли для части пользователей.

Самое интересное Claude Agent SDK. Это тот же движок, на котором у них работают агенты. Теперь его можно взять и строить своих.

По тестам Sonnet 4.5 шагнул вперёд:
• держит фокус на задачах по 30+ часов
• на бенчмарках по использованию компьютера поднялся с 42% до 61% за 4 месяца
• эксперты в финансах, медицине и праве отмечают, что он реально лучше понимает предметку

Плюс они подтянули безопасность: меньше лести, обманов и бредовых ответов, защита от prompt injection стала серьёзнее.

И небольшой бонус: эксперимент Imagine with Claude. Там модель в реальном времени придумывает софт на ходу, без заранее прописанных функций. Доступно для Max-подписчиков.

Claude Sonnet 4.5 сегодня доступен всем

Стоимость по API не изменилась: $3 / $15 за миллион токенов, как у Sonnet 4.

@tips_ai #news
23🔥16👍7🫡2😢1
OpenAI показали Sora 2

Их первая получилась не очень, я один раз в прошлом году попробовал и больше не прикасался.

Сейчас хотят конкурировать с Veo3.

Что нового:
• Контроль над сценами: можно описывать несколько шотов подряд.
• Звук и речь: фон, диалоги, эффекты — синхронно с видео.
• Камео: можно загрузить себя (короткая запись в приложении) и вставлять в любые ролики.
• Поддерживает стили от кинематографа до аниме.

Еще запустили приложение Sora (на iOS). Там можно генерить видео, делать ремиксы чужих и обмениваться роликами с друзьями.

Сейчас Sora 2 доступна в США и Канаде, позже — всем.

Будет работать для Plus, но с лимитами. Pro 200$ в ChatGPT получат доступ к улучшенной версии Sora 2 Pro.

Больше примеров Sora 2 в комментах.

@tips_ai #news
👍108🔥8🤣2🫡1
Бенчмарков для LLM сейчас очень много. От математики и кодинга до эмпатии модели.

Бенчмарки — это помощь при выборе модели, но не заменят собственные тесты.

Среди всего, что есть, я чаще смотрю именно их:

LMArena — лидерборд, где сравнивают модели по категориям: кодинг, математика, сложные промпты, креативное письмо, диалоги, языки. Оценки ставят реальные пользователи, так что получается народное ранжирование.

EQ-Bench — проверяет эмоциональный интеллект у моделей: как они ведут диалог, есть ли эмпатия, соблюдают ли правила безопасности и т.д. По сути, бенчмарк на человечность общения. Кстати Sonnet 4.5 лучше всего пишет текста.

Artificial Analysis — тестирует по стандартным бенчмаркам, строит лидерборды и графики, а так же стоимость, размер контекста, скорость и задержки.

LiveBench — довольно честный бенчмарк: вместо заезженных тестов там реальные задания из живых сценариев. Актуальные задачи, защищённые от утечек в тренировочные датасеты.

SWE-Bench — для программистов.

Scale AI — меряют кодинг, рассуждения, безопасность, соответствие правилам. Плюс собирают обратную связь от enterprise-клиентов.

OpenRouter — удобно смотреть, что популярно и что используют.

Hugging Face Spaces — можно найти и общие лидерборды, и узкие бенчмарки.

@tips_ai #tools
👍167🔥4🫡1
Я редко делюсь промптами в канал — не вижу в этом смысла.

Сами LLM умеют придумывать и улучшать их лучше, чем я или кто-то ещё. Лучше заняться контекстом.

Хотя, мой пост набрал 862 репоста, а может стоит продолжать…

Самый простой способ — это создать свой своего личного промпт-инженера в Custom GPT и прикрутите к нему официальный гайд по промптам или возьмите готовые GPTs

Практически все, кто выпускает новые модели, делятся руководствами.

Например, у GPT-5 есть целый мануал на сайте OpenAI Cookbooks. Или у Google руководство по NanoBanano.

Загляните еще в prompts.chat — это первый и известный справочник промптов с 135к звезд на GitHub. Еще на этот сайт, захожу иногда.

Я перестал копить золотую коллекцию промптов, чаще всего сам наговариваю, но если нужно выкладывать в канал, дайте знать.

@tips_ai #prompt
1👍34🔥154🤡4🗿2😢1
Media is too big
VIEW IN TELEGRAM
Генерация изображений, работа в телекоме и... ваш будущий коллега? 🤖

Сбер приглашает погрузиться в мир реального ИИ — не фантастики, а рабочих инструментов, которые уже сегодня творят чудеса.

Ждем на митапе всех, кто хочет быть на острие технологий! Общение, нетворкинг и кофе-брейк прилагаются😉

Встречаемся 9 октября в 18:30 в Технохабе Сбера!

Регистрация на митап
8👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
У Perplexity вышел браузер Comet для всех пользователей

Кто постеснялся встать в очередь на передачу инвайтов или еще не получил инвайт, то сейчас можете скачать по ссылке.

Но без подписки Perplexity делать нечего, я активировал её на год тут.

@tips_ai #news
👍13🔥7🗿4