Заметки LLM-энтузиаста

Новые возможности для разработки агентов на базе API Anthropic 🤖

Продолжение предыдущего поста на тему новых функций в API, которые усиливают "агентные" возможности новых моделей Anthropic. Функции офигительные и заслуживают отдельного внимания.

Anthropic представила четыре новые функции для своего API, которые расширяют возможности разработчиков по созданию интеллектуальных агентов.
Эти инструменты дополняют недавно выпущенные модели Claude Opus 4 и Sonnet 4.

Что нового? 📋

1️⃣ Инструмент выполнения кода
Теперь Claude может запускать Python-код в изолированной среде для выполнения вычислений и создания визуализаций данных. Это превращает модель из помощника по написанию кода в полноценного аналитика данных.
Здесь весь фокус, как я понимаю, именно в том, что данная функциональность доступна "из коробки" через API интерфейс модели, и нам как разработчикам теперь можно обойтись без дополнительных песочниц типа https://e2b.dev/ для запуска кода в своем приложении - как мы видим, все полезные и часто используемые инструменты со временем "проникают" внутрь LLM'ок.

Основные применения:
• Финансовое моделирование
• Научные вычисления
• Бизнес-аналитика
• Обработка документов
• Статистический анализ

Организации получают 50 бесплатных часов использования ежедневно, после чего стоимость составляет $0,05 за час работы контейнера.

2️⃣ MCP-коннектор
Позволяет подключать Claude к любому удаленному серверу Model Context Protocol (MCP) из списка без необходимости писать клиентский код. API Anthropic автоматически управляет соединениями, обнаружением инструментов и обработкой ошибок.

Когда Claude получает запрос с настроенными MCP-серверами, он:
• Подключается к указанным серверам
• Получает доступные инструменты
• Анализирует, какой инструмент вызвать и какие аргументы передать
• Выполняет вызовы инструментов до достижения результата
• Управляет аутентификацией и обработкой ошибок
• Возвращает ответ с интегрированными данными

3️⃣ Files API
Упрощает хранение и доступ к документам при работе с Claude. Вместо загрузки файлов в каждом запросе, разработчики могут загрузить документы один раз и многократно ссылаться на них в разных беседах.

Files API интегрируется с инструментом выполнения кода, позволяя Claude напрямую обрабатывать загруженные файлы и создавать графики как часть ответа.

4️⃣ Расширенное кэширование запросов
Разработчики теперь могут выбирать между стандартным 5-минутным временем жизни (TTL) для кэширования запросов или расширенным 1-часовым TTL за дополнительную плату. Это 12-кратное улучшение может снизить расходы для длительных рабочих процессов агентов.

С расширенным кэшированием затраты могут быть снижены до 90%, а задержки — до 85% для длинных запросов.

Практическое применение 💡

Представьте AI-агента для управления проектами, который может:
• Подключаться к Asana через MCP-коннектор для работы с задачами
• Загружать отчеты через Files API
• Анализировать прогресс с помощью инструмента выполнения кода
• Поддерживать полный контекст на протяжении всего взаимодействия
и все это "из коробки" через API самой модели!

Все эти функции уже доступны в публичной бета-версии API Anthropic и дополняют существующие возможности, такие как веб-поиск и цитирование.

Видео-запись демонстрации A Day with Claude можно посмотреть здесь
Также вы можете отдельно прочитать транскрипт и саммари демонстрации.

#ai #anthropic #claude #api #development

Claude 4: Новое поколение AI-моделей от Anthropic 🚀

Как и ожидалось компания Anthropic представила новое поколение своих языковых моделей: Claude Opus 4 и Claude Sonnet 4. Обе модели устанавливают новые стандарты в программировании, аналитическом мышлении…

🔥4❤1

246 viewsedited 21:18

Заметки LLM-энтузиаста

Фоновые агенты Cursor: новый инструмент для разработчиков 🚀

Cursor представил новую функцию — Background Agent (Фоновый агент), которая сейчас находится в стадии предварительного тестирования и постепенно становится доступной ограниченному кругу пользователей.

Что такое Фоновый агент? 🤔

Это инструмент, позволяющий запускать несколько агентов Cursor параллельно на удаленной виртуальной машине. Вы можете поручить им разные задачи, а сами в это время заниматься другими делами.

В отличие от обычного агента Cursor, фоновый агент позволяет запускать несколько задач одновременно без необходимости ждать — вы просто просматриваете код после его выполнения, как если бы наняли команду разработчиков.

Ключевые возможности: 💻

• Выполнение сложных задач в удаленных контейнеризированных средах
• Поддержка нескольких агентов, выполняющих разные задачи параллельно
• Автоматическое создание PR и уведомление пользователей по завершении задачи
• Полная автономность без необходимости человеческого контроля или пошагового подтверждения

Варианты использования: 📋

Фоновый агент может быть полезен для различных задач, например, таких как:
• Исправление четко определенных ошибок
• Создание небольших и хорошо определенных функций
• Рефакторинг кода для улучшения структуры
• Генерация полной документации или API-справочников

Как использовать: 🛠

1️⃣ Нажмите Cmd + ' (или Ctrl + ') для открытия списка фоновых агентов с возможностью создать новый
2️⃣ После отправки запроса нажмите Cmd + ; (или Ctrl + ;) для просмотра статуса и входа в машину, на которой работает агент

Важные примечания: ⚠️

• Для использования фоновых агентов необходимо отключить режим конфиденциальности
• Требуется настройка среды через файл .cursor/environment.json
• Необходимо предоставить доступ к GitHub для клонирования и изменения репозитория
• Доступны только модели, совместимые с Max Mode (рекомендуется o3) - поэтому будьте готовы к возможному перерасходу токенов и денежных средств (чуть раньше писал про Max Mode на примере Claude Sonnet 3.7, впечатляет, что в этом режиме доступно до 200 последовательных вызовов агента без подтверждения)

Хотя технология еще не идеальна, она позволяет ускорить ИИ разработку (за дополнительную стоимость).

#cursor #ai_development #background_agent #coding_tools #developer_productivity

❤2👍2

344 views06:59

Заметки LLM-энтузиаста

Важен ли дизайн ПО в эпоху ИИ-кодинга? 🤔

Недавно прослушал интересный видео-подкаст с Джоном Остерхаутом, профессором компьютерных наук Стэнфордского университета и автором книги "Философия дизайна программного обеспечения". Он поделился мыслями о значимости дизайна ПО в эру искусственного интеллекта.

Ключевые выводы:

About

Blog

Apps

Platform