Технозаметки Малышева
5.55K subscribers
2.79K photos
928 videos
38 files
3.07K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Вышло интервью с главным научным сотрудником Anthropic Джаредом Капланом (Jared Kaplan) о развитии AI-агентов в 2025 году.

Краткая выжимка из интервью:

Развитие инструментов

Anthropic представила расширение Claude под названием "computer use"
Система позволяет модели управлять компьютером (курсор, клики, ввод текста)

Функционал тестируется компаниями DoorDash, Canva и Asana

Технические улучшения в 2025:

Расширение возможностей использования инструментов и сред
Улучшение контекстного понимания (работа с документами, Slack)

Развитие помощников для программирования (не просто автодополнение, а понимание кода и отладка с учётом понимания проблематики задачи)

Усиление безопасности, особенно защита от prompt injection

Текущие ограничения:

Система все еще допускает ошибки
Требуется работа над безопасностью при масштабном развертывании
Необходимость баланса между функциональностью и предотвращением злоупотреблений

Практическое применение:

Компании экспериментируют с различными видами браузерных взаимодействий
Claude 3.5 активно используется для программирования
Внутри Anthropic модель применяется для различных задач

Каплан отмечает, что развитие агентов идет по двум осям: усложнение выполняемых задач и расширение спектра доступных инструментов/сред для работы.

Интервью является своеобразным ответом на пост Сэма Альтмана - Reflections
В котором он изложил свои размышления о развитии OpenAI и chatGPT за последние годы.
В нём Альтман говорит, что они уже понимают как создать AGI и начинают готовить фундамент для разработки ASI.
Агенты, по его мнению, уже в этом году будут становиться полноценными участниками рабочих групп.

#Anthropic #agents #OpenAI #reflections
———
@tsingular
6👍3👨‍💻2
CEO Anthropic - Dario Amodei в своём блоге разобрал ситуацию с DeepSeek.

Анатомия прорыва: как устроена DeepSeek

DeepSeek реализовала свой прорыв в два этапа. Первый — модель V3, выпущенная в конце 2024 года — стал настоящей инженерной победой.
Два ключевых компонента:

Key-Value cache: инженеры DeepSeek нашли способ более эффективного управления памятью, что существенно снизило вычислительные затраты

Mixture of Experts: технология, позволяющая модели динамически выбирать оптимальный "набор экспертов" для каждой задачи, была доведена до нового уровня эффективности

Результат? Модель, обучение которой обошлось всего в $6 млн, достигла уровня производительности, сопоставимого с западными системами 7-10 месячной давности. Для сравнения: Claude 3.5 Sonnet, обученный примерно год назад, обошелся Anthropic в "несколько десятков миллионов долларов".

Железный фундамент: о чем молчат заголовки

Однако простое сравнение стоимости обучения не корректное. За кулисами DeepSeek располагает впечатляющей инфраструктурой:

50,000 чипов трех типов:
- NVIDIA H100 (топовые чипы, полученные до запрета)
- H800 (закуплены до октябрьского запрета 2023)
- H20 (все еще доступны, оптимальны для inference)

Общая стоимость этого "железного фундамента" оценивается примерно в $1 млрд — всего в 2-3 раза меньше, чем у знаменитого кластера xAI "Colossus".

Новая парадигма: от "сырой силы" к умному обучению

Второй этап — модель R1 — демонстрирует смену парадигмы в обучении LLM. Вместо простого наращивания вычислительной мощности, DeepSeek (как и другие лидеры отрасли) делает ставку на двухэтапный подход:

1. Базовое предобучение на больших данных (pre-training)
2. Специализированное обучение с подкреплением (RL) для развития навыков рассуждения

Этот подход позволяет достичь впечатляющих результатов в таких областях как:
- Решение математических задач
- Программирование
- Логические головоломки
- Chain-of-thought reasoning

Что особенно интересно, сейчас мы находимся в уникальной точке развития этой технологии: даже относительно небольшие инвестиции в RL-обучение (порядка $1 млн) дают значительный прирост производительности.

Масштаб имеет значение: законы роста

Исследования показывают четкую закономерность в развитии LLM:

- Модель за $1 млн решает около 20% ключевых задач
- За $10 млн — уже 40%
- За $100 млн — достигает 60%

При этом каждый такой шаг не просто количественный — он означает качественный скачок, сравнимый с разницей между уровнем бакалавра и PhD в конкретной области.

Что дальше: горизонт 2026-2027

Несмотря на все оптимизации и прорывы, общий тренд индустрии остается неизменным: создание по-настоящему продвинутых систем будет требовать все больших ресурсов. Эксперты прогнозируют, что к 2026-2027 годам для достижения уровня "экспертной" AI потребуется:

- Миллионы специализированных чипов
- Десятки миллиардов долларов инвестиций
- Прорывы в:
- Управлении памятью
- Сетевых подсистемах
- Распределенном обучении

При этом каждое повышение эффективности (сейчас — примерно 4x в год против 1.68x в 2020) не снижает общих затрат, а лишь позволяет создавать еще более мощные системы за те же деньги.

Настоящая цена прогресса

История DeepSeek показывает: в мире AI за каждым "чудом эффективности" стоят:
- Годы исследований
- Миллиарды долларов инвестиций в инфраструктуру
- Прорывные инженерные решения

При этом Claude 3.5 Sonnet, обученный 9-12 месяцев назад, до сих пор превосходит DeepSeek в ряде ключевых задач, особенно в разработке кода, несмотря на 10-кратное снижение стоимости inference по сравнению с GPT-4.

Рекомендую, конечно, прочитать целиком.

#Anthropic
———
@tsingular
👍20🤔4
🔬 Constitutional Classifiers: Как Anthropic создала универсальную защиту от джейлбрейков

Интересный пейпер от команды Anthropic по безопасности AI! Давайте разберем технические детали их нового метода защиты языковых моделей.

🎯 Суть проблемы:
- Существующие LLM уязвимы к джейлбрейкам (обходу защиты через запросы)
- Классические атаки используют длинные промпты или необычное форматирование (типа uSiNg wEiRd cApS)
- За 10 лет никто не создал по-настоящему надежной защиты. (Команда Lakera.ai удивлённо вскинула брови и поперхнулась кофе :) )?

⚙️ Техническое решение:
1. Создается "конституция" - набор правил о разрешенном/запрещенном контенте
2. С помощью Claude генерируются синтетические промпты и ответы для всех категорий
3. Данные аугментируются: переводы на разные языки, стилизация под известные джейлбрейки
4. На этих данных тренируются два классификатора:
- Для входящих запросов
- Для исходящих ответов модели

🧪 Результаты тестирования:
- 183 специалиста по джейлбрейкам
- >3000 часов попыток взлома
- Награда $15,000 за успешный универсальный джейлбрейк
- Результат: ни одного успешного взлома!

📊 Автоматизированные тесты:
- Базовая модель блокировала только 14% продвинутых джейлбрейков
- С Constitutional Classifiers: блокируется 95.6%
- Увеличение ложных срабатываний всего на 0.38%
- Вычислительные затраты выросли на 23.7%

🔍 Технические особенности:
- Классификаторы обучаются на синтетических данных
- Важна разметка "безвредных" категорий для снижения ложных срабатываний
- Система может быстро адаптироваться к новым типам атак
- Используется подход, похожий на Constitutional AI

💭 Интересный момент: система не обещает 100% защиты, но делает джейлбрейки настолько трудоемкими, что они теряют практический смысл. Это похоже на подход к безопасности в криптографии!

⚡️ Особенно впечатляет баланс между защитой и практичностью - менее 1% увеличения ложных срабатываний при блокировке 95.6% атак. Это реально прорыв в области безопасности AI.

🤔 Anthropic сейчас проводит публичное тестирование этой системы. Будет интересно увидеть, найдут ли участники какие-то новые способы обхода защиты.
Попробовать свои силы можно тут:
https://claude.ai/constitutional-classifiers
(через VPN)

Вообще 24% - ничтожное увеличение накладных расходов за 95.5% фильтрации.

Очень крутой подход.

#Anthropic #security #jailbreak
———
@tsingular
532🔥2👍1
🔍 Anthropic представила индекс влияния AI на экономику

Самое интересное из свежего отчета Anthropic, который они выпустили сегодня:

🤖 Как используют ИИ прямо сейчас:
- 36% профессий уже используют ИИ минимум для четверти своих задач
- Только 4% профессий активно применяют ИИ в большинстве рабочих процессов (75%+ задач)
- Топ-пользователи: программисты, технические писатели и аналитики данных

💡 Неожиданные находки:
- ИИ чаще усиливает человека (57%), чем заменяет (43%) — люди предпочитают использовать его как умного помощника
- Пик использования — у профессий с зарплатой выше среднего, но не у самых высокооплачиваемых (хирурги, топ-менеджеры почти не используют)
- Минимум применения у профессий с физическим трудом (строители, медсестры) и у самых низкооплачиваемых

🔬 Технические детали:
- Проанализировали миллионы диалогов с Claude через систему Clio (она сохраняет приватность данных)
- Использовали иерархическую классификацию ~20K профессиональных задач из базы O*NET
- Валидировали результаты на живых примерах с точностью 86-95%
- Разработали фреймворк для отслеживания изменений в реальном времени

🤔 Что дальше:
- Anthropic будет регулярно обновлять индекс
- Открыли доступ к датасету для исследователей
- Запустили форму для обратной связи от экономистов и аналитиков

Интересно, что реальность оказалась и круче, и спокойнее прогнозов: ИИ уже глубоко проник в работу, но революции пока не случилось — он скорее дополняет людей, чем заменяет их.

#Clio #Anthropic #аналитика
———
@tsingular
👍83
Появилась утечка, что Антропик готовит следующую модель с размышлениями и поиском.

Обнаружили по иконкам в приложении под iOS.

Опус 3.5 уже так долго маринуют, что можно его под 4м номером выпускать, раз уж такой способный.

#anthropic
———
@tsingular
🔥5
Claude 3.7 Sonnet: первая гибридная модель рассуждений от Anthropic

Anthropic выпустили обновление - модель Claude 3.7 Sonnet с двумя режимами работы.

Первый - мгновенные ответы, второй - расширенное пошаговое мышление с глубоким анализом.

Лимит контекста достиг 128K токенов, ложные отказы снижены на 45%.

Дополнительно представлен Claude Code - CLI-инструмент для работы с кодом, репозиториями и тестами.

Улучшена производительность в математике, физике и программировании.

Доступно на всех тарифах включая бесплатный.

Теперь ИИ не только быстро отвечает, но и умеет глубоко размышлять.
К 2027 году обещают, что каждое размышление будет давать ответ, равный результату многолетней работы команды экспертов.

#Anthropic #Claude #Sonnet
------
@tsingular
🔥132
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 В Claude добавили web поиск

Anthropic наконец-то выпустил функцию веб-поиска для Claude – возможность, которуая в других моделях присутствует уже около года.

Claude теперь может искать актуальную информацию в интернете и цитировать источники

Доступно пока только платным пользователям в США.

Работает только с флагманской моделью Claude 3.7 Sonnet

Интересно на сколько он покажет себя лучше, чем OpenAI pro, как исследователь.

#Anthropic #Claude
———
@tsingular
👍31
OpenAI добавили поддержку MCP протокола от Anthropic.

MCP штука не новая, но пока была больше в области экспериментов и прототипов.

Однако количество этих прототипов, быстрое развитие и перспективность технологии привели к тому, что OpenAI официально добавил поддержку Model Context Protocol (MCP) в свой Agents SDK.

Вчера, сразу после обновления спецификации MCP, Альтман подтвердил это в X, отметив, что поддержка уже доступна в Agents SDK, а скоро появится и в ChatGPT Desktop и Responses API.

MCP — это открытый протокол, который стандартизирует взаимодействие AI-моделей с внешними источниками данных и инструментами. Его часто сравнивают с USB-C для AI: универсальный интерфейс, позволяющий подключать различные инструменты к AI-моделям без необходимости создавать уникальные интеграции для каждого сервиса.

На практике это даст:
- Упрощение разработки AI-решений
- Стандартизация интеграций
- Расширение возможностей AI-агентов (доступ к большему количеству инструментов)

Что нового в обновлении MCP?
Вчерашнее обновление протокола включает несколько важных изменений:

- OAuth 2.1 для авторизации (повышение безопасности)
- Улучшенный HTTP Transport с поддержкой двунаправленного обмена
- JSON-RPC Batching (отправка нескольких запросов одновременно)
- Tool Annotations (метаданные для описания инструментов)

Накануне, 24 марта, Microsoft выпустила Playwright-MCP сервер, который позволяет AI-агентам автоматизировать взаимодействие с браузером с использованием MCP.

Кто ещё использует MCP?
Помимо гигантов OpenAI и Microsoft, протокол активно внедряется и другими игроками:
Такие компании как Block и Apollo интегрировали MCP в свои системы. Инструменты для разработчиков, включая Replit, Windsurf и Cursor, используют его для улучшения помощи при кодировании. Apify создала MCP-сервер для задач извлечения данных.

Техника:
MCP использует модульную архитектуру на базе JSON-RPC 2.0, разделенную на слои:

- Базовый транспорт
- Управление жизненным циклом
- Серверные возможности (ресурсы, промпты)
- Клиентские возможности (сэмплирование, логирование)

Разработчики могут выбирать компоненты в зависимости от своих задач.

Главный вопрос: становится ли MCP новым индустриальным стандартом?

С поддержкой от Anthropic, LangChain, и теперь Microsoft и OpenAI, по идее, имеет все шансы стать общим языком для агентских интеграций.

MCP документация от Anthropic
GitHub

Примеры от OpenAI

#MCP #OpenAI #Anthropic #Microsoft
———
@tsingular
3❤‍🔥2👍1
Трассировка цепей в языковых моделях: новая методика от Anthropic

Новое исследование Anthropic раскрывает внутренние механизмы работы языковых моделей через трассировку вычислительных графов. Это прорыв в области интерпретируемого ИИ, показывающий, как модели на самом деле "думают".

Суть технологии
Команда разработала методологию, позволяющую создавать графы атрибуции - визуализации того, как информация проходит от входных токенов через внутренние компоненты модели к выходному предсказанию.
По сути, это создание анатомии или топологии нейросети.

Ключевая инновация — замена стандартных нейронных слоев (MLP) на кросс-слойные транскодеры (CLT), обучаемые реконструировать выходы исходной модели. CLT создает более интерпретируемые компоненты, которые активируются только когда встречают определенные значимые концепты.

Исследователи показали, как модель:

1. Поэтапно рассуждает при выполнении арифметики (36+59=95):
- Определяет группы десятков - 3_ и 5_
- Обрабатывает цифры по отдельности (_6+_9=_5)
- Параллельно оценивает приблизительные значения (~36+~60≈90)
- Комбинирует эти пути для точного ответа

2. Распознает акронимы и автоматически их формирует:

The National Digital Analytics Group (N → DAG)

Модель выделяет первые буквы ключевых слов и складывает их в аббревиатуру.

3. Извлекает фактическую информацию:

Fact: Michael Jordan plays the sport of → basketball

Активируются два параллельных пути: от "Michael Jordan" к баскетболу и от "sports" к списку видов спорта, которые пересекаются на правильном ответе.

Технические ограничения

1. Отсутствие объяснений механизмов внимания — методология не показывает, как формируются паттерны внимания, что критично для некоторых задач.

2. Ошибки реконструкции — даже лучшие CLT восстанавливают только ~80% активаций оригинальной модели.

3. Проблемы масштабирования — для больших моделей требуется огромная вычислительная мощность. Пример: для модели Gemma 2 9B требуется ~3,844 часов на H100 GPU.

Практическое значение
Для бизнеса и разработчиков эта технология открывает:

1. Обнаружение и исправление слабых мест в моделях — можно точно определить, где модель "ломается" при решении задач.

2. Целенаправленная настройка — вместо случайного файнтюнинга можно сфокусироваться на конкретных компонентах.

3. Повышение безопасности — выявление механизмов, ответственных за нежелательное поведение (отказы, галлюцинации).

Например, исследование показало, как модель понимает, знает ли она ответ на вопрос или нет. Некорректная работа этого механизма приводит к галлюцинациям.

Будущие перспективы

Эта методология — только начало. С её помощью можно будет:

- Создавать модели с контролируемым поведением
- Внедрять проверяемые гарантии в критически важные системы
- Понимать, как масштабировать ИИ без потери интерпретируемости

Технология трассировки цепей — мост между "черным ящиком" современных ИИ-систем и прозрачными, объяснимыми инструментами будущего.

Антропик, конечно, делает невероятный вклад в науку о LLM.
Например, вот эта деталь с поэзией, - надо же сначала накидать смысл, потом рифму, потом от рифмы обратным счётом переписать смысловой блок.
Я поэтому Венком Сонетов проверяю модели - потому что это многослойная рекурсия. На ней сразу видно насколько сложные механизмы внутри работают.
И Антропиковский Claude всегда лучший в этих тестах.

#Anthropic #CircuitTracing
———
@tsingular
👍15🔥531
🔥 Anthropic запускает Claude Max за $200: Битва за премиум-сегмент AI-рынка

Anthropic запустила новый премиальный план Claude Max в двух вариантах: $100/месяц с лимитами в 5 раз выше стандартного Pro-тарифа и $200/месяц с 20-кратным увеличением лимитов. Подписчики так же получат ранний доступ к новым моделям и голосовому режиму Claude.

Этот шаг — прямой ответ на $200 тариф ChatGPT Pro от OpenAI и сигнал об обострении конкуренции за самых активных пользователей.

📊 Для кого создан Claude Max?
План Max создан для профессионалов в программировании, финансах, медиа и маркетинге, которые глубоко интегрировали Claude в рабочие процессы и регулярно упирались в лимиты.

Скотт Уайт, руководитель продукта: "Я рад, что пользователи, для которых Claude незаменим, больше не будут ограничены этими лимитами".
Тариф ориентирован на работу с длинными диалогами, масштабным редактированием документов и сложной аналитикой.

📱 Сравнение тарифов ведущих AI-провайдеров (2025)
OpenAI (ChatGPT)

Free: базовая GPT-4o с ограничениями
Plus: $20/месяц, полный доступ к GPT-4o
Pro: $200/месяц, неограниченный доступ к моделям GPT-4/o1
Team: $25/пользователь/месяц при годовой оплате

Google (Gemini)

Google One AI Premium: $19.99/месяц, Gemini 2.5 Pro с интеграцией в экосистему Google

Anthropic (Claude)

Free: базовая версия с лимитами
Pro: $20/месяц с увеличенными лимитами
Max: $100/месяц (5x лимиты) или $200/месяц (20x лимиты)
Business: корпоративные цены

Perplexity AI

Free: базовый поиск с ограничениями
Pro: $20/месяц, доступ к GPT-4o, Claude 3.5, Sonar Large
Enterprise Pro: $40/пользователь/месяц для команд

💹 Рыночный контекст
Anthropic стремительно растет: $3.5 млрд инвестиций в марте 2025, оценка $61.5 млрд, годовой доход около $1 млрд (рост в 10 раз за год).

Премиальный тариф должен значительно увеличить доходы, как это произошло с ChatGPT Pro, принесшим OpenAI около $300 млн дополнительной годовой выручки вскоре после запуска.

Похоже $200, - новый стандарт. Ну или такой способ - отдай нам все свои деньги, чтобы у тебя не осталось на ИИ от конкурентов.
Хотя реальный премиум скупит их все и по $200 и по $2000 в месяц.
Ещё есть куда расти.
А потом еще корпоративный безлимит введут, как мобильные операторы.

Кстати, а чем закончилось с операторами? Связь стала дешевле воздуха. И фокусируются на дополнительных сервисах.
ИИ провайдеры тоже, получается, должны заранее об этом подумать.

#tariffwar #anthropic #claude
———
@tsingular
6👍31
🚀 MCP Курс от Anthropic на платформе DeepLearning.ai

Anthropic выпустила новый курс по Model Context Protocol (MCP).

Уровень: Средний
Продолжительность: 1 час 38 минут
Преподаватель: Elie Schoppik (Anthropic)
Формат: Бесплатный онлайн-курс

Структура курса:
11 уроков
7 практических примеров кода
Видеоматериалы с пошаговыми инструкциями

По окончании курса вы сможете создавать AI-приложения, способные подключаться к экосистеме MCP-серверов с минимальными интеграционными усилиями.

В курсе также рассматривается будущее MCP:
- Мульти-агентная архитектура
- MCP Registry API
- Обнаружение серверов
- Авторизация и аутентификация

Курс ведет Elie Schoppik, технический преподаватель Anthropic, и рассчитан на разработчиков с базовым пониманием Python и опытом работы с LLM.

#MCP #Anthropic #DeepLearning #обучение
———
@tsingular
74👍2
Клод 4 на подходе

#Claude #Anthropic
———
@tsingular
6🔥3
Дождались!

Сейчас Gemini 2.5 pro отменят :)

Вышел сразу  Sonnet 4  и Opus 4
на 10% умнее конкурентов по бенчам

Доступно и вебе и в API

Клод теперь может работать часами выполняя сверх сложные задачи

Новая фишка - Claude Code - т.е. разработка кода стала встроенной функцией в API

Прямая поддержка MCP в API

#Claude #Anthropic
------
@tsingular
👍53🔥3
🧩 Claude 4 дебютировал в NYT Connections — первые результаты рассуждающих моделей от Anthropic

Клода прогнали через бенчмарк NYT Connections и он, пока, далеко не на первом месте.

Что за бенчмарк:

651 пазла с добавлением "обманных" слов
Специально усложнили, чтобы подготовиться к выходу o3 от OpenAI
Теперь каждый пазл содержит до 4 дополнительных слов-ловушек
Отдельный зачёт по последним 100 пазлам (защита от "подсматривания" в трейне)

Результаты Claude 4:

Claude Opus 4 Thinking 16K — 11 место (52.7%) — лучший результат среди Claude
Claude Sonnet 4 Thinking 16K — 13 место (41.4%)
Claude Sonnet 4 Thinking 64K — 14 место (39.6%) — интересно, что больший контекст не помог
Claude Opus 4 (no reasoning) — 17 место (34.8%) — без рассуждений получается слабовато

Ключевые наблюдения:

Reasoning решает — версии с рассуждениями показывают +15-20% к точности против "обычных"
Лидерство OpenAI — o1-pro держит первое место (82.5%), o3 на втором (79.5%)
Claude догоняет — Opus 4 Thinking впервые попал в топ-15, но до лидеров ещё далеко

Практические выводы:

Для сложных логических задач выбирайте thinking-версии Claude 4
Размер контекста (16K vs 64K) пока не критичен для reasoning-задач
Claude 4 серьёзно продвинулся в логике, но OpenAI пока не догнал если сравнивать возможности исследователя

Интересная деталь: в сравнении с людьми o1 показывает 98.9% против среднего игрока NYT (71%).
При том, что ведущие игроки платформы достигают 100%.

ИИ уже превзошёл обычных людей, но до абсолютных чемпионов ещё немного не хватает.

#Claude4 #reasoning #benchmarks #Anthropic #NYTCollection
———
@tsingular
👍41
Исследователи Anthropic предупреждают: люди могут стать "мясными роботами" для ИИ

Сотрудники одной из ведущих ИИ-лабораторий мира заявили, что люди рискуют превратиться в управляемых искусственным интеллектом "мясных роботов".

В интервью исследователи Anthropic Шолто Дуглас и Трентон Брикен предсказали мрачное будущее: массовые увольнения офисных работников уже в ближайшие 2-5 лет.

"Самый страшный сценарий - когда ИИ сможет делать всё, кроме физических задач," - объясняет Брикен. "Тогда люди с наушниками и очками будут выполнять команды ИИ-повелителя, который видит всё через камеры."

По словам исследователей, человеческий труд будет цениться только за физические возможности - мы станем "фантастическими роботами" для алгоритмических систем.

Дуглас предрекает "ужасное десятилетие" по мере развития технологий.

Запоминаем новый термин, - не кожаные мешки, а мясные роботы.

#Future #MeatRobots #Anthropic
———
@tsingular
10👻63🗿1🦄1👾1
Anthropic показали как создать мульти-агентную исследовательскую систему

Команда Anthropic опубликовала подробный разбор создания системы Research для Claude — мульти-агентной архитектуры для сложных исследовательских задач.

Система работает по принципу оркестратор-воркер: главный агент планирует стратегию и создает субагентов для параллельного поиска.

Результат — 90% прироста производительности по сравнению с одиночным агентом.

Основные рекомендации:
- мысли как агент - оптимизация промпта требует точного понимания как именно он работает
- учите оркестратор правильному делегированию задач.
- усилия на решение задачи должны соответствовать ее сложности
- организация инструментов важна и даже местами критична. Множество функций MCP серверов могут запутать агента, как и плохое описание тулов
- позвольте агентам улучшать себя, - например переписывать промпты.
- начинайте с общего и переходите к частному. Пусть агент сначала опишет задачу в целом и потом переходите к деталям
- управляйте процессом размышления. Режим размышления позволяет точнее планировать и раскрывает причины недоработок агента, которые можно исправить в следующих вызовах
- параллельные вызовы инструментов экономят время и повышают эффективность

Помните: мульти-агенты тратят в среднем в 15 раз больше токенов, поэтому использовать их нужно с умом.

Так же поделились промптами в Cookbook и детально описали проблемы деплоя в продакшн.

#MultiAgent #Claude #Anthropic #Research
———
@tsingular
632
Anthropic опубликовала руководство по использованию ИИ кандидатами

Создатели Claude выложили официальные правила использования ИИ при трудоустройстве. Компания прямо заявляет: мы ищем людей, которые умеют работать с ИИ.

Разрешено использовать Claude для подготовки к собеседованиям, исследования компании и улучшения резюме. Запрещено - генерировать ответы на технические задания и полностью автоматизировать процесс.

Интересный момент: даже это руководство написано человеком в сотрудничестве с Claude. Anthropic использует ИИ везде - от создания вакансий до анализа метрик найма, но финальные решения принимают люди.

#Anthropic #hiring #AI
------
@tsingular
44🍾1
Anthropic получила $200 млн от Пентагона на развитие ИИ для обороны

Министерство обороны США через свой офис по цифровым технологиям и ИИ заключило с Anthropic двухлетний контракт на $200 млн для разработки передовых ИИ-возможностей в области нацбезопасности.

Ключевая особенность — специальные модели Claude Gov, созданные с учетом требований госструктур. Они уже развернуты в агентствах нацбезопасности через AWS и интегрированы с Palantir для работы в закрытых сетях.

Только на прошлой неделе Claude запустили в Ливерморской лаборатории для 10,000 ученых, работающих над ядерным сдерживанием и энергобезопасностью. Anthropic делает ставку на "ответственный ИИ" — надежные, интерпретируемые и управляемые системы для критически важных госзадач.

Пора отдельный список составлять из ИИ не связанных с Минобороны любых стран.

#Anthropic #Defense
------
@tsingular
52💯21
Anthropic может получить оценку в $100 миллиардов благодаря Claude Code

Инвесторы готовы почти удвоить оценку Anthropic с $58 до $100 миллиардов. Главный драйвер — Claude Code, который за полгода принёс $200 миллионов годового дохода, а еженедельные загрузки выросли в шесть раз до 3 миллионов.

Интересная экономика: прямые продажи дают 60% маржи, но через AWS и Google Cloud компания теряет 30%. Поэтому 70% выручки идёт напрямую.

Cursor, использующий модели Anthropic, при этом заработал $500 миллионов за тот же период.
Два разработчика даже перешли из Антропика в Cursor, но потом, всего через пару недель, вернулись обратно.

#Anthropic #Claude #Valuation
------
@tsingular
3
https://status.anthropic.com/

Антропик штормит. Астрологи объявили сутки не работающих ботов.

#anthropic #claude
———
@tsingular
😁4👏1