На днях вышел апдейт Manus 1.6
В ру комьюнити Манус не очень популярный из-за цены, как я понимаю.
Но ребята планомерно и уверенно шагают к
"one-shot task success"
Например попросил провести анализ и сгенерить слайды по теме
"Списки пожеланий на новогодние праздники и что люди друг другу дарят? насколько ожидания соотносятся с реальностью"
Так можно прям на слайде редактировать текст, в диалоге править дизайн и всё очень юзер-френдли.
Если цена изменится или увеличат бесплатные лимиты - то рекомендую добавить в закладки)
В ру комьюнити Манус не очень популярный из-за цены, как я понимаю.
Но ребята планомерно и уверенно шагают к
"one-shot task success"
Например попросил провести анализ и сгенерить слайды по теме
"Списки пожеланий на новогодние праздники и что люди друг другу дарят? насколько ожидания соотносятся с реальностью"
Так можно прям на слайде редактировать текст, в диалоге править дизайн и всё очень юзер-френдли.
Если цена изменится или увеличат бесплатные лимиты - то рекомендую добавить в закладки)
50❤2 1
Claude Code научился работать с браузером напрямую. Вот и отлетели пачка MCP для фронтедеров и тестировщиков)
Работает из коробки, гладко и без нареканий.
Вот Claude передает вам привет
Работает из коробки, гладко и без нареканий.
Вот Claude передает вам привет
51❤3🔥1 1
В последнее время вычитываю репозитории с агентскими плагинами и пресетами для claude code. Путешествие не самое приятное и объемное, но в какой-то степени этот путь предстоит пройти каждому.
Нашелся приятный агрегатор который явно рекомендую потыкать и почитать Skills ,
https://skillsmp.com/
Есть как документация по самой сущности skills для агентов, так и разбитые по категориям примеры с ссылками на github, куда можно провалиться,
А там, как правило - репозиторий - хранилище плагинов.
Рекомендую, как первую точку входа для решения задачи с "Поиск или написание скилла"
Нашелся приятный агрегатор который явно рекомендую потыкать и почитать Skills ,
https://skillsmp.com/
Есть как документация по самой сущности skills для агентов, так и разбитые по категориям примеры с ссылками на github, куда можно провалиться,
А там, как правило - репозиторий - хранилище плагинов.
Рекомендую, как первую точку входа для решения задачи с "Поиск или написание скилла"
SkillsMP
Agent Skills Marketplace - Claude, Codex & ChatGPT Skills | SkillsMP
Browse 71000+ agent skills compatible with Claude Code, Codex CLI and ChatGPT. The open standard SKILL.md format for AI coding assistants.
50❤4🤔1
SimpleAGI
Промо Claude Code на 7 дней. https://claude.ai/referral/HNmjGiJvXQ Жирно с тарифом PRO Установить Claude Code
Большое спасибо Вам, что поддержали меня!
С наступающим новым годом,
Желаю лишь находить удовольствие от нашей деятельности. Хотя бы иногда)
Надеюсь впереди нас ждут приятные сюрпризы и новые горизонты it'шных просторов.
И есть ещё пара бесплатных промо 7-дневных.
Счастливо🫥
С наступающим новым годом,
Желаю лишь находить удовольствие от нашей деятельности. Хотя бы иногда)
Надеюсь впереди нас ждут приятные сюрпризы и новые горизонты it'шных просторов.
И есть ещё пара бесплатных промо 7-дневных.
Счастливо
Please open Telegram to view this post
VIEW IN TELEGRAM
51❤1🎉1
У Claude Code Вышел большой апдейт.
Для Ru Комьюнити приятный бонус
Работает очень прикольно, все базовые промпты и какие-то системные сообщения переводятся на язык пользователя.
Не берусь судить, влияет ли язык на доли процентов повышения качества выполнения задач,
НО удовольствия от взаимодействия с приложением на родном языке явно больше.
Рекомендосьен!
И самый полезный апдейт для комьюнити:
- Hot-Reload Skills : теперь skills в ~/.claude/skills подхватываются мгновенно без рестарта. Это убирает friction при разработке собственных skills.
Но лично для меня - это будет боль)
Я пытаюсь пробраться сквозь сотни репозиториев сгенерированных Claude для Claude от кожанных мешков, чтоб улучшить процесс разработки и стандартизировать flow.
Пока у меня пополняются закладки, Obsidian и горит жопа. И меньше информации не станет)
😐
Для Ru Комьюнити приятный бонус
в ~/.claude/settings.json:14:
"language": "russian"
Эта настройка передаётся в мой системный промпт как инструкция:
"Always respond in russian. Use russian for all explanations, comments, and communications with the user."
Что это даёт:
- Все мои ответы на русском языке
- Пояснения и комментарии на русском
- Технические термины и идентификаторы в коде остаются в оригинале (английском)
Настройка применяется глобально ко всем проектам. Если хочешь переопределить для конкретного проекта, можно добавить в .claude/settings.local.json этого проекта.
Работает очень прикольно, все базовые промпты и какие-то системные сообщения переводятся на язык пользователя.
Не берусь судить, влияет ли язык на доли процентов повышения качества выполнения задач,
НО удовольствия от взаимодействия с приложением на родном языке явно больше.
Рекомендосьен!
И самый полезный апдейт для комьюнити:
- Hot-Reload Skills : теперь skills в ~/.claude/skills подхватываются мгновенно без рестарта. Это убирает friction при разработке собственных skills.
Но лично для меня - это будет боль)
Я пытаюсь пробраться сквозь сотни репозиториев сгенерированных Claude для Claude от кожанных мешков, чтоб улучшить процесс разработки и стандартизировать flow.
Пока у меня пополняются закладки, Obsidian и горит жопа. И меньше информации не станет)
Please open Telegram to view this post
VIEW IN TELEGRAM
50🎉1 1
Вот сижу, разбираюсь с этим апдейтом Skills, что-то тестирую.
И бац, мысля в голову прилетела.
Ведь всё, что ново-модно сейчас обсуждать с агентами в разработке
Декомпозиция. Специализация. Оркестрация. Контракты
Всё это используем уже десятилетия в микросервисах.
Фундаментально решить пытаемся одну и ту же задачу:
Микросервисы разбивают монолитное приложение на независимые сервисы.
А skills разбивают сложную задачу на специализированные "навыки", которыми владеет агент.
Обе архитектуры обещают: модульность, переиспользование, независимую эволюцию компонентов, возможность комбинировать базовые блоки в сложные системы.
Но как справедливо отмечает Guille Ojeda в своём анализе:
Фундаментальное различие: зачем мы декомпозируем
Микросервисы: структура приложения
Микросервисы появились как ответ на боли монолита: медленные релизы, неэффективное масштабирование, технологический lock-in, каскадные отказы. Это паттерн софтверной архитектуры, направленный на улучшение жизненного цикла разработки.
Декомпозиция в микросервисах привязана к бизнес-доменам — стабильным концепциям предметной области. Сервис CatalogService управляет каталогом товаров. PaymentService — платежами. Границы сервисов отражают границы бизнеса, что обеспечивает долгосрочную поддерживаемость.
Skills: структура задачи
Skills появились как ответ на ограничения LLM: сложные задачи требуют многошаговых процессов, доступа к внешним инструментам, сохранения контекста. Это паттерн AI-системного дизайна, направленный на достижение автономного, целеориентированного поведения.
Декомпозиция в Skills привязана к логике выполнения задачи — функциональным шагам, ролям, рабочим процессам. Skill pdf знает, как извлекать текст из PDF. Skill code-review знает, как проводить ревью кода. Границы Skills отражают границы экспертизы, а не бизнес-домены.
Ключевой инсайт: Микросервисы декомпозируют структуру приложения. Skills декомпозируют процесс решения задачи.
Ради этой таблички пишу пост
В AI-native разработке формируется своя иерархия:
И почему же не получается полностью перенести весь "опыт" разработки на агентские рельсы?
Мысль то моя не нова и есть десятки репозиториев со сложными сценариями на десятки агентов, со сложными сценариями, которые "копируют" процесс разработки и автоматизируют его.
НО дальше концепта и звезд на GitHub не идет?
___
Bounded Contexts из Domain-Driven Design отлично работают для микросервисов, но плохо подходят для Skills. Skill декомпозируется по функциональным шагам, а не по доменным границам.
Попытка создать "UserProfileSkill" по аналогии с "UserProfileService" приведёт к размытым границам и неэффективному использованию.
Заключение
Skills — это не "микросервисы для AI". Это новый архитектурный паттерн, который заимствует идеи декомпозиции из микросервисного мира, но применяет их к принципиально другой проблеме: оркестрации интеллектуального поведения.
И бац, мысля в голову прилетела.
Ведь всё, что ново-модно сейчас обсуждать с агентами в разработке
Декомпозиция. Специализация. Оркестрация. Контракты
Всё это используем уже десятилетия в микросервисах.
Фундаментально решить пытаемся одну и ту же задачу:
Как управлять сложностью через декомпозицию?
Микросервисы разбивают монолитное приложение на независимые сервисы.
А skills разбивают сложную задачу на специализированные "навыки", которыми владеет агент.
| Микросервисы | Skills |
|----------------------------------|---------------------------------|
| Независимые deployment units | Независимые SKILL.md файлы |
| API контракты (OpenAPI) | Контракты на естественном языке |
| Service discovery | LLM-роутинг по описаниям |
| Оркестрация (K8s) | Оркестрация через LLM |
Обе архитектуры обещают: модульность, переиспользование, независимую эволюцию компонентов, возможность комбинировать базовые блоки в сложные системы.
Но как справедливо отмечает Guille Ojeda в своём анализе:
Они обе делят сложность на управляемые части, но делают это по разным причинам и делят разную сложность.
Фундаментальное различие: зачем мы декомпозируем
Микросервисы: структура приложения
Микросервисы появились как ответ на боли монолита: медленные релизы, неэффективное масштабирование, технологический lock-in, каскадные отказы. Это паттерн софтверной архитектуры, направленный на улучшение жизненного цикла разработки.
Декомпозиция в микросервисах привязана к бизнес-доменам — стабильным концепциям предметной области. Сервис CatalogService управляет каталогом товаров. PaymentService — платежами. Границы сервисов отражают границы бизнеса, что обеспечивает долгосрочную поддерживаемость.
Skills: структура задачи
Skills появились как ответ на ограничения LLM: сложные задачи требуют многошаговых процессов, доступа к внешним инструментам, сохранения контекста. Это паттерн AI-системного дизайна, направленный на достижение автономного, целеориентированного поведения.
Декомпозиция в Skills привязана к логике выполнения задачи — функциональным шагам, ролям, рабочим процессам. Skill pdf знает, как извлекать текст из PDF. Skill code-review знает, как проводить ревью кода. Границы Skills отражают границы экспертизы, а не бизнес-домены.
Ключевой инсайт: Микросервисы декомпозируют структуру приложения. Skills декомпозируют процесс решения задачи.
В AI-native разработке формируется своя иерархия:
| Уровень | Традиционный | AI-Native |
|------------|----------------------------|-----------------------------------|
| Атомарный | Функция | Tool (Read, Write, Bash) |
| Экспертиза | Модуль | Skill (домен + workflow) |
| Автономный | Сервис | Agent (reasoning + tools) |
| Система | Приложение | Agentic Workflow |
И почему же не получается полностью перенести весь "опыт" разработки на агентские рельсы?
Мысль то моя не нова и есть десятки репозиториев со сложными сценариями на десятки агентов, со сложными сценариями, которые "копируют" процесс разработки и автоматизируют его.
НО дальше концепта и звезд на GitHub не идет?
___
Bounded Contexts из Domain-Driven Design отлично работают для микросервисов, но плохо подходят для Skills. Skill декомпозируется по функциональным шагам, а не по доменным границам.
Попытка создать "UserProfileSkill" по аналогии с "UserProfileService" приведёт к размытым границам и неэффективному использованию.
Заключение
Skills — это не "микросервисы для AI". Это новый архитектурный паттерн, который заимствует идеи декомпозиции из микросервисного мира, но применяет их к принципиально другой проблеме: оркестрации интеллектуального поведения.
258❤3 2
Забавное ощущение. На последних курсах, что проходил в https://shvm.xyz/ (не реклама, но там есть пара преподавателей - лапочек ), говорили
И сейчас я пытаюсь на GitHub найти один репозиторий, который я точно лайкал, но не могу найти.
Долистал до своих первых "звезд"
И знаете, книгу
Interpretable Machine Learning with Python
Которую я лайканул, судя по всему, года 4 назад, и разбираясь в блокнотах..
Такого сейчас я представить не могу, но, мне кажется, что это хорошо.
Я представляю какого-то зеленого парня, лет 20 в универе, который изредка ловит в голове мысли о своем реальном будущем, и я рад, что если появится мгновение\искра\мысль о программировании - то ему это будет многим легче "затестить".
Нужную мне библиотеку я не нашел, но вам рекомендую потыкать на GitHub вкладку Stars, можно окунуться в воспоминания, мне понравилось)
Вот из забавного:
- самый старый реп Паши - лайканул где-то в феврале 2024
Вы, скорее всего, будете уже разработчиками, которым не нужно знать теорию глубоко, но это будет очень хорошим преимуществом.
И сейчас я пытаюсь на GitHub найти один репозиторий, который я точно лайкал, но не могу найти.
Долистал до своих первых "звезд"
И знаете, книгу
Interpretable Machine Learning with Python
Которую я лайканул, судя по всему, года 4 назад, и разбираясь в блокнотах..
Такого сейчас я представить не могу, но, мне кажется, что это хорошо.
Я представляю какого-то зеленого парня, лет 20 в универе, который изредка ловит в голове мысли о своем реальном будущем, и я рад, что если появится мгновение\искра\мысль о программировании - то ему это будет многим легче "затестить".
Нужную мне библиотеку я не нашел, но вам рекомендую потыкать на GitHub вкладку Stars, можно окунуться в воспоминания, мне понравилось)
Вот из забавного:
- самый старый реп Паши - лайканул где-то в феврале 2024
shvm.xyz
ШВМ
Мы создаем программы по AI, которые позволяют воплотить в реальность один из самых популярных AI-сервисов. Начинаем с самых основ, пошагово объясняя каждый этап, и доводим вас до создания полноценного финального проекта.
1😁3💯2
Собеседование на AI-инженера в банк: три вещи, которые реально проверяют
Собрал в кучу инфу по теме AI-инженера. "Горячая" тема, судя по рилсам)
Типичная вакансия: Python, LLM, RAG, агенты, production. Но на собесе не проверяют знание этих слов. Проверяют три вещи:
1. Trade-off мышление - не "лучший подход", а "лучший для этой ситуации"
2. Production-фокус - как это будет жить, ломаться и стоить денег
3. Язык домена - говоришь ли ты на языке бизнеса, а не только на языке ML
___
1. Trade-off мышление
Нет "лучшего" решения. Есть решение, оптимальное для конкретных ограничений.
Chunking в RAG
Зрелый ответ: "Зависит от типа вопросов. Для фактовых - мельче, для аналитических - крупнее."
Retrieval
В проде почти всегда hybrid - потому что dense пропускает точные совпадения (аббревиатуры, коды), а sparse не понимает семантику.
Агент vs Граф
Для банка граф почти всегда лучше - регулятор любит предсказуемость.
Треугольник оптимизации
- Streaming - реальная latency та же, но UX кардинально лучше
- Кэширование мгновенные ответы, но риск устаревших данных
- Роутинг по сложности простые вопросы на дешёвую модель. 80% запросов обычно простые - экономия существенная
- Reranking - quality +, но latency -
___
2. Production-фокус
Сделать прототип — легко. Поддерживать систему, которая не деградирует - сложно.
Что может пойти не так
Безопасность агентов
Loop guard - мастхэв. Агент может решить, что ему нужно 50 вызовов API на простой вопрос.
Verifier - обязательный компонент
Собрал в кучу инфу по теме AI-инженера. "Горячая" тема, судя по рилсам)
Типичная вакансия: Python, LLM, RAG, агенты, production. Но на собесе не проверяют знание этих слов. Проверяют три вещи:
1. Trade-off мышление - не "лучший подход", а "лучший для этой ситуации"
2. Production-фокус - как это будет жить, ломаться и стоить денег
3. Язык домена - говоришь ли ты на языке бизнеса, а не только на языке ML
___
1. Trade-off мышление
Нет "лучшего" решения. Есть решение, оптимальное для конкретных ограничений.
Chunking в RAG
| Стратегия | Плюс | Минус | Когда выбирать |
|----------------|--------------------|--------------------|--------------------------|
| Мелкие чанки | Точнее поиск | Теряем контекст | Фактовые вопросы |
| Крупные чанки | Больше контекста | Шум в retrieval | Аналитические вопросы |
| Parent-child | И точность, и контекст | Два индекса, сложнее | Когда критично качество |
Зрелый ответ: "Зависит от типа вопросов. Для фактовых - мельче, для аналитических - крупнее."
Retrieval
| Метод | Плюс | Минус |
|------------------|----------------------|------------------------------------------|
| Dense (векторный) | Понимает семантику | Может пропустить exact match |
| Sparse (BM25) | Точный match | "РКО" ≠ "расчётно-кассовое обслуживание" |
| Hybrid | Лучшее из двух | Сложнее настройка |
В проде почти всегда hybrid - потому что dense пропускает точные совпадения (аббревиатуры, коды), а sparse не понимает семантику.
Агент vs Граф
| Подход | Плюс | Минус |
|---------------------|-------------------------------|-------------------------------------------------|
| Свободный агент | Гибкость | Непредсказуемость, дорого, сложно тестировать |
| Граф (state machine) | Воспроизводимость, аудируемость | Нужно продумать все пути заранее |
Для банка граф почти всегда лучше - регулятор любит предсказуемость.
Зрелый ответ: "Сначала смотрю, можно ли графом. Агент - когда реально нужна гибкость, а не красивая архитектура."
Треугольник оптимизации
QUALITY
△
/|\
/ | \
▽──┴──▽
LATENCY COST
- Streaming - реальная latency та же, но UX кардинально лучше
- Кэширование мгновенные ответы, но риск устаревших данных
- Роутинг по сложности простые вопросы на дешёвую модель. 80% запросов обычно простые - экономия существенная
- Reranking - quality +, но latency -
___
2. Production-фокус
Сделать прототип — легко. Поддерживать систему, которая не деградирует - сложно.
Что может пойти не так
| Проблема | Что происходит | Как заметить |
|-------------------|------------------------------------------|--------------------------------------|
| Устаревший индекс | Регламенты обновились, база старая | Рост ответов "информации нет" |
| Изменение модели | Провайдер обновил модель | Скачок метрик после апдейта |
| Падение интеграций | CRM или бэкенд недоступен | Рост таймаутов |
| Смена паттернов | Пользователи спрашивают о новом | Незнакомые вопросы в логах |
Безопасность агентов
| Механизм | Зачем |
|-------------------|--------------------------------------------------|
| Allowlist tools | Только разрешённые инструменты |
| Loop guard | Лимит шагов, времени, стоимости |
| Human-in-the-loop | Подтверждение на чувствительных действиях |
Loop guard - мастхэв. Агент может решить, что ему нужно 50 вызовов API на простой вопрос.
Verifier - обязательный компонент
Generate → Verify → Respond
2❤5🔥4
___
3. Язык домена
Понимаешь ли ты контекст, в котором система будет работать?
Метрики: о чём реально спросят
Не "accuracy модели", а бизнес-результат:
- Сколько обращений закрыл бот без человека? - главная метрика
- Сколько передали оператору? - и почему
- Сколько стоит закрыть одно обращение? - сравниваем с ценой оператора
- Как изменилось время обработки?
Если говоришь только про recall и precision - видно, что не думалвообще о продукте.
3. Язык домена
Понимаешь ли ты контекст, в котором система будет работать?
Метрики: о чём реально спросят
Не "accuracy модели", а бизнес-результат:
- Сколько обращений закрыл бот без человека? - главная метрика
- Сколько передали оператору? - и почему
- Сколько стоит закрыть одно обращение? - сравниваем с ценой оператора
- Как изменилось время обработки?
Если говоришь только про recall и precision - видно, что не думал
2🔥5❤1
Claude Code завезли Task Manager, но есть нюанс
Новая система управления задачами в Claude Code перешла от хранения списка дел в оперативной памяти к файловой структуре.
Но я наткнулся на недочёт, который ломает UX в реальной работе над проектами:
Таски создаются в глобальной директории Claude и привязываются к номеру сессии.
Из-за этого теряется консистентность и невозможно нормально возвращаться к задачам между сессиями в рамках одного проекта.
Я завёл issue:
https://github.com/anthropics/claude-code/issues/20425
✅ Временное решение без боли: wrapper "
Идея простая: запускать Claude Code через wrapper-скрипт, который автоматически выставляет
Плюс: если в будущем Anthropics это поправят - просто удаляете скрипт, и всё.
Я предлагаю запускать это через сам Claude Code, чтобы полностью понимать, что делает код, и не тянуть “скрипты из интернета”.
В Комментариях сам промпт.
Как пользоваться:
Заходите в папку проекта → запускаете
Новая система управления задачами в Claude Code перешла от хранения списка дел в оперативной памяти к файловой структуре.
Но я наткнулся на недочёт, который ломает UX в реальной работе над проектами:
Таски создаются в глобальной директории Claude и привязываются к номеру сессии.
Из-за этого теряется консистентность и невозможно нормально возвращаться к задачам между сессиями в рамках одного проекта.
Я завёл issue:
https://github.com/anthropics/claude-code/issues/20425
✅ Временное решение без боли: wrapper "
cc"Идея простая: запускать Claude Code через wrapper-скрипт, который автоматически выставляет
CLAUDE_CODE_TASK_LIST_ID по имени текущей директории (то есть по имени проекта).Плюс: если в будущем Anthropics это поправят - просто удаляете скрипт, и всё.
Я предлагаю запускать это через сам Claude Code, чтобы полностью понимать, что делает код, и не тянуть “скрипты из интернета”.
В Комментариях сам промпт.
Как пользоваться:
Заходите в папку проекта → запускаете
cc вместо claude → таски “приклеиваются” к проекту.1❤3 3🔥2