SGR-Agent-Core
700 звезд пробили!
Сегодня будет крупная обнова следим тут:
https://github.com/vamplabAI/sgr-agent-core
Планирую для ERC3 использовать этого агента доработаю только tool_kit, а ты уже готов?
700 звезд пробили!
Сегодня будет крупная обнова следим тут:
https://github.com/vamplabAI/sgr-agent-core
Планирую для ERC3 использовать этого агента доработаю только tool_kit, а ты уже готов?
50🔥49👍10👏6💯2
Media is too big
VIEW IN TELEGRAM
Как прошёл Вайб Цех 😍
Ловите топовый клип про то как прошел наш митап!
+ Фото
+ Запись стрима!
Семь топовых спикеров из бигтеха, более 50 гостей в Цехе и 1600+ зрителей онлайн.
Подготовили для вас записи докладов в ВК и на YouTube (в самом конце фрагмент, который видели только гости офлайн площадки!)
Скачивайте презентации про то, как вайбкодинг меняет индустрию разработки🔗
Заполняйте форму обратной связи, чтобы мы становились лучше, а также ищите себя на фотографиях с митапа и погружайтесь в цеховую атмосферу в отчётном ролике.
Будем ждать вас на следующих митапах😊
Ловите топовый клип про то как прошел наш митап!
+ Фото
+ Запись стрима!
Семь топовых спикеров из бигтеха, более 50 гостей в Цехе и 1600+ зрителей онлайн.
Подготовили для вас записи докладов в ВК и на YouTube (в самом конце фрагмент, который видели только гости офлайн площадки!)
Скачивайте презентации про то, как вайбкодинг меняет индустрию разработки
Заполняйте форму обратной связи, чтобы мы становились лучше, а также ищите себя на фотографиях с митапа и погружайтесь в цеховую атмосферу в отчётном ролике.
Будем ждать вас на следующих митапах
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍19 7❤3
Forwarded from red_mad_robot
Дисциплина для LLM: как схемы делают рассуждения управляемыми
Несмотря на появление всё более сложных моделей, их поведение остаётся непредсказуемым: один и тот же запрос может давать разные ответы, а ход рассуждений — теряться.
В новой статье на Habr показываем, как Schema-Guided Reasoning (SGR) помогает управлять reasoning-процессами, делимся примерами из практики и рассказываем, как команда R&D red_mad_robot развивает этот подход вместе с комьюнити в open-source-проекте SGR Deep Research.
#AI_moment #роботайм
↗️ red_mad_robot
Несмотря на появление всё более сложных моделей, их поведение остаётся непредсказуемым: один и тот же запрос может давать разные ответы, а ход рассуждений — теряться.
В новой статье на Habr показываем, как Schema-Guided Reasoning (SGR) помогает управлять reasoning-процессами, делимся примерами из практики и рассказываем, как команда R&D red_mad_robot развивает этот подход вместе с комьюнити в open-source-проекте SGR Deep Research.
#AI_moment #роботайм
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥11❤5👏2
Очень круто!
Обожаю что-то про 3д и это Миша который у нас в РНД еще и агентов создает!
🔽🔽🔽🔽🔽🔽
https://t.iss.one/neuraldeep/1729
Залетаем ставим ему звездочку в гит
Репо: https://github.com/martianovdev/Defold-BRDF-Deferred-Rendering-V2
История:
https://t.iss.one/MartianovTech/2
https://t.iss.one/MartianovTech/46
https://t.iss.one/MartianovTech/42
Обожаю что-то про 3д и это Миша который у нас в РНД еще и агентов создает!
🔽🔽🔽🔽🔽🔽
https://t.iss.one/neuraldeep/1729
Залетаем ставим ему звездочку в гит
Репо: https://github.com/martianovdev/Defold-BRDF-Deferred-Rendering-V2
История:
https://t.iss.one/MartianovTech/2
https://t.iss.one/MartianovTech/46
https://t.iss.one/MartianovTech/42
Forwarded from MartianovTech
Поставлю точку на проекте и теперь позволяю ковырять его палками всем гражданам!
Довел до публичного релиза пример демонстрации 3д возможностей в defold engine!
• Умное освещение - tile-based до 32 источников
• Мягкие тени с 12 сэмплами, без швов на кубических картах
• SSAO, вулметрика, PBR-материалы
• Фиш-ай линза + хроматическая аберрация
• FSR2 для апскейла (шейдер есть, но не включен)
https://github.com/martianovdev/Defold-BRDF-Deferred-Rendering-V2
Спасибо! 😎
Довел до публичного релиза пример демонстрации 3д возможностей в defold engine!
• Умное освещение - tile-based до 32 источников
• Мягкие тени с 12 сэмплами, без швов на кубических картах
• SSAO, вулметрика, PBR-материалы
• Фиш-ай линза + хроматическая аберрация
• FSR2 для апскейла (шейдер есть, но не включен)
https://github.com/martianovdev/Defold-BRDF-Deferred-Rendering-V2
Спасибо! 😎
2🔥16👍13💯4❤1
https://t.iss.one/neuraldeep?livestream
SGR-Agent-Core 0.4.0
Попробуем в live поднять агента на локал железе!
Тут пишем вопросы)
SGR-Agent-Core 0.4.0
Попробуем в live поднять агента на локал железе!
Тут пишем вопросы)
Telegram
Neural Kovalskii
Head of AI redmadrobot.com
From IT Admin to Head of AI in 5 years
Applied AI Engineer
B2C RAG (2M+ books)
B2B RAG platform (10+ implementations)
B2C gptdaisy.com (100k MAU)
github.com/vakovalskii | chat @neuraldeepchat
To infinity... and beyond!
From IT Admin to Head of AI in 5 years
Applied AI Engineer
B2C RAG (2M+ books)
B2B RAG platform (10+ implementations)
B2C gptdaisy.com (100k MAU)
github.com/vakovalskii | chat @neuraldeepchat
To infinity... and beyond!
🔥20
А стрим идет https://t.iss.one/neuraldeep?livestream
Пилим агента для конфы на базе sgr-agent-core
Пилим агента для конфы на базе sgr-agent-core
🔥28❤2
Media is too big
VIEW IN TELEGRAM
SGR Agent Core 0.4.0 + UI
Запись стрима!
YouTube
RuTube
Разработка агента для работы с корпоративным Confluence на базе SGR Agent Core 0.4.0 с использованием локальной модели Qwen3-30B на vLLM.
00:00:00 - Подготовка окружения
- Настройка OBS и серверов (Yandex Cloud + 2x4090(48гб))
- Развертывание vLLM с Qwen3-30B-A3B-Instruct
00:15:00 - Тестирование инфраструктуры
- Проверка работы Qwen через OpenWebUI (~86 tokens/sec)
- Настройка мониторинга GPU
00:27:00 - Настройка SGR Agent Core
- Клонирование репозитория на удаленный сервер
- Подключение через Cursor с SSH
- Конфигурация agents.yaml и config.yaml
00:38:00 - Первый запуск агента
- Тестирование базового SGR Tool Calling Agent
- Запрос цены биткоина - успешно ($96k)
- Разбор двухфазного reasoning
00:52:00 - Разработка Confluence toolkit
- Создание confluence_tools.py с Cursor AI
- Три инструмента: full_text_search, space_search, page_retrieval
- Фиксы с правами доступа
01:10:00 - Тестирование Agentic RAG
- Поиск информации о проекте Smart Platform
- Агент нашел страницы, извлек контент, создал отчет
- Всё без векторизации и чанкинга!
01:26:00 - Запуск фронтенда
- Установка Node.js, настройка портов
- Демонстрация веб-интерфейса
01:36:00 - Финальный тест
- Сравнительный анализ двух проектов
- Объяснение архитектуры решения
01:42:00 - Завершение
- Итог: рабочий агентный RAG за 1.5 часа
- "Когда-нибудь придумаю красивую концовку"
Стек: SGR Agent Core, vLLM, Qwen3-30B, Confluence REST API, Cursor AI, vLLM, guidance
Как результат Агент ищет в Confluence без традиционного RAG pipeline - никаких векторных БД, эмбеддингов и чанкинга!
Запись стрима!
YouTube
RuTube
Разработка агента для работы с корпоративным Confluence на базе SGR Agent Core 0.4.0 с использованием локальной модели Qwen3-30B на vLLM.
00:00:00 - Подготовка окружения
- Настройка OBS и серверов (Yandex Cloud + 2x4090(48гб))
- Развертывание vLLM с Qwen3-30B-A3B-Instruct
00:15:00 - Тестирование инфраструктуры
- Проверка работы Qwen через OpenWebUI (~86 tokens/sec)
- Настройка мониторинга GPU
00:27:00 - Настройка SGR Agent Core
- Клонирование репозитория на удаленный сервер
- Подключение через Cursor с SSH
- Конфигурация agents.yaml и config.yaml
00:38:00 - Первый запуск агента
- Тестирование базового SGR Tool Calling Agent
- Запрос цены биткоина - успешно ($96k)
- Разбор двухфазного reasoning
00:52:00 - Разработка Confluence toolkit
- Создание confluence_tools.py с Cursor AI
- Три инструмента: full_text_search, space_search, page_retrieval
- Фиксы с правами доступа
01:10:00 - Тестирование Agentic RAG
- Поиск информации о проекте Smart Platform
- Агент нашел страницы, извлек контент, создал отчет
- Всё без векторизации и чанкинга!
01:26:00 - Запуск фронтенда
- Установка Node.js, настройка портов
- Демонстрация веб-интерфейса
01:36:00 - Финальный тест
- Сравнительный анализ двух проектов
- Объяснение архитектуры решения
01:42:00 - Завершение
- Итог: рабочий агентный RAG за 1.5 часа
- "Когда-нибудь придумаю красивую концовку"
Стек: SGR Agent Core, vLLM, Qwen3-30B, Confluence REST API, Cursor AI, vLLM, guidance
Как результат Агент ищет в Confluence без традиционного RAG pipeline - никаких векторных БД, эмбеддингов и чанкинга!
52🔥49❤11👍5 5
Forwarded from TECH WEEK | Технологии для бизнеса
Media is too big
VIEW IN TELEGRAM
Продолжаем знакомство со спикерами конференции TECH WEEK 2025. В этот раз представляем Валерия Ковальского, Head of AI red_mad_robot.
Валерий руководит IT-командами с экспертизой в Al, аппаратной интеграции для DS проектов, успешно реализовывает собственные исследовательские проекты в области LLM, GAN и SD.
Валерий примет участие в дискуссии «Workflow-агенты в бою: кейсы внедрения в российских корпорациях». Он порассуждает, готов ли бизнес к внедрению автономных агентов, можно ли делегировать процессы ИИ, а также поделится примерами из практики.
🗺 TECH WEEK 2025, кластер «Ломоносов», зал Атом
🗓 17 ноября, 13:00–13:50
Ждем встречи с вами в кластере «Ломоносов»🚀
Валерий руководит IT-командами с экспертизой в Al, аппаратной интеграции для DS проектов, успешно реализовывает собственные исследовательские проекты в области LLM, GAN и SD.
Валерий примет участие в дискуссии «Workflow-агенты в бою: кейсы внедрения в российских корпорациях». Он порассуждает, готов ли бизнес к внедрению автономных агентов, можно ли делегировать процессы ИИ, а также поделится примерами из практики.
Ждем встречи с вами в кластере «Ломоносов»
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥13❤5👏3
Claude + Structured Output!!!!
Спасибо за новость @the_ai_architect
Гоу тестить ребят!
Докс: https://docs.claude.com/en/docs/build-with-claude/structured-outputs
Читать: https://www.claude.com/blog/structured-outputs-on-the-claude-developer-platform
Спасибо за новость @the_ai_architect
Гоу тестить ребят!
Докс: https://docs.claude.com/en/docs/build-with-claude/structured-outputs
Читать: https://www.claude.com/blog/structured-outputs-on-the-claude-developer-platform
🔥42❤8😁5 1
Отдых
Поддержку других ребят и покажу что тоже умею =)
Я все больше и больше задумываюсь над тем что отдых это как раз та часть жизни которая тоже должна быть, да иногда он может быть спонтанным но в процессе можно по полной насладиться чем и как ты будешь отдыхать
Банька сегодня, это лучшее что могло со мной случиться, и целый день без ноутбука, выглядит заманчиво!
Поддержку других ребят и покажу что тоже умею =)
Я все больше и больше задумываюсь над тем что отдых это как раз та часть жизни которая тоже должна быть, да иногда он может быть спонтанным но в процессе можно по полной насладиться чем и как ты будешь отдыхать
Банька сегодня, это лучшее что могло со мной случиться, и целый день без ноутбука, выглядит заманчиво!
👍52🔥37❤5 5
SGR Agent Core 0.4.0
Ребят, мы тут вкатили очень крутое обновление которое обозревали на стриме
Теперь мы еще на шаг ближе к agent-core.
Спасибо, что вы тестируете и докидываете кучу крутых идей и своих PR.
Ждем новых контрибьютеров!
Репо: https://github.com/vamplabAI/sgr-agent-core
Релиз: https://github.com/vamplabAI/sgr-agent-core/releases/tag/0.4.0
Ребят, мы тут вкатили очень крутое обновление которое обозревали на стриме
Теперь мы еще на шаг ближе к agent-core.
Спасибо, что вы тестируете и докидываете кучу крутых идей и своих PR.
Ждем новых контрибьютеров!
What's Changed
Version of python fixed as 3.13 by EvilFreelancer in #57
Feat: Decomposition of core.agents by EvilFreelancer in #56
Rename all places with old project name by miteykons in #60
[WIP] Add comprehensive pytest test suite for SGR Deep Research by hijerain #54
Agents from Config by virrius in #55
Feature/frontend integration by vakovalskii in #63
Rc 0.4.0 fixes by virrius in #80
Репо: https://github.com/vamplabAI/sgr-agent-core
Релиз: https://github.com/vamplabAI/sgr-agent-core/releases/tag/0.4.0
GitHub
GitHub - vamplabAI/sgr-agent-core: Hybrid Schema-Guided Reasoning (SGR) has agentic system design created by neuraldeep community
Hybrid Schema-Guided Reasoning (SGR) has agentic system design created by neuraldeep community - vamplabAI/sgr-agent-core
81🔥29👍8❤4👏4
SGR Agent Core: агентный фреймворк, который работает лучше больших моделей
Интересный заголовок. Меня позвали рассказать про то, как мы ушли от Classic RAG на Agentic RAG. Конечно расскажу о том , что я еще тот изобретатель велосипедов, и как мы с вами сделали агентный фреймворк.
24 ноября выступаю на митапе Moscow AI в БЦ Оазис на Коровьем Валу 5 (метро Добрынинская)
Сбор в 18:30, начало в 19:00.
Расскажу как малые модели справляются с агентным RAG (4B параметров, как раз про наш любимый dense qwen тот самый 2507).
Формат free: офлайн + онлайн трансляция
Регистрация тут: https://moscowai.timepad.ru/event/3642531/
Места ограничены!
Приходите, если интересны агенты.
Интересный заголовок. Меня позвали рассказать про то, как мы ушли от Classic RAG на Agentic RAG. Конечно расскажу о том , что я еще тот изобретатель велосипедов, и как мы с вами сделали агентный фреймворк.
24 ноября выступаю на митапе Moscow AI в БЦ Оазис на Коровьем Валу 5 (метро Добрынинская)
Сбор в 18:30, начало в 19:00.
Расскажу как малые модели справляются с агентным RAG (4B параметров, как раз про наш любимый dense qwen тот самый 2507).
Формат free: офлайн + онлайн трансляция
Регистрация тут: https://moscowai.timepad.ru/event/3642531/
Места ограничены!
Приходите, если интересны агенты.
moscowai.timepad.ru
Moscow AI #4 x Газпромбанк.Тех — встреча людей и AI-технологий / События на TimePad.ru
Встреча по искусственному интеллекту от сообщества MoscowAI.
MoscowAI — это регулярные мероприятия, объединяющие энтузиастов и профессионалов в области искусственного интеллекта, машинного обучения и data science. Мы обсуждаем последние тренды, делимся практическим…
MoscowAI — это регулярные мероприятия, объединяющие энтузиастов и профессионалов в области искусственного интеллекта, машинного обучения и data science. Мы обсуждаем последние тренды, делимся практическим…
1🔥16👏13❤2
Платформа для ERC3: AI Agents открыта!
И так, приступим к тестам!😈
Что за задача
Бенчмарк store — это онлайн‑магазин с продуктовым каталогом, скидками и корзиной.
Есть API:
Задачи типа:
«Купи ВСЕ GPUs»
«Купи 24 колы как можно дешевле (куча купонов и пагинация)»
«Купи 1x Dog Food Premium с максимальной скидкой (часть купонов не работает)»
«Купи ноутбук до $500 (невыполнимая задача — нужно признать невозможность)»
и т.д.
Агент должен сам:
разобрать задачу,
найти нужные товары через API,
оптимизировать цену / скидку / бюджет,
корректно применить купоны,
аккуратно завершить или честно сказать, что задача невозможна.
Мы же не зря пилим с вами sgr-agent-core
Взял этого агента
Адаптировал тулы для store через курсор 1 час
Делал прогоны и сохранял последние 2 тула которые генерировал агент (вчера-сегодня)
Улучшал итерационно промпт без few shot (названий кол-во и так далее, КЛОД 4.5 вечно норовит их вставить)
Под магазин получилось сделать 3к токенов промпт
Весь прогон на
gpt-4.1 стоит $4-5
gpt-4.1-mini $1
Метрики
gpt-4.1 = 90-100%
gpt-4.1-mini = 70-90%
Узнал что модель ленится делать тесты всех вариаций(тут пришлось прописать что бы делала)
Детерминизма нет
От прогона к прогону скочит на 10-15 процентов качество
Хочу уйти от ReAct агента все думаю как на gpt-4.1-mini сделать кодового агента что бы агент писал питон код для теста корзины и вариацый и редактировал код а не генерировал аргументы для апишки
Вот так выглядит успешный лог
Как вывод, если дальше задачи будут универсальные или из другой сферы, то такой подход не подойдет
нужно будет делать немного обучение под задачи (без валидации сложно будет)
Далее на тест qwen!
Платформа | Регистрация | Пример агента
И так, приступим к тестам!
Что за задача
Бенчмарк store — это онлайн‑магазин с продуктовым каталогом, скидками и корзиной.
Есть API:
/products/list — поиск товаров/basket/view — корзина/basket/add/basket/remove — добавить / убрать/coupon/apply/coupon/remove — купоны/basket/checkout — оформить заказЗадачи типа:
«Купи ВСЕ GPUs»
«Купи 24 колы как можно дешевле (куча купонов и пагинация)»
«Купи 1x Dog Food Premium с максимальной скидкой (часть купонов не работает)»
«Купи ноутбук до $500 (невыполнимая задача — нужно признать невозможность)»
и т.д.
Агент должен сам:
разобрать задачу,
найти нужные товары через API,
оптимизировать цену / скидку / бюджет,
корректно применить купоны,
аккуратно завершить или честно сказать, что задача невозможна.
Мы же не зря пилим с вами sgr-agent-core
Взял этого агента
Адаптировал тулы для store через курсор 1 час
Делал прогоны и сохранял последние 2 тула которые генерировал агент (вчера-сегодня)
Улучшал итерационно промпт без few shot (названий кол-во и так далее, КЛОД 4.5 вечно норовит их вставить)
Под магазин получилось сделать 3к токенов промпт
Весь прогон на
gpt-4.1 стоит $4-5
gpt-4.1-mini $1
Метрики
gpt-4.1 = 90-100%
gpt-4.1-mini = 70-90%
Узнал что модель ленится делать тесты всех вариаций(тут пришлось прописать что бы делала)
Детерминизма нет
От прогона к прогону скочит на 10-15 процентов качество
Хочу уйти от ReAct агента все думаю как на gpt-4.1-mini сделать кодового агента что бы агент писал питон код для теста корзины и вариацый и редактировал код а не генерировал аргументы для апишки
Вот так выглядит успешный лог
{
"session_id": "ssn-42JaV8ik4wpM8vXXeMQAZ2",
"timestamp": "2025-11-21T10:13:18.413082",
"benchmark": "store",
"workspace": "sgr-agent-core",
"model": "gpt-4.1-mini",
"tasks": [
{
"task_number": 1,
"task_id": "tsk-42JaV8j1P6ENA4vqJhwnrS",
"spec_id": "gpu_race",
"task_text": "Buy ALL GPUs",
"start_time": "2025-11-21T10:13:18.413146",
"error": null,
"score": 1.0,
"eval_logs": "PASS: should contain one event *Evt_BasketCheckedOut{Items:[{gpu-h100 1 20000} {gpu-a100 4 11950}]}\n",
"last_3_tools": [
{
"tool_name": "storecheckouttool",
"parameters": {
"reasoning": "Basket contains all available GPUs as per verified stock quantities, verified total price, ready for final purchase."
},
"result": "{\"items\":[{\"sku\":\"gpu-h100\",\"quantity\":1,\"price\":20000},{\"sku\":\"gpu-a100\",\"quantity\":4,\"price\":11950}],\"subtotal\":67800,\"coupon\":\"\",\"discount\":0,\"total\":67800}"
},
{
"tool_name": "finalanswertool",
"parameters": {
"reasoning": "All available GPUs were found, added to basket within stock limits, and purchased successfully after verification. Checkout confirmed with correct quantities and total price.",
"completed_steps": [
"Paginated product list to find GPUs.",
"Added all available GPUs respecting stock limits.",
"Verified basket contents.",
"Completed checkout successfully."
],
"answer": "Purchased all available GPUs: 1 unit of NVidia H100 and 4 units of NVidia A100, total price $67,800.",
"status": "completed"
},
"result": "{\n \"reasoning\": \"All available GPUs were found, added to basket within stock limits, and purchased successfully after verification. Checkout confirmed with correct quantities and total price.\",\n \"co"
}
],
"end_time": "2025-11-21T10:14:13.819502",
"duration_sec": 55.40637
},Как вывод, если дальше задачи будут универсальные или из другой сферы, то такой подход не подойдет
нужно будет делать немного обучение под задачи (без валидации сложно будет)
Далее на тест qwen!
Платформа | Регистрация | Пример агента
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤11👍9 3👏2