Доделал идею из предыдущего поста с отдельным docker контейнером под agent harness deep research + добавил фронтент, все что нужно для настойки это ллм, тестил на gpt oss 120b
Запускается отдельный контейнер в котором спавнится delegate режим и оркестратор, создает agent team на базе sub process внутри логики hermes agent + ACP для передачи состояния
Получился на базе hermes-agent полноценный агентный поиск с сабагентами работой с файлами и skills
just for fun and research!
https://github.com/vakovalskii/searcharvester
Чуть более детальное объяснение что это и зачем
Запускается отдельный контейнер в котором спавнится delegate режим и оркестратор, создает agent team на базе sub process внутри логики hermes agent + ACP для передачи состояния
Получился на базе hermes-agent полноценный агентный поиск с сабагентами работой с файлами и skills
just for fun and research!
https://github.com/vakovalskii/searcharvester
Чуть более детальное объяснение что это и зачем
3🔥38❤9🤯7👍1
Встретился с Игорем Котенковым @seeallochnaya в Лондоне
Очень вкусно позавтракали, после прогулялись по парку
Тоже затронули задачу генерализации в роботах😎 (Мега крутая задумка) и очень интересная тема, обсудили кажется все, от скорого выхода ГТА6 до железа в моем подвале 😈
Еще Игорь закинул карту Гинеса(теперь то я не упущу лучшее)
Очень вкусно позавтракали, после прогулялись по парку
Тоже затронули задачу генерализации в роботах
Еще Игорь закинул карту Гинеса(теперь то я не упущу лучшее)
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥68❤21👀10😁2
Forwarded from Глеб Кудрявцев про AI
Ну наконец-то готов релизить OCR сервис
sotaocr.com
Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.
— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков
Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.
В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.
PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.
sotaocr.com
Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.
— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков
Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.
В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.
PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.
6❤31🤡14👍7🤣4
FOMO в обнимку с кодинг-агентом
Заметил, что лагеря разделились особенно в коментах под постом Тимура
Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)
Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё
80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё
CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)
Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут
Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)
Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:
Просите агента искать в интернете
Просите делать тесты и поглядите, что из них есть код
Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)
Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)
Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек
UPDATE: Тимур закинул код на курсец, забираем TMY5XJ
Заметил, что лагеря разделились особенно в коментах под постом Тимура
Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)
Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё
80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё
CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)
Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут
Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)
Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:
Просите агента искать в интернете
Просите делать тесты и поглядите, что из них есть код
Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)
Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)
Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек
UPDATE: Тимур закинул код на курсец, забираем TMY5XJ
2👍65❤32🔥13😁6🤝5🖕3💯1
Forwarded from Valerii Kovalskii
Если кому интересно
Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent
Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent
1🔥36👍11❤3
#безвотэтоговотвсего
Дружочки! Не успела отгреметь наша прошлая встреча, а мы уже врываемся в эфир с новым анонсом. Очевидно, что в начале 2026 года, среди прочего, произошло кое-что значимое в разработке. Если в конце 2025 мы всё ещё морщились от слов «вайбкодинг» и «агенты»…
Собрались поболтать про агентов!
Будет интересно привет всем кто офлайн
Будет интересно привет всем кто офлайн
🔥15
Forwarded from red_mad_robot
Что мешает масштабировать генеративный ИИ
В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе.
Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.
О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready🔗
#AI_moment #роботайм
↗️ red_mad_robot
В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе.
Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.
О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready
#AI_moment #роботайм
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥9❤6
Forwarded from Константин Доронин
Как создавать AI-агентов на on-prem-моделях?
Как меняется создание пайплайна, когда мы переходим на локальные модели?
Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?
Чтобы ответить на эти(и многие другие) вопросы максимально-качественно, основываясь на большом практическом опыте, я попросил присоединиться к стриму Валеру.
Все, кому были неудобны стримы по субботам, возрадуйтесь!
Стрим будет во вторник, 5 мая в 16:00 мск.
Проведём его на моём YouTube-канале.
Чтобы добавить событие в календарь, нажимайте сюда.
Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!
Как меняется создание пайплайна, когда мы переходим на локальные модели?
Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?
Чтобы ответить на эти
Все, кому были неудобны стримы по субботам, возрадуйтесь!
Стрим будет во вторник, 5 мая в 16:00 мск.
Проведём его на моём YouTube-канале.
Чтобы добавить событие в календарь, нажимайте сюда.
Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!
🔥37👍15❤7😁1
NeuralDeep LLM Hub
Добавлено:
qwen3.6-35b-a3b
Второй инстанс под gpt oss 120b
whisper large-v3-turbo
Возможность в ЛК отключить логирование (тут конечно надо поверить мне на слово)
Обе LLM протестированы с codex/opencode/hermes-agent/kiro/cursor
Осталось 70 регистраций на free тир (добиваем 1к регистраций)
Из-за активного юзеджа зарезал фритир и протир по лимитам
За это время вы закинули 140 000 запросов и затестили все модели из списка
И как-то дали 4 рпс на обе gpt oss 120b
Спасибо, что используете, я продолжаю эксперименты и скоро расскажу про них! Расскажите в комментариях, какие эксперименты провели вы с этой платформой
https://hub.neuraldeep.ru/
Добавлено:
qwen3.6-35b-a3b
Второй инстанс под gpt oss 120b
whisper large-v3-turbo
Возможность в ЛК отключить логирование (тут конечно надо поверить мне на слово)
Обе LLM протестированы с codex/opencode/hermes-agent/kiro/cursor
Осталось 70 регистраций на free тир (добиваем 1к регистраций)
Из-за активного юзеджа зарезал фритир и протир по лимитам
За это время вы закинули 140 000 запросов и затестили все модели из списка
И как-то дали 4 рпс на обе gpt oss 120b
Спасибо, что используете, я продолжаю эксперименты и скоро расскажу про них! Расскажите в комментариях, какие эксперименты провели вы с этой платформой
https://hub.neuraldeep.ru/
2🔥33👍14❤7
Forwarded from Pavel Zloi
Расширение каталога на Hub NeuralDeep
Сегодня вместе с Валерием (@neuraldeep) добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов api.neuraldeep.ru (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации на hub.neuraldeep.ru.
Итого:
- LLM'ки - из коробки через апишку доступны две флагманские модельки
- Эмбеддинги - в дополнение к
- Реранкеры - уже была
- Голос в текст (ASR) - помимо
Полный список моделей можно посмотреть так:
Регистрируйтесь, пользуйтесь, предлагайте свои модельки, поддерживайте рублём, рассказывайте друзьям - нам пригодится любая ваша помощь.
Сегодня вместе с Валерием (@neuraldeep) добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов api.neuraldeep.ru (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации на hub.neuraldeep.ru.
Итого:
- LLM'ки - из коробки через апишку доступны две флагманские модельки
gpt-oss-120b и qwen3.6-35b-a3b, их можно крутить в кодовых агентах и чатботах.- Эмбеддинги - в дополнение к
bge-m3 и e5-large добавили русскоязычную frida, мультимодальную jina-embeddings-v4 и толстушку qwen3-embedding-4b.- Реранкеры - уже была
bge-reranker для ранжирования чанков, пригодится для вашего RAGу.- Голос в текст (ASR) - помимо
whisper-1 добавили ещё и whisper-podlodka-turbo.Полный список моделей можно посмотреть так:
curl -sS "https://api.neuraldeep.ru/v1/models" \
-H "Authorization: Bearer <ваш-ключ-с-хаба>"
Регистрируйтесь, пользуйтесь, предлагайте свои модельки, поддерживайте рублём, рассказывайте друзьям - нам пригодится любая ваша помощь.
1❤32🔥24 6
Pavel Zloi
Расширение каталога на Hub NeuralDeep Сегодня вместе с Валерием (@neuraldeep) добавили новых моделей в публичной API проекта NeuralDeep. Базовый URL для запросов api.neuraldeep.ru (OpenAI-совместимо, Bearer с ключом). Ключ можно полчить после регистрации…
This media is not supported in your browser
VIEW IN TELEGRAM
Встроил в хаб OpenWebUI, чтобы показать реальную скорость, и вы сразу могли проверить модели!
Работает фича из личного кабинета после авторизации (если вы нашли баг или вам интересен такой ИИкит, пишите в ЛС)
https://hub.neuraldeep.ru/
P.S. Токен из видео уже не работает))))
Скорость на видео реальная х1
За идею спасибо Паше
Работает фича из личного кабинета после авторизации (если вы нашли баг или вам интересен такой ИИкит, пишите в ЛС)
https://hub.neuraldeep.ru/
P.S. Токен из видео уже не работает))))
Скорость на видео реальная х1
За идею спасибо Паше
1❤27👍12🔥9🤯2