Валера Ковальский
15K subscribers
543 photos
89 videos
5 files
470 links
Head of AI Engineer | DevOps | Hardware
From IT Admin to Head of AI in 6 years
Автор https://neuraldeep.ru/
Raised $2M+ for human-centric AI startups
github.com/vakovalskii | chat @neuraldeepchat
Download Telegram
Я хотел назвать этот проект "Битрикс24 Имба", но решили, что рынок пока недозрел. Меж тем - это имба!

Битрикс24 VibeCode - это первая платформа на российском рынке, которая соединяет вайбкодинг с экосистемой корпоративного ПО для совместной работы, продаж и автоматизации.

Битрикс24 открывает бета-тестирование VibeCode - полноценной платформы для создания бизнес-приложений с помощью искусственного интеллекта. Впервые любой сотрудник компании - без навыков программирования и бюджетов на разработку - может описать задачу на обычном языке и получить работающее приложение, размещённое на защищённом сервере и интегрированное с Битрикс24.

Сотрудники компаний смогут «навайбкодить» для себя и коллег самые разные приложения – от простых отчетов до умных ботов на базе ИИ. Платформа уже включает 26 готовых шаблонов-примеров приложений.

Среди типичных сценариев:
инструмент для юристов, который анализирует изменения в объёмных договорах и выделяет ключевые правки;
система обучения и контроля менеджеров по продажам, которая анализирует звонки и переписки в CRM;
ИИ-ассистент в чате, который мгновенно находит нужную сделку, контакт или документ по запросу на естественном языке;
дашборд аналитики, собирающий данные о продажах в реальном времени.

Ранее создание собственного решения требовало множества шагов: купить сервер, настроить его, выбрать модель и написать приложение с соблюдением требований безопасности, задеплоить, подключить домен и SSL-сертификаты, интегрировать со своими системами. 

На платформе Битрикс24 VibeCode весь процесс сводится к трем шагам: получить API-ключ и стартовый промпт, отправить в выбранную под свои задачи ИИ и запустить приложение. Нейросеть сама напишет приложение, настроит интеграции и развернет готовое решение на безопасном сервере. Доступ будет только у авторизованных сотрудников.
2🤣3328🔥16🤡14🙉9💊63👀2
Вартанян в сингулярности и вокруг неё
Я хотел назвать этот проект "Битрикс24 Имба", но решили, что рынок пока недозрел. Меж тем - это имба! Битрикс24 VibeCode - это первая платформа на российском рынке, которая соединяет вайбкодинг с экосистемой корпоративного ПО для совместной работы, продаж…
Интересный момент про платформу, я недавно переехал в Битрикс(по части направлений), реалии заставляют, после сравнения всех платформ открытость API в битрикс выиграла, и вы знаете, я был очень приятно удивлен как обновилась мобильная апка на ios(честно удобно) последний раз я тут был лет 5 назад

Жду папки для чатов и поиск, и точно аналогов в РФ не будет

Но вайб платформа прям добила, рек

Ссылка на вайб кстати что бы не потерялась

https://vibecode.bitrix24.tech
1👍29🤮13🔥7🤡6🤣5💯3
Страх и ненависть в AI кодинга за 24 часа

Скорость разработки MVP точно не будет прежним, мир изменился.
Но что с масштабированием и безопасностью на проде?


Вчера понял что у меня слишком много своих серверов, где-то аренда, что-то стоит в Колокейшн - это услуга размещения собственного физического сервера или сетевого оборудования клиента на территории дата-центра (ЦОД) провайдера) и что 85% времени они стоят и я плачу за интернет и аренду

Как итог после 1 часа общения с клодом и сбора ТЗ выбора самого производительного сервера у меня в офисе, было поднято 11 контейнеров и написано 15к строк кода

https://hub.neuraldeep.ru/

Первые 30 пользователей получат подписку на 2 месяца сразу к 6 моделям (по всем тарифам есть RPM)

gpt-oss-120b
qwen3.6-35b-a3b
e5-large
bge-m3
bge-reranker-v2-m3
whisper-1


Так же скоро будут добавлены qwen3-8b-embedding
gemma4

Из интересного попробовал реализовать механику и систему подписок как в кодинг агентах (часовые лимит и недельные лимиты)

Платежей пока нет (но скоро будут)


Насчет безопасности и масштабирования

По тестам и вопросам к агенту все четко

Друг смог обойти подписку за 20 минут, а сервер упал под нагрузкой на какой-то эндпоинт апи, не было легирования решил повесить на все защиту, базовые настройки но в погоне за идеей можно все это упустить, вывод? Думаю что и эти два пункта можно нагнать спустя время, просто нужно больше времени в тесте


Что точно разочарование это то что модельки все еще много думают сверху если жестко не ограничить все тз и задачей, но скорость это прощает, и наверное еще как вывод я больше времени стал отдыхать по выходным, все больше уходит в автоматизацию
2🔥631911🤡2👍1
LLM hub by Kovalskii

Вчера анонсировал https://hub.neuraldeep.ru/, а сегодня с утра уже есть что анализировать (вы просто супер аудитория!)

Что интересно из аналитики для меня:

Много кто взял модели для прогона pac1 (бенчмарка от Рината)
Кто-то взял для подключения к opencode

И самое интересное что на таком объеме запросов и людей, некоторые высказались тем что очень радует скорость и доступность моделей (gpt oss 120b)


Через неделю я планирую провести закрытий стрим для всех активных пользователей
Важные условия для участия

1) Активно юзать хаб
2) Смотреть почту на предмет сообщений с домена @neuraldeep.ru

Мы разберем как и зачем я использую такой набор моделей, и как начать строить что-то свое, как доводить до продакшена и прокачивать экспертизу


Спасибо всем за идеи и предложения, я все впитываю и сразу же внедряю

По поводу оплат за подписку, она на текущим момент не планируется (тарифы добавлены для теста кликов)
Ну и поздравляю первых 30 пользователей с про доступом на 2 месяца (там очень щедрые лимиты)
3👍56🔥2711💯73👏2
Forwarded from red_mad_robot
⚡️ Запустили платформу для управления LLM в бизнесе

red_mad_router помогает компаниям собрать работу с LLM в одной системе, когда сервисы уже используются в разных командах. Решение объединяет доступы к моделям, контроль расходов, настройки безопасности и правила работы с данными.

Изначально мы создавали платформу для себя, но быстро поняли, что проблема общая. Рынок давно показывает спрос на такой слой — 89% ИИ-инструментов внутри организаций подключаются хаотично и остаются вне общего контроля компании. red_mad_router закрывает эту задачу и даёт бизнесу единую точку контроля.

Подробно о том, как именно всё работает, рассказали CNews.

#AI_moment #роботайм

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33🦄54
University of Cambridge

Позвали выступить рассказать про агентов

Фотка не ИИ

UPDATE:

Нашли подтверждение тому как я все успеваю
3🔥172👍251911😁10💯2
Forwarded from _rnd
⚡️ Открываем NSFW-бенчмарк для систем модерации

В прошлых постах мы много говорили о фильтрации NSFW. А теперь выкатываем в открытый доступ наш двуязычный бенчмарк для систем модерации контента.

Что внутри датасета:
• контрастные пары — о которых мы уже писали,
• сложные пограничные примеры — hard negatives.

Все данные собирались, отсеивались и валидировались полностью вручную.

В карточке датасета рассказали, как устроена таксономия небезопасного контента. А ещё — добавили метрики популярных открытых моделей на этом датасете для удобного сравнения.

Тестируйте свои фильтры на прочность и делитесь мыслями в комментариях. 😍

↗️ Hugging Face

Автор этого поста, как и большинства предыдущих про безопасность, Андрей Иванов — NLP-инженер в R&D red_mad_robot.


#Безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27🤔752
Searcharvester 🌾
Deep Research agent system


Год наза назад сколотил маленький SearXNG-Tavily-адаптер дроп-ин замена платного Tavily для LLM-пайплайнов на базе SearXNG
На днях вернулся и развил его в полноценный self-hosted deep research stack + sandbox agent per task

Что получилось:
3 независимых сервиса за одним API:
- /search — Tavily-совместимый поиск через SearXNG (100+ движков)
- /extract — URL → чистый markdown через trafilatura, с пресетами размера (s/m/l/f) и пагинацией для длинных статей
- /research — deep research агент(Hermes) даёшь вопрос, получаешь markdown-отчёт с цитатами

Агент-ядро — Hermes (Nous Research, 109k ⭐️), эфемерно спавнится на каждый /research запрос, --rm после exit

Видит три наших скилла: search, extract, deep-research (последний чистая методичка без кода, описывает 5 фаз:

plan → gather → gap-check → synthesise → verify

Стек: SearXNG + FastAPI + trafilatura + Hermes + docker-socket-proxy (для безопасного спавна)
Всё в одном docker compose up
LLM-агностик gpt-oss-120b(на ней делал тесты на vLLM, OpenAI, Anthropic, Ollama, что угодно OpenAI-совместимое)


Старый adapter был тактической заплаткой на Tavily
Новый стек полноценная альтернатива Perplexity/Exa/You.com для self-hosted agentic deep research system setup, и при этом каждый из трёх сервисов полезен сам по себе

РЕПО: https://github.com/vakovalskii/searcharvester

Зацените название кстати! Searcharvester
11🔥9816👍11
Доделал идею из предыдущего поста с отдельным docker контейнером под agent harness deep research + добавил фронтент, все что нужно для настойки это ллм, тестил на gpt oss 120b

Запускается отдельный контейнер в котором спавнится delegate режим и оркестратор, создает agent team на базе sub process внутри логики hermes agent + ACP для передачи состояния


Получился на базе hermes-agent полноценный агентный поиск с сабагентами работой с файлами и skills
just for fun and research!

https://github.com/vakovalskii/searcharvester

Чуть более детальное объяснение что это и зачем
3🔥389🤯7👍1
Встретился с Игорем Котенковым @seeallochnaya в Лондоне

Очень вкусно позавтракали, после прогулялись по парку

Тоже затронули задачу генерализации в роботах 😎(Мега крутая задумка) и очень интересная тема, обсудили кажется все, от скорого выхода ГТА6 до железа в моем подвале 😈

Еще Игорь закинул карту Гинеса(теперь то я не упущу лучшее)
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥6821👀10😁2
Ну наконец-то готов релизить OCR сервис

sotaocr.com

Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.

— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков

Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.

В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.

PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.
631🤡14👍7🤣4
FOMO в обнимку с кодинг-агентом

Заметил, что лагеря разделились особенно в коментах под постом Тимура

Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)

Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё

80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё

CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)

Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут

Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)

Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:

Просите агента искать в интернете

Просите делать тесты и поглядите, что из них есть код

Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)

Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)


Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек

UPDATE: Тимур закинул код на курсец, забираем TMY5XJ
2👍6532🔥13😁6🤝5🖕3💯1
Forwarded from Valerii Kovalskii
Если кому интересно

Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent
1🔥36👍113
This media is not supported in your browser
VIEW IN TELEGRAM
🔥17👍9🤡4🙉1
Forwarded from red_mad_robot
Что мешает масштабировать генеративный ИИ 

В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе. 

Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.

О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready 🔗

#AI_moment #роботайм

↗️ red_mad_robot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥96