Forwarded from _rnd
В прошлых постах мы много говорили о фильтрации NSFW. А теперь выкатываем в открытый доступ наш двуязычный бенчмарк для систем модерации контента.
Что внутри датасета:
• контрастные пары — о которых мы уже писали,
• сложные пограничные примеры — hard negatives.
Все данные собирались, отсеивались и валидировались полностью вручную.
В карточке датасета рассказали, как устроена таксономия небезопасного контента. А ещё — добавили метрики популярных открытых моделей на этом датасете для удобного сравнения.
Тестируйте свои фильтры на прочность и делитесь мыслями в комментариях.
Автор этого поста, как и большинства предыдущих про безопасность, Андрей Иванов — NLP-инженер в R&D red_mad_robot.
#Безопасность
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
redmadrobot-rnd/nsfw_benchmark · Datasets at Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
🔥27🤔7 5❤2
Searcharvester 🌾
Deep Research agent system
Год наза назад сколотил маленький SearXNG-Tavily-адаптер дроп-ин замена платного Tavily для LLM-пайплайнов на базе SearXNG
На днях вернулся и развил его в полноценный self-hosted deep research stack + sandbox agent per task
Что получилось:
3 независимых сервиса за одним API:
- /search — Tavily-совместимый поиск через SearXNG (100+ движков)
- /extract — URL → чистый markdown через trafilatura, с пресетами размера (s/m/l/f) и пагинацией для длинных статей
- /research — deep research агент(Hermes) даёшь вопрос, получаешь markdown-отчёт с цитатами
Агент-ядро — Hermes (Nous Research, 109k ⭐️), эфемерно спавнится на каждый /research запрос, --rm после exit
Видит три наших скилла: search, extract, deep-research (последний чистая методичка без кода, описывает 5 фаз:
plan → gather → gap-check → synthesise → verify
Стек: SearXNG + FastAPI + trafilatura + Hermes + docker-socket-proxy (для безопасного спавна)
Всё в одном docker compose up
LLM-агностик gpt-oss-120b(на ней делал тесты на vLLM, OpenAI, Anthropic, Ollama, что угодно OpenAI-совместимое)
Старый adapter был тактической заплаткой на Tavily
Новый стек полноценная альтернатива Perplexity/Exa/You.com для self-hosted agentic deep research system setup, и при этом каждый из трёх сервисов полезен сам по себе
РЕПО: https://github.com/vakovalskii/searcharvester
Зацените название кстати! Searcharvester
Deep Research agent system
Год наза назад сколотил маленький SearXNG-Tavily-адаптер дроп-ин замена платного Tavily для LLM-пайплайнов на базе SearXNG
На днях вернулся и развил его в полноценный self-hosted deep research stack + sandbox agent per task
Что получилось:
3 независимых сервиса за одним API:
- /search — Tavily-совместимый поиск через SearXNG (100+ движков)
- /extract — URL → чистый markdown через trafilatura, с пресетами размера (s/m/l/f) и пагинацией для длинных статей
- /research — deep research агент(Hermes) даёшь вопрос, получаешь markdown-отчёт с цитатами
Агент-ядро — Hermes (Nous Research, 109k ⭐️), эфемерно спавнится на каждый /research запрос, --rm после exit
Видит три наших скилла: search, extract, deep-research (последний чистая методичка без кода, описывает 5 фаз:
plan → gather → gap-check → synthesise → verify
Стек: SearXNG + FastAPI + trafilatura + Hermes + docker-socket-proxy (для безопасного спавна)
Всё в одном docker compose up
LLM-агностик gpt-oss-120b(на ней делал тесты на vLLM, OpenAI, Anthropic, Ollama, что угодно OpenAI-совместимое)
Старый adapter был тактической заплаткой на Tavily
Новый стек полноценная альтернатива Perplexity/Exa/You.com для self-hosted agentic deep research system setup, и при этом каждый из трёх сервисов полезен сам по себе
РЕПО: https://github.com/vakovalskii/searcharvester
Зацените название кстати! Searcharvester
GitHub
GitHub - vakovalskii/searcharvester: Self-hosted search + markdown harvester for AI agents. SearXNG (100+ engines) + FastAPI +…
Self-hosted search + markdown harvester for AI agents. SearXNG (100+ engines) + FastAPI + trafilatura. Tavily-compatible /search plus /extract with size presets and pagination. One-command Docker C...
11🔥98❤16👍11
Доделал идею из предыдущего поста с отдельным docker контейнером под agent harness deep research + добавил фронтент, все что нужно для настойки это ллм, тестил на gpt oss 120b
Запускается отдельный контейнер в котором спавнится delegate режим и оркестратор, создает agent team на базе sub process внутри логики hermes agent + ACP для передачи состояния
Получился на базе hermes-agent полноценный агентный поиск с сабагентами работой с файлами и skills
just for fun and research!
https://github.com/vakovalskii/searcharvester
Чуть более детальное объяснение что это и зачем
Запускается отдельный контейнер в котором спавнится delegate режим и оркестратор, создает agent team на базе sub process внутри логики hermes agent + ACP для передачи состояния
Получился на базе hermes-agent полноценный агентный поиск с сабагентами работой с файлами и skills
just for fun and research!
https://github.com/vakovalskii/searcharvester
Чуть более детальное объяснение что это и зачем
3🔥38❤9🤯7👍1
Встретился с Игорем Котенковым @seeallochnaya в Лондоне
Очень вкусно позавтракали, после прогулялись по парку
Тоже затронули задачу генерализации в роботах😎 (Мега крутая задумка) и очень интересная тема, обсудили кажется все, от скорого выхода ГТА6 до железа в моем подвале 😈
Еще Игорь закинул карту Гинеса(теперь то я не упущу лучшее)
Очень вкусно позавтракали, после прогулялись по парку
Тоже затронули задачу генерализации в роботах
Еще Игорь закинул карту Гинеса(теперь то я не упущу лучшее)
Please open Telegram to view this post
VIEW IN TELEGRAM
5🔥68❤21👀10😁2
Forwarded from Глеб Кудрявцев про AI
Ну наконец-то готов релизить OCR сервис
sotaocr.com
Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.
— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков
Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.
В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.
PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.
sotaocr.com
Что это? Это сервис распознавания документов. Грузите PDF, получаете распознанный json. По капотом лучшая OCR модель из имеющихся на рынке по цене-качеству.
— Очень хороша в таблицах
— Специально натренирована на математические формулы в LATEX формате.
— Отдает честные границы объектов (LLM это делает как бог на душу положит).
— Знает много языков
Ограничения:
— плохо работает с рукописным вводом. Для этого нужно усиливать модельку, знаю как — если нужно пишите, сделаю
— я пока отключил распознавание картинок, работает только PDF. Планирую скоро включить.
В общем, велкам пробовать. 30 страничек бесплатно, дальше можно закинуть денежку и пользоваться по мере необходимости.
PS Если есть проблемы — сразу в личку пишите, поправлю. Не забудьте написать почту, под которой регались.
6❤31🤡14👍7🤣4
FOMO в обнимку с кодинг-агентом
Заметил, что лагеря разделились особенно в коментах под постом Тимура
Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)
Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё
80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё
CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)
Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут
Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)
Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:
Просите агента искать в интернете
Просите делать тесты и поглядите, что из них есть код
Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)
Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)
Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек
UPDATE: Тимур закинул код на курсец, забираем TMY5XJ
Заметил, что лагеря разделились особенно в коментах под постом Тимура
Есть те, кто обвешивается плагинами, скиллами, автоматизациями саб-агентов, методологиями, которые состоят из 1 000 000 нюансов. И те, кто течет по течению, как я =)
Буду честен: последние мои ИИ-проекты, которые были сделаны с агентами, используют только playwright-плагин для теста вэба и, наверное, всё
80–150 строк CLAUDE.md + оглавление и гиперссылки на заголовки, стартовые папки /docs). Папка /docs с понятной и читаемой вложенностью
И, наверное, всё
CLI и токен в глобальном env + на старте объясняю, где живет моя личная база знаний (сервера, токены до Cloudflare и MikroTik)
Такой сет-ап на сегодня позволяет создавать то, что я вам показываю, за 120–300 минут
Если вожусь дольше, как я это называю «пережарил идею», либо я уже переборщил, либо ушел не туда (не учитываем улучшения базовой версии, которая получилась успешно за 120 минут)
Самая базовая рекомендация, которая у меня к вам есть при вкатывании в ИИ-кодинг:
Просите агента искать в интернете
Просите делать тесты и поглядите, что из них есть код
Старайтесь спрашивать у агента, как бы он сделал лучше (модели на сегодня и так очень умные по статистике)
Просите агента сделать вам отображение логов всего, что вы делаете, в удобном для вас виде(какой, посоветуйтесь с агентом)
Но, кстати, Тимур очень много разговаривает про базу
Загляните к нему в канал, точно найдете очень много полезной инфы
Даже есть очень крутой курсец, который он недавно запустил, мой личный рек
UPDATE: Тимур закинул код на курсец, забираем TMY5XJ
2👍65❤32🔥13😁6🤝5🖕3💯1
Forwarded from Valerii Kovalskii
Если кому интересно
Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent
Взяли сервер с 6 H100 (и командой rmr) без измеения репо погоняли разные модели на нем под PAC1 на моем решении https://github.com/vakovalskii/phantom-agent
1🔥36👍11❤3
#безвотэтоговотвсего
Дружочки! Не успела отгреметь наша прошлая встреча, а мы уже врываемся в эфир с новым анонсом. Очевидно, что в начале 2026 года, среди прочего, произошло кое-что значимое в разработке. Если в конце 2025 мы всё ещё морщились от слов «вайбкодинг» и «агенты»…
Собрались поболтать про агентов!
Будет интересно привет всем кто офлайн
Будет интересно привет всем кто офлайн
🔥15
Forwarded from red_mad_robot
Что мешает масштабировать генеративный ИИ
В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе.
Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.
О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready🔗
#AI_moment #роботайм
↗️ red_mad_robot
В red_mad_robot мы регулярно проводим сессии по генеративному ИИ для технических команд, и один из самых частых запросов связан с переходом от первых ИИ-сценариев к системной работе.
Старт обычно получается быстрым. Сложнее закрепить эффект в процессе: договориться о правилах работы, критериях качества, границах системы и способе переноса удачных кейсов в общий контур разработки.
О том, как проходить этот этап, узнали у Head of AI red_mad_robot Валеры Ковальского и CTO AI red_mad_robot Влада Шевченко. Они как раз и ведут программу AI-Ready
#AI_moment #роботайм
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥9❤6
Forwarded from Константин Доронин
Как создавать AI-агентов на on-prem-моделях?
Как меняется создание пайплайна, когда мы переходим на локальные модели?
Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?
Чтобы ответить на эти(и многие другие) вопросы максимально-качественно, основываясь на большом практическом опыте, я попросил присоединиться к стриму Валеру.
Все, кому были неудобны стримы по субботам, возрадуйтесь!
Стрим будет во вторник, 5 мая в 16:00 мск.
Проведём его на моём YouTube-канале.
Чтобы добавить событие в календарь, нажимайте сюда.
Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!
Как меняется создание пайплайна, когда мы переходим на локальные модели?
Что вообще может этот ваш Qwen на 4B по сравнению с GPT-5.5?
Чтобы ответить на эти
Все, кому были неудобны стримы по субботам, возрадуйтесь!
Стрим будет во вторник, 5 мая в 16:00 мск.
Проведём его на моём YouTube-канале.
Чтобы добавить событие в календарь, нажимайте сюда.
Задавайте вопросы в комментариях. Обязательно ответим на них на стриме!
🔥37👍15❤7😁1