Вот где реальный киберпанк! В комментариях Data Secrets сегодня сильно подняло настроение =)
P.S
1) Уже почти мем
2) Доказываем теорию мертвого интернета
Порно бот пишет осмысленный комментарий под постом про то, как Ризонинг-модель пишет диссы на человеческую статью про ризонинг.
Добро пожаловать в киберпанк
P.S
1) Уже почти мем
2) Доказываем теорию мертвого интернета
😁57❤9🤣8 7
Neural Deep
Проблема №2: Миграция фильтров без должного тестирования
GuardRails для фильтрации NSWF контента для b2c продукта
Достаточно острая тема в b2c сегменте фильтрация text input запросов от пользователей на предмет пикантных тем
Прошло 4 дня с момента релиза обновленного фильтра для NSWF(запрещенка) контента генерации изображений и видео, за 4 дня к нам попало почти ~10к органических запросов из них было отклонено 1840 запросов
Проанализировали их все глазами и получили 8% FP(ложных детектов)
На текущий момент понятно что можно улучшить внутри промпта для фильтра хочу сократить количество ложных минимум на 5% но я хочу прийти к 2-3% без увеличения скорости работы и кол-ва токенов а это значит что мы продолжаем тесты!
И кстати инструмент визуализации и аналитики полностью навайбкожен, как по мне дает риалтайм понимание что просходит с фильтром и его работой
TL;DR: За 4 дня новый NSFW-фильтр на базе LLM с Structured Output обработал ~10k запросов, отклонил 1840 (18.4% rejection rate) с 8% false positives. Все улучшения через prompt engineering без code changes. Цель - снизить FP до 2-3% через оптимизацию промпта без увеличения latency/токенов. Real-time дашборд дает полное понимание работы системы. Продолжаем итерации для достижения production-ready точности.
Достаточно острая тема в b2c сегменте фильтрация text input запросов от пользователей на предмет пикантных тем
Прошло 4 дня с момента релиза обновленного фильтра для NSWF(запрещенка) контента генерации изображений и видео, за 4 дня к нам попало почти ~10к органических запросов из них было отклонено 1840 запросов
Проанализировали их все глазами и получили 8% FP(ложных детектов)
На текущий момент понятно что можно улучшить внутри промпта для фильтра хочу сократить количество ложных минимум на 5% но я хочу прийти к 2-3% без увеличения скорости работы и кол-ва токенов а это значит что мы продолжаем тесты!
И кстати инструмент визуализации и аналитики полностью навайбкожен, как по мне дает риалтайм понимание что просходит с фильтром и его работой
🔥27 5
Forwarded from R77 AI | Кейсы в ИИ (от выпускников МФТИ)
RAG — можно ли запилить коробку?
Вернулись к тех. вебинарам после более бизнесово-менеджерских)
Позвали наших друзей Елизавету Ермакову, Диму Черноуса из МТС AI и Валерия Ковальского из Neural deep tech, чтобы обсудить, что сейчас больше и больше приходит запросов от супер разных бизнесов на реализацию разных ассистентов с RAG под капотом. Не все могут позволить кастом, да и многие пилят свою "коробку". Интересно – можно ли вообще сделать коробку RAG (и если да, то в рамках каких ограничений).
А вот конкретно:
1. Единый чат-бот (ассистент по знаниям) vs. отдельные сценарии / кейсы. Почему Валера не делает чат-ботов.
2. Коробка RAG vs. Кастом. Какие ограничения технологий. Можно ли поставить коробку где retrieval будет работать.
3. Входной порог к разработке своих решений. vibe coding.
4. Поделиться байками (как многие не понимают что такое RAG, делают FTS, называя это ИИ и тд)/фейлами (типо cost выше стоимости лицензий и тд).
В среду в 16-00, ставьте нотифай в трансляции, ну и в календарик вот
Вернулись к тех. вебинарам после более бизнесово-менеджерских)
Позвали наших друзей Елизавету Ермакову, Диму Черноуса из МТС AI и Валерия Ковальского из Neural deep tech, чтобы обсудить, что сейчас больше и больше приходит запросов от супер разных бизнесов на реализацию разных ассистентов с RAG под капотом. Не все могут позволить кастом, да и многие пилят свою "коробку". Интересно – можно ли вообще сделать коробку RAG (и если да, то в рамках каких ограничений).
А вот конкретно:
1. Единый чат-бот (ассистент по знаниям) vs. отдельные сценарии / кейсы. Почему Валера не делает чат-ботов.
2. Коробка RAG vs. Кастом. Какие ограничения технологий. Можно ли поставить коробку где retrieval будет работать.
3. Входной порог к разработке своих решений. vibe coding.
4. Поделиться байками (как многие не понимают что такое RAG, делают FTS, называя это ИИ и тд)/фейлами (типо cost выше стоимости лицензий и тд).
В среду в 16-00, ставьте нотифай в трансляции, ну и в календарик вот
🔥27❤8 5🤡2
https://t.iss.one/r77_ai?livestream
Успей еще 30 минут онлайн
Залетайте на стрим про RAG и чатботов!
Елизавету Ермакову, Диму Черноуса из МТС AI и Валерия Ковальского из Neural deep tech
Успей еще 30 минут онлайн
Залетайте на стрим про RAG и чатботов!
Елизавету Ермакову, Диму Черноуса из МТС AI и Валерия Ковальского из Neural deep tech
Telegram
R77 AI | Кейсы в ИИ (от выпускников МФТИ)
Топ-10 интеграторов и разработчиков ИИ России.
Рассказываем о реальных проектах с ИИ, ML, DS, CV, LLM, RAG.
Без новостей о новом ChatGPT и ответов на вопрос «Заменят ли нейросети человека».
Наш сайт: https://r77.ai
Приемная: @savinvlad
Рассказываем о реальных проектах с ИИ, ML, DS, CV, LLM, RAG.
Без новостей о новом ChatGPT и ответов на вопрос «Заменят ли нейросети человека».
Наш сайт: https://r77.ai
Приемная: @savinvlad
🔥10
Forwarded from red_mad_robot
red_mad_robot совместно с @beeline представил первую линейку AI-агентов
На ПМЭФ мы показали результат технологического партнёрства с билайном — первую линейку корпоративных AI-агентов, ориентированных на прикладные задачи бизнеса и госсектора.
Агенты закрывают пять ключевых направлений:
📍 Продажи
📍 Контакт-центр
📍 Административные процессы
📍 Разработку
📍 Маркетинг
В отличие от классических чат-ботов, AI-агенты взаимодействуют в формате диалога, понимают задачи в свободной форме, обращаются к внутренним базам данных и внешним источникам информации — и возвращают готовое решение. Это интеллектуальные ассистенты, встроенные в корпоративную инфраструктуру и адаптированные под реальные процессы.
Если вы на ПМЭФ — приходите на наш стенд, чтобы первыми протестировать сценарии вживую.
#AI_moment #роботайм
↗️ red_mad_robot
На ПМЭФ мы показали результат технологического партнёрства с билайном — первую линейку корпоративных AI-агентов, ориентированных на прикладные задачи бизнеса и госсектора.
Агенты закрывают пять ключевых направлений:
В отличие от классических чат-ботов, AI-агенты взаимодействуют в формате диалога, понимают задачи в свободной форме, обращаются к внутренним базам данных и внешним источникам информации — и возвращают готовое решение. Это интеллектуальные ассистенты, встроенные в корпоративную инфраструктуру и адаптированные под реальные процессы.
Если вы на ПМЭФ — приходите на наш стенд, чтобы первыми протестировать сценарии вживую.
#AI_moment #роботайм
Please open Telegram to view this post
VIEW IN TELEGRAM
10🔥41👍11💯3🤣3
Forwarded from Pavel Zloi
Философских размышлений пост
С момента начала AI-хайпа прошло уже достаточно времени. За весь этот период мне так и не удалось попробовать хотя бы один действительно завершённый, полноценно работающий продукт с нейросетью под капотом.
Во всех случаях, даже если продукт выглядит многообещающим, рано или поздно обнаруживаются недостатки, то картинки кривые генерит, то текст не тот напишет, то забудет о чём речь была два сообщения назад. Наиболее показательный пример - чат-интерфейсы с нейросетями (например ChatGPT или DeepSeek, или Qwen и так далее), в которых повсеместно присутствуют кнопки лайк/дизлайк. Это означает, что от пользователя ожидается разметка и оценка качества работы системы.
AI-содержащие продукты создают занятный прецедент, они возвели идею A/B тестирования в абсолют и конечные пользователи всегда получают полурабочий продукт, который им предлагают тестировать и сообщать об ошибках, собирая при этом фидбэк.
Ситуация становится особенно занятно, если доступ к продукту платный.
Иными словами, я оплачиваю подписку за то, чтобы тестировать неготовую систему и отдавать свой фидбэк разработчикам.
С момента начала AI-хайпа прошло уже достаточно времени. За весь этот период мне так и не удалось попробовать хотя бы один действительно завершённый, полноценно работающий продукт с нейросетью под капотом.
Во всех случаях, даже если продукт выглядит многообещающим, рано или поздно обнаруживаются недостатки, то картинки кривые генерит, то текст не тот напишет, то забудет о чём речь была два сообщения назад. Наиболее показательный пример - чат-интерфейсы с нейросетями (например ChatGPT или DeepSeek, или Qwen и так далее), в которых повсеместно присутствуют кнопки лайк/дизлайк. Это означает, что от пользователя ожидается разметка и оценка качества работы системы.
AI-содержащие продукты создают занятный прецедент, они возвели идею A/B тестирования в абсолют и конечные пользователи всегда получают полурабочий продукт, который им предлагают тестировать и сообщать об ошибках, собирая при этом фидбэк.
Ситуация становится особенно занятно, если доступ к продукту платный.
Иными словами, я оплачиваю подписку за то, чтобы тестировать неготовую систему и отдавать свой фидбэк разработчикам.
👍62🤡36😁13 10
Veo 3 бесплатно на 15 месяцев но есть нюансы
Мой друг Миша поделился схемой получения Google AI Pro через студенческий план сам попробовал работает!
Что получаете
Veo 3 для генерации видео
Gemini Pro с Deep Research
2TB на Google Drive
15 месяцев бесплатно (экономия 300$)
Суть схемы (обожаю темки)
Студенческая почта на etempmail.com + смена региона на США + не российская карта = профит за 5 минут
НО честно говоря меня всегда тригерит, что такие дыры либо специально оставлены Google для привлечения аудитории, либо их скоро прикроют
Слишком уж просто для компании уровня Google "не заметить" такую лазейку
Либо это фича маркетинга, либо скоро будет патч
Детали схемы у Миши в канале, он там подробно расписал весь процесс
Пока работает можно попробовать
Но не удивлюсь, если через месяц-два эту возможность закроют и заблокают арбузеров
Сам пока тестирую Veo 3 — результаты неплохие для бесплатного доступа!
UPDATE: еще подобные гайдлайны
Мой друг Миша поделился схемой получения Google AI Pro через студенческий план сам попробовал работает!
Что получаете
Veo 3 для генерации видео
Gemini Pro с Deep Research
2TB на Google Drive
15 месяцев бесплатно (экономия 300$)
Суть схемы (обожаю темки)
Студенческая почта на etempmail.com + смена региона на США + не российская карта = профит за 5 минут
НО честно говоря меня всегда тригерит, что такие дыры либо специально оставлены Google для привлечения аудитории, либо их скоро прикроют
Слишком уж просто для компании уровня Google "не заметить" такую лазейку
Либо это фича маркетинга, либо скоро будет патч
Детали схемы у Миши в канале, он там подробно расписал весь процесс
Пока работает можно попробовать
Но не удивлюсь, если через месяц-два эту возможность закроют и заблокают арбузеров
Сам пока тестирую Veo 3 — результаты неплохие для бесплатного доступа!
UPDATE: еще подобные гайдлайны
🔥19👍5👏3 2
Лучшее AI редактирование фото в open-source
FLUX.1-Kontext-dev
https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Ну что, ребята молодцы
выпустили модель в open-source
А я скоро протестирую что по локальному железу и скорости
AI редактирование изображений в своих проектах и workflow выходит на новый уровень!
FLUX.1-Kontext-dev
https://huggingface.co/black-forest-labs/FLUX.1-Kontext-dev
Ну что, ребята молодцы
выпустили модель в open-source
А я скоро протестирую что по локальному железу и скорости
AI редактирование изображений в своих проектах и workflow выходит на новый уровень!
🔥15💯7👍6🤯2
🔥33👍16❤3
Vibe Coding: Реальность vs хайп. Как за 7 дней по вечерам собрать MVP AI-платформы транскрибации
Предыстория: Год назад мы с Артёмом уже делали ASR на Whisper Large v2
Есть даже бот @daisytranscribe_bot он работает на базе него, но работал медленно
Внутри компании звонки множатся, все хотят транскрипт, саммари и закрепить в базе знаний (еще же нужно что бы точно безопасно!)
Решение: Отбросить сомнения как говорит Паша, не смотреть на код, главное фичи для пользователя!
Железо: 2x RTX 4500 (40GB) + RTX 4090 (48GB) освободились недавно значит берем
Стек: WhisperX + Qwen2.5-32B-Instruct + FastAPI + Vanilla JS + Python
Vibe Coding это что на деле?
Все бурлят про "AI написал мне приложение за день".
Реальность чуть-чуть сложнее
Я не написал ни одной функции с нуля. AI писал код, я только правил порты, адреса, конфиги
Но направлял архитектуру, принимал решения, тестировал, давал правки вел TODO
За 7 днями стоят 6 лет опыта в DevOps/архитектуре/разработке/дизайне/продукте
Факт №1 AI не заменяет экспертизу он ускоряет её
Результат
Фичи
Дальше я выдал доступ к репо Артёму и он накидал док по которому мы дальше будем двигаться по правкам (тоже вырабатываем новый подход к разработке).
Как точно подметил Коля из чатика авторов про AI:
И это действительно так разница между "вроде работает" и системным подходом огромная
Да, есть проблемы пока БД плохо описана и в sqllite, перееду на PostgreSQL. Были глюки с авторизацией, за 2 дня переехал на Google OAuth
Проект модульный, взял лучшие практики, теперь твердая основа для транскрипции в компании есть
Главные инсайты для меня
1. Можно сделать MVP за 7 дней одному
2. AI-ассистент меняет роль
3. Проверка критична
4. Vibe coding ≠ магия
5. Vibe coding точно быстрее
Факт №2 Я Потратил 820 вызовов в Cursor это не "одна кнопка"
Почему успех?
Сервисом реально пользуются!
Саммари после встреч приходят сразу 1:30 звонка транскрибица с разделением по ролям за 8 минут!
Когда код сделанный вот в таком формате решает проблемы людей лучшая мотивация.
2x RTX 4500 + RTX 4090 + неделя энтузиазма = AI-платформа в продакшене!
Факт №3: Solo до MVP легко, но от MVP до production нужна команда: SAST, масштабирование, безопасность AI (не учёл всё сразу).
P.S. Дальше, если наберется данных, расскажу про обучение транскодера для qwen2.5-7b-instruct
Скрины интерфейса и архитектуры в комментариях
P.S.S Планирую залить в open-source
Предыстория: Год назад мы с Артёмом уже делали ASR на Whisper Large v2
Есть даже бот @daisytranscribe_bot он работает на базе него, но работал медленно
Внутри компании звонки множатся, все хотят транскрипт, саммари и закрепить в базе знаний (еще же нужно что бы точно безопасно!)
Решение: Отбросить сомнения как говорит Паша, не смотреть на код, главное фичи для пользователя!
Железо: 2x RTX 4500 (40GB) + RTX 4090 (48GB) освободились недавно значит берем
Стек: WhisperX + Qwen2.5-32B-Instruct + FastAPI + Vanilla JS + Python
Vibe Coding это что на деле?
Все бурлят про "AI написал мне приложение за день".
Реальность чуть-чуть сложнее
Я не написал ни одной функции с нуля. AI писал код, я только правил порты, адреса, конфиги
Но направлял архитектуру, принимал решения, тестировал, давал правки вел TODO
За 7 днями стоят 6 лет опыта в DevOps/архитектуре/разработке/дизайне/продукте
Факт №1 AI не заменяет экспертизу он ускоряет её
Результат
- 16,611 строк кода (Python 25.7%, JS 42%, CSS 15.1%)
- 3 компонента: Backend + Frontend + Chrome Extension
- 56 транскриптов обработано, 20 пользователей
- x8 ускорение от старого ASR
- Час 30 аудио → 8 минут обработки с саммари
Фичи
- WhisperX транскрипция с диаризацией
- Qwen2.5-32B-Instruct саммаризация (120k контекст!)
- Real-time транскрипция через WebSocket
- Chrome расширение для записи звука
- 6 форматов экспорта: SRT, DOCX, PDF, JSON, TSV, VTT
- Google OAuth авторизация
Дальше я выдал доступ к репо Артёму и он накидал док по которому мы дальше будем двигаться по правкам (тоже вырабатываем новый подход к разработке).
Как точно подметил Коля из чатика авторов про AI:
"Вообще эта дока – лучшая иллюстрация отличий vibecoding vs coding-with-ai. Что большая часть вайбкодеров из твиттера/ютуба даже никогда не узнают про такие косяки у себя в коде."
И это действительно так разница между "вроде работает" и системным подходом огромная
Да, есть проблемы пока БД плохо описана и в sqllite, перееду на PostgreSQL. Были глюки с авторизацией, за 2 дня переехал на Google OAuth
Проект модульный, взял лучшие практики, теперь твердая основа для транскрипции в компании есть
Главные инсайты для меня
1. Можно сделать MVP за 7 дней одному
Доказал: один человек = DevOps/Архитектор/Разработчик/Дизайнер/Продукт Но нужны 6 лет фундамента
Начни с простого проекта на знакомом стеке
Четкое ТЗ, нарисуй архитектуру разбей все на микрозадачи(конвертим в cursor rules)
Делай каждый день по 2-3 часа, не растягивай
2. AI-ассистент меняет роль
От кодера к архитектору и тестировщику
Попробуй Cursor/GitHub Copilot на реальном проекте
Архитектурные паттерны, системный дизайн
Формулируй задачи четко, проверяй каждый результат
3. Проверка критична
AI пишет красивый код, который может работать неправильно или вовсе создаст вам моков (такое было раза 3 точно)
Я тестил каждую функцию руками и по несколько раз от апи до интерфейса
4. Vibe coding ≠ магия
AI помогает думать быстрее, но опыт незаменим
Системное мышление, понимание бизнес-логики
Изучай паттерны, архитектуру, best practices
5. Vibe coding точно быстрее
Особенно на старте и с 0 когда ты можешь нарезанные задачи раздать
толпе вкладок в том же курсоре их можно сделать несколько
Курсор не плохо сразу трудится над параллельными задачами главное сам не теряй фокус!
Факт №2 Я Потратил 820 вызовов в Cursor это не "одна кнопка"
Почему успех?
Сервисом реально пользуются!
Саммари после встреч приходят сразу 1:30 звонка транскрибица с разделением по ролям за 8 минут!
Когда код сделанный вот в таком формате решает проблемы людей лучшая мотивация.
2x RTX 4500 + RTX 4090 + неделя энтузиазма = AI-платформа в продакшене!
Факт №3: Solo до MVP легко, но от MVP до production нужна команда: SAST, масштабирование, безопасность AI (не учёл всё сразу).
P.S. Дальше, если наберется данных, расскажу про обучение транскодера для qwen2.5-7b-instruct
Скрины интерфейса и архитектуры в комментариях
P.S.S Планирую залить в open-source
7🔥91👍27💯6🤔3
Давно хотел перепостить этот прекрасно визуальный конспект команды Data Secret в свой канал
Так что если кто-то пропустил то к изучению!
Так что если кто-то пропустил то к изучению!
👍4