Neural Deep
7.79K subscribers
314 photos
44 videos
3 files
202 links
Head of AI redmadrobot.ru

6 лет: 0>>>Head of AI
AI Infrastructure | Production RAG

Local inference
RAG (2M+ книг)
RAG chat bot (5М+ токенов)
B2B платформа (10+ клиентов)
B2C gptdaisy.com (100k MAU)

Код, кейсы
github.com/vakovalskii | @neuraldeepchat
Download Telegram
Channel created
Всем привет! Меня зовут Валерий Ковальский

В 25 лет пришел в IT без опыта. За 6 лет дошел до Head of AI в red_mad_robot
Специализируюсь на AI Infrastructure: от железа до production (DevOps/LLMops/Network/Local inference)

Что конкретно делаю сейчас:
Развиваю AI-стратегию red_mad_robot — строим новый бизнес в области ИИ
Запустили корпоративную B2B платформу для RAG | 1
Параллельно развиваю gptdaisy.com

Что построил из крупного:
Рекомендательную систему для поиска книг для Билайн (500к книг в RAG)
RAG чат-ботов для ФСК (Более 5млн токенов в Domain Router RAG)
B2B RAG-платформу с собственным поисковым движком (Более 10 коммерческих интеграций)

О чем этот канал:
Здесь я делюсь реальным опытом разработки AI-продуктов.
Рассказываю как:
Выбирать и настраивать железо для AI
Строить RAG-системы в production
Запускать AI-продукты с нуля до 100 000 пользователей
Избегать типичных ошибок при внедрении ИИ в бизнес
Обучаю крупный бизнес | 1 | 2 | 3 и даю консультации
Провожу стримы где создаем RAG с нуля
Бесплатный мини мастер класс по RAG для 50+ человек


Разбираю кейсы с локальными LLM, показываю код, объясняю архитектуру на живых примерах
Делюсь инсайтами 90% фокуса вокруг RAG (на 2025 год смещаюсь в сторону r&d на прикладных бизнес задачах вокруг GenAI)

Мои пет-проекты:
@daisytranscribe_bot — транскрибация файлов до 2ГБ
@fastpixel_bot — FLUX + Runway генерация
@daisygpt_bot — карманный ChatGPT с историей


Телепорт по каналу

0) Based про RAG (c чего начать!)
1) Первые тесты Llama на нашем кластере из 4090
2) Как влияет reranker на работу RAG
3) Тюн Whisper в телеграм бота WER 6.3
4) Как снять ограничение в 19МБ на телеграм боте? (до 2ГБ)
5) Пример работы router agent на базе SO + Llama | 2
6) Cерия бенчмарков и реальных тестов Qwen VL | 2 | 3 | 4 | 5
7) Автоматизация браузера UI Agent (c репо) | 2
8) Deep Research на своем железе (с репо)
9) n8n серия про Digital Twin 1 | 2
10) Про экономику в LLM решениях 1 | 2
11) ERC 2025 | 1| 2 |3 |4 | Финал
12) OpenRouter Proxy LLM для своей компании
13) Кейс по AI Call Center | 1
14) Про мой Vibe Coding
15) Про MCP в 2025
16) Structured Output Streaming


За консультациями пишите в ЛС
Реклама в данном канале: не предусмотрена

У канала есть чат вы вопрос вам ответ!

Поехали разбираться, как устроен AI изнутри!
13🔥9👍7