Neural Deep
7.65K subscribers
308 photos
44 videos
3 files
199 links
Head of AI redmadrobot.ru

6 лет: 0>>>Head of AI
AI Infrastructure | Production RAG

Local inference
RAG (2M+ книг)
RAG chat bot (5М+ токенов)
B2B платформа (10+ клиентов)
B2C gptdaisy.com (100k MAU)

Код, кейсы
github.com/vakovalskii | @neuraldeepchat
Download Telegram
Всем привет! Меня зовут Валерий Ковальский

В 25 лет пришел в IT без опыта. За 6 лет дошел до Head of AI в red_mad_robot
Специализируюсь на AI Infrastructure: от железа до production (DevOps/LLMops/Network/Local inference)

Что конкретно делаю сейчас:
Развиваю AI-стратегию red_mad_robot — строим новый бизнес в области ИИ
Запустили корпоративную B2B платформу для RAG | 1
Параллельно развиваю gptdaisy.com

Что построил из крупного:
Рекомендательную систему для поиска книг для Билайн (500к книг в RAG)
RAG чат-ботов для ФСК (Более 5млн токенов в Domain Router RAG)
B2B RAG-платформу с собственным поисковым движком (Более 10 коммерческих интеграций)

О чем этот канал:
Здесь я делюсь реальным опытом разработки AI-продуктов.
Рассказываю как:
Выбирать и настраивать железо для AI
Строить RAG-системы в production
Запускать AI-продукты с нуля до 100 000 пользователей
Избегать типичных ошибок при внедрении ИИ в бизнес
Обучаю крупный бизнес | 1 | 2 | 3 и даю консультации
Провожу стримы где создаем RAG с нуля
Бесплатный мини мастер класс по RAG для 50+ человек


Разбираю кейсы с локальными LLM, показываю код, объясняю архитектуру на живых примерах
Делюсь инсайтами 90% фокуса вокруг RAG (на 2025 год смещаюсь в сторону r&d на прикладных бизнес задачах вокруг GenAI)

Мои пет-проекты:
@daisytranscribe_bot — транскрибация файлов до 2ГБ
@fastpixel_bot — FLUX + Runway генерация
@daisygpt_bot — карманный ChatGPT с историей


Телепорт по каналу

0) Based про RAG (c чего начать!)
1) Первые тесты Llama на нашем кластере из 4090
2) Как влияет reranker на работу RAG
3) Тюн Whisper в телеграм бота WER 6.3
4) Как снять ограничение в 19МБ на телеграм боте? (до 2ГБ)
5) Пример работы router agent на базе SO + Llama | 2
6) Cерия бенчмарков и реальных тестов Qwen VL | 2 | 3 | 4 | 5
7) Автоматизация браузера UI Agent (c репо) | 2
8) Deep Research на своем железе (с репо)
9) n8n серия про Digital Twin 1 | 2
10) Про экономику в LLM решениях 1 | 2
11) ERC 2025 | 1| 2 |3 |4 | Финал
12) OpenRouter Proxy LLM для своей компании
13) Кейс по AI Call Center | 1
14) Про мой Vibe Coding
15) Про MCP в 2025
16) Structured Output Streaming


За консультациями пишите в ЛС
Реклама в данном канале: не предусмотрена

У канала есть чат вы вопрос вам ответ!

Поехали разбираться, как устроен AI изнутри!
13🔥9👍5
Привет всем! Сегодня поговорим о нейронных сетях и разберемся, как они появились.

Начнем с того, что первые идеи появились ещё в 40-50-х годах. Ученые Уоррен Маккаллок и Уолтер Питтс пытались понять, как работает мозг, и создали простую модель нейрона. В этой модели у нейрона были "входы" и "выход". Входы получали какие-то сигналы, а нейрон решал, передавать ли сигнал дальше или нет. Схема была простой, но эта идея стала основой для всего, что появилось потом.

Перепрыгнем в 80-90-е. Тут на сцену выходит Ян Лекун и его сверточные нейронные сети. Так, что это за зверь? Сверточные сети — это как обычные нейронные сети, но умеющие "смотреть" на изображения. Они могут узнавать объекты на фотках, распознавать лица и многое другое. Сверточные сети позволили нам делать кучу крутых вещей: от распознавания текста до создания искусственных изображений.

И сейчас эти сети повсюду — от рекомендаций в интернет-магазинах до управления автомобилями.


1) Пример простой сети (схема)
2) ИИ как его видит Daisy
3) Первый компьютер на котором была запущена первая нейронная сеть "«Перцептрон Mark I». Источник: [Rosenblatt 1960]"
🔥6👏2😁21
https://www.forbes.ru/tekhnologii/498218-razrabotcik-cifrovyh-resenij-red-mad-robot-investiruet-2-mln-v-generativnyj-ii

Технологическая компания red_mad_robot до конца 2024 года инвестирует $2 млн в создание и работу лаборатории NDT (Neuraldeep.tech), которая займется проектами в области генеративного искусственного интеллекта (ГИИ). NDT будет работать над сервисами как для пользователей, так и для бизнеса. ГИИ — устойчивый тренд последнего года, который породила OpenAI. По мнению экспертов, он может изменить мировую экономику. Согласно оценкам Statista, в 2023 году объем рынка ГИИ в России может превысить $311 млн и достичь $1,479 млрд в 2030-м
🔥7😍3
This media is not supported in your browser
VIEW IN TELEGRAM
На тему моих постов об опасности ИИ =)
🔥7👏2👾2
Скоро наступит Новый Год, и это означает, что мы вместе продолжим погружение в мир искусственного интеллекта с новой силой после небольшого отдыха. Мы с командой постараемся чаще радовать вас интересными новостями из мира AI, делая акцент на полезных инструментах.
А сегодня я желаю вам прекрасного настроения, быть окружёнными близкими людьми и иметь вдохновляющие мысли о будущем. Вперёд к новым открытиям!
Желаю всех хорошо отдохнуть на каникулах!
🔥52🎄2
Channel photo updated
Всем привет и с началом чего-то нового!

Я долго думал, чем начать и продолжать наполнять этот канал и понял.

Самое главное это я буду оставлять тут свои заметки об AI и инструментах. Мысли про то, как будет трансформироваться мир, учитывая текущие тенденции развития технологий. Это нужно что бы всегда иметь возможность к ним вернуться, и практиковать хорошее и качественное оформление своих мыслей.

Буду вам рассказывать про то, как я оказался в ИТ. Как попасть в ИТ и на что стоит обратить внимание (без рекламы курсов, я в них не верю).
В целом, все, что я вижу почти каждый день, я буду стараться сюда выкладывать.
Вот список тем, которые я сейчас развиваю и в которые я ежедневно углубляюсь:
- GenAI,
- LLM,
- AI Startups,
- Инструменты для ежедневной работы на базе GenAI,
- Развитие продуктовых навыков (упаковка, презентация, ведение за инвестициями),
- Управление и делигирование,
- Выстраивание партнерских взаимоотношений.

Вы так же можете запросить в комментариях направление что интересует вас.


И многое другое в области AI стартапов.

Отдельно я все бы затронул такие темы как становление в таких начинаниях как ИТ и AI.
Как я себя позиционировал и что вело меня к тем или иным решениям.

Как я стал DevOps и продолжаю им быть. Как я стал Hardware-инженером и продолжаю интересоваться железом и использовать его для своей работы. Как я стал CEO и какой это был путь длиной в 5 лет от системного администратора до руководителя своего стартапа.


А начну, наверное, с практики.


И так, чем занимаются такие, как я шизики, в начале года и недели:

1) Уже поиграли с командой в игру "Вспомнить все". Картинка 2: провели поиск и анализ всех проектов, которые были в разных статусах на конец 2023.
Собрались с ребятами и обсудим все эти проекты а так выставили приоритеты.

2) Собрали стратегию по выполнению задач. Картинка три.


3) Отдельно я подготовил шаблон и с Core Team проведем стратегическую сессию над выбором целей для новых исследований по очень крутому шаблону в miro
🔥82👍2
Neural Deep pinned Deleted message
Много шума касается маркета OpenAI. От себя скажу:

Вот статья к прочтению о том, что такое GPT's: https://habr.com/ru/articles/775070/.

Кратко, это удобный интерфейс для создания RAG без тонкой настройки.

Кому это полезно?

Как пример:

Небольшим бизнесам (малым продуктам) можно создать FAQ по продукту быстро и достаточно просто (обычный человек точно не справится, нужно разбираться в промптировании).
А теперь о проблемах.

Есть одна глобальная проблема у таких решений и несколько поменьше, а именно - точность. Веб-интерфейс OpenAI вам не поможет это решить при создании GPT's.

Мы сейчас с командой занимаемся разработкой альтернативных вариантов для улучшения точности в RAG-системах и уже внедрили первый пайплайн HyDE.

В чем суть?

Если мы ищем данные в наших знаниях и пытаемся использовать LLM для анализа, то часто упускаем из виду, что неподготовленные данные и инструкции снижают точность работы такой системы до 45% и ниже.

Мы уже знаем, что нужно проверять и пробовать под конкретные задачи. Например, для нашей SmartBase мы разрабатываем инжиниринг промптов и чанк-эксперименты. Они уже завершились успешно: для узкого домена данных мы подняли точность до 90-97% полноты и качества ответов.

Это о том, что даже инструменты для создания GPT's сильно ограничены, когда мы хотим работать с уникальным доменом и требуется тонкая настройка.

Сейчас мы проводим эксперименты с HyDE (Hypothetical Document Embeddings).

При стандартном RAG в качестве "ответов" служат документы из базы знаний, в качестве "запросов" - вопросы от пользователей. Есть гипотеза, что эмбеддинг вопроса и эмбеддинг ответа принадлежат разным семействам. По аналогии, ключи и значения в механизме внимания трансформеров - это разные вектора.
🔥6
Из-за задушенной политики безопасности Openai на Amazon появились товары с названиями вроде "Я не могу выполнить этот запрос". Под этим названием на маркетплейсе продают шезлонги, книги, диваны и другие товары. По-видимому, текст для карточек на Amazon генерируют с помощью ChatGPT от Openai и добавляют его в описание не глядя.

На российских маркетплейсах ничего подобного не нашли, но уверены, все еще впереди.
😁5🤣2
This media is not supported in your browser
VIEW IN TELEGRAM
Всем доброе утро!

Робот Tesla Optimus умеет складывать одежду! Но пока не слишком хорошо.

Видео, опубликованное Илоном Маском, показывает, как робот складывает футболку на столе. Хотя он выглядит довольно умелым в этом деле, нужно учесть, что Optimus действует не самостоятельно, а как дорогая марионетка, следуя предписанным движениям. Илон Маск говорит, что в будущем Optimus сможет делать это полностью автономно, без ограничений типа фиксированного стола и одной рубашки в корзине.

В то же время некоторые Tesla FSD (Full Self-Driving) покупатели выразили недовольство, утверждая, что вместо того чтобы сосредоточиться на доработке обещанной самоуправляемой возможности автомобилей, Илон Маск теперь пиарит робота, складывающего рубашки.
5
This media is not supported in your browser
VIEW IN TELEGRAM
Возможности создания эмбедингов с произвольными параметрами

Что меня особенно впечатлило в последнем обновлении от OpenAI, это возможность генерации эмбедингов с нефиксированными размерами.

Напоминаю, эмбединг - это методика преобразования текста в числовой вектор, который затем может быть использован, например, в RAG (Retrieval-Augmented Generation).

Такой подход открывает перед учеными и разработчиками новые горизонты. Гибкость в выборе размера эмбедингов позволяет более тонко настраивать системы под определенные задачи, улучшая не только их точность, но и скорость работы и эффективность использования памяти. Вероятно, мы увидим, как изменение размеров эмбедингов способствует прогрессу в таких областях, как семантический поиск, кластеризация текста или даже в создании текстов. Также можно ожидать заметного воздействия на сферу поисковых систем, где важен баланс между скоростью и точностью результатов.
🔥72
Media is too big
VIEW IN TELEGRAM
Вау, это выглядит как настоящий трейлер фильма по вселенной Warhammer 40k! Но есть один момент — видео полностью создано искусственным интеллектом. Для воплощения такого атмосферного ролика фанат использовал искусственные интеллекты Midjourney и Runway.

Теперь в ожидании полноценного фильма от создателя! А пока есть возможность создать собственный эпический трейлер с помощью Midjourney — посмотреть можно здесь, и Runway — по этой ссылке.
@neuraldeep
🔥12👍32👎2