HighLoad++ – Telegram

HighLoad++

@HighLoadChannel

6K subscribers

2.28K photos

137 videos

15 files

2.12K links

Официальный канал профессиональной конференции разработчиков высоконагруженных систем

Встречаемся 6 и 7 ноября в Москве на HighLoad++ 2025: https://highload.ru/moscow/2025

Общаемся в чатике https://t.iss.one/HighLoadTalks

Download Telegram

About

Blog

Apps

Platform

Всем привет!
Яндекс в 2021 году запустил три HPC/GPU-кластера для машинного обучения, которые стали самыми мощными суперкомпьютерами в России.

Дмитрий Монахов расскажет о том, с какими сложностями и неожиданностями они столкнулись на этом пути.
📋 https://clck.ru/au8Mi

Из доклада вы узнаете:
* о революции трансформеров;
* о том, что такое современный HPC/GPU-кластер, зачем коммерческим компаниям понадобились суперкомпьютеры;
* на каком стеке технологий они строятся и почему;
* почему HPC — это сложно, а традиционные подходы часто не работают;
* как вообще устроен процесс попадания в топ-500, и как, оптимизируя производительность для попадания в рейтинг, мы нашли проблемы, решив которые, мы ускорили наше машинное обучение.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/au8PP

1.67K views09:12

1.24K views12:58

Всем привет!

Приходите на выступление Георгия Енукидзе - бэкенд-инженера в DS-команде в Авито.
📋 https://clck.ru/auEdp

У них в команде более 40 однотипных ML-микросервисов, и их число постоянно растет. Перед бэкенд-инженерами стоят задачи обеспечения максимального RPS, оптимизации использования железа и централизованного распространения лучших практик и фич между сервисами.

В результате решения этих задач появился фреймворк «Акведук», позволяющий описать пайплайн обработки данных, концентрируясь на его логическом устройстве, а не технических деталях.

С технической точки зрения Акведук представляет собой легковесную Python-библиотеку, активно использующую возможности пакетов 'multiprocessing' и 'asyncio', что позволяет значительно повысить утилизацию инференс серверов.

В своем докладе Георгий подробно расскажет, как они пришли к идее и усовершенствовали свой фреймворк, сравнит с другими известными решениями и даст практические рекомендации по использованию Акведука.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/auEeC

👍1

1.33K viewsedited 12:58

Привет, друзья!

Всеволод Светлов - руководитель группы нейросетевой персонализации в Яндексе расскажет, как строить Low Latency рекомендательный трансформер на миллион RPS.
📋https://clck.ru/auMQe

Всеволод поделится информацией об их модели пользовательских рекомендаций в рекламной сети Яндекса и некоторых проблемах, которые могут возникнуть при внедрении тяжелых нейросетевых моделей в высоконагруженный продакшн.

Примерный план доклада:
* высокоуровневое описание модели, для чего она нужна и как она работает;
* зачем они разделили полноценный рекомендательный трансформер с early fusion-подходом на независимые части;
* какие сложности возникают в обеспечении консистентных данных в рантайме и в обучении;
* почему вашу рекомендательную модель нужно регулярно дообучать;
* почему батчевание GPU-вычислений критически важно;
* как разделение СPU- и GPU-частей модели может помочь выиграть еще несколько тысяч RPS на GPU.

✅ Встречаемся 17 и 18 марта в Москве!
Забронировать билет - https://clck.ru/auMRN

👍1

1.29K viewsedited 17:01

1.2K views09:05

Привет, друзья!

Ибрагим Бадертдинов и Александр Абрамов из SberDevices расскажут, про ускорение и облегчение моделей для поддержания диалога виртуальных ассистентов Салют.
📋 https://clck.ru/audd4

Команда SberDevices активно разрабатывает виртуальных ассистентов Салют. Они используют технологии AI для распознавания голоса и обработки естественного языка, чтобы их помощники умели вести беседу и приносили реальную пользу людям.

Для этого постоянно приходится решать различные NLP-задачи. Они адаптируют и обучают большие языковые модели на базе трансформеров (BERT, GPT).

С одной стороны, возникает большое количество специфичных задач: например, классификация сообщений, выделение именованных сущностей, определение интентов, моделирование диалога, а с другой — необходимость быстрого инференса в условиях большой нагрузки.

В рамках доклада Ибрагим и Александр поделятся своими практиками, как эффективно обучать большие multitask-модели, быстро собирать необходимые данные и, самое главное, как оптимизировать использование ресурсов памяти и ускорять модели в продакшне.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/auddo

1.24K views09:05

Всем привет!

Александр Прудаев из группы разработки движка Яндекс.Метрики, расскажет историю одного переезда метрики.
📋https://clck.ru/aupoj

В Яндекс.Метрике существует сборка визитов пользователей на сайте, для этого необходимо хранить историю всех событий и склеивать их друг с другом на лету.
Для этого использовалась конвейерная распределенная система, со своим самописным локальным хранилищем и своей логикой репликации и шардирования. По мере роста нагрузки разработчики уперлись в производительность отдельного шарда, при этом продолжать наращивать их количество без принципиальной перестройки архитектуры было крайне болезненно.

🔹В рамках доклада Александр расскажет:
1. почему остановились на YDB, как переезжали, что сломали;
2. как научились работать с таблицей в 40ТБ и 1 миллионом запросов в секунду;
3. как тестировали и масштабировали.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/auppa

1.23K views14:21

1.22K views16:11

Привет, друзья!

Андрей Фомичев – руководитель отдела разработки систем хранения и обработки данных Yandex Database, расскажет про особенности выполнения распределенных транзакций и что они делают для того, чтобы их поведение было привычным для пользователя.
📋 https://clck.ru/ausHd

В Yandex хотят предоставить возможность взятия снапшота всей базы на начало выполнения транзакции, но без MVCC эта операция очень дорогая, так как в интерактивной транзакции заранее неизвестно, какие таблицы или диапазоны ключей будут затронуты. Реализация MVCC позволяет нам читать состояние базы на нужный момент времени в прошлом, и задача взятия снапшота сводится к выбору глобального Timestamp.

Погрузимся в особенности реализации MVCC в YDB:
* MVCC поверх LSM-деревьев;
* как они сделали MVCC с консистентными снапшотами в распределенной базе данных;
* почему выбрали глобальные, а не локальные таймстемпы.

Рассмотрим за и против: с одной стороны, с MVCC можно достаточно дешево реализовать консистентные снапшоты уровня базы во всех запросах, достигать большего параллелизма за счет большего реордеринга транзакций. С другой стороны, на хранение истории требуется дополнительное место.

В итоге — довольно уникальная ситуация, в которой мы можем сравнить поведение распределенной базы с MVCC и без MVCC под различными нагрузками.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/aus4t

1.3K views16:11

1.19K views13:10

Всем привет!
Приходите послушать доклад Дмитрия Овечкина - техлида voicekit Tinkoff о внутреннем устройстве сервиса распознавания речи.
📋 https://clck.ru/avzvU

Перед разработчиками стояла задача — обработка ~7000 параллельных аудиопотоков для распознавания, а также распознавание не в потоке с RTF (Real Time Factor) < 0.25, используя при этом ограниченные ресурсы GPU.

Дмитрий расскажет о том, зачем вообще необходимо распознавание речи, даст обзор основных модулей их сервиса, углубится в технические детали реализации:

* какими метриками можно оперировать в потоковых аудиосервисах (SPS, RTF, Head/Tail latency);
* как переписать бэкенд с Python на Go из-за отсутствия в Python хорошей многопоточности;
* как перевести кодовую базу на go-pipelines (https://blog.golang.org/pipelines), чтобы каждый этап обработки аудио проходил асинхронно;
* как развертывать deep-learning-модели в проде при помощи tf-serving, балансировки grpc-запросов через envoy и бесшовной выкатки новых моделей;
* как правильно настраивать батчинг моделей, чтобы максимально утилизировать GPU.

✅ До встречи на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/avzw5

1.21K views13:10

1.15K views15:42

Всем привет!

Одним из спикеров Highload++ Foundation будет Алексей Салмин - руководитель службы разработки realtime-технологий поиска в Яндекс.Поиск.
📋 https://clck.ru/awTbz

В своем докладе он расскажет краткую историю развития ядра веб-поиска Яндекса за последние несколько лет. Основной задачей команды, которая разрабатывает движок, можно назвать экономию ресурсов. Экономия не является самостоятельной целью, но при этом имеет огромное значение: она позволяет на том же железе наращивать поисковую базу, внедрять новые фичи и модели в ранжирование, принимать растущий пользовательский трафик.

Из доклада вы узнаете, как снизить потребление CPU с помощью:
* сжатия (sic!);
* микросервисов (sic!);
* асинхронного IO (???);
* заменой горизонтального шардирования на вертикальное и наоборот.

И другие интересные технологические решения: erasure-recovery в реальном времени, key-value storage на десятки миллионов RPS, e2e-сжатие со словарем, батчевание применения нейросетей и деревьев.

Доклад строится вокруг практического опыта, в нем мало теории. С другой стороны, многие из описанных приемов принесут пользу только в больших рантаймах (грубо говоря, от 10к ядер CPU), и не у всех слушателей будет возможность сразу применить эти идеи на практике. Но в любом случае будет интересно.

✅ Встречаемся на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/awTzE

1.26K views15:42

Как мы создавали Data Management Platform: архитектура, проблемы, выводы.

Для таргетинга в OZON используют сегменты, в которые группируют пользователей по различным правилам. На основе сегментов пользователи получают нотификации и письма. Видят рекомендации, баннеры и страницы с товарами и цены на товары, участвующие в маркетинговых акциях. В принципе на сегменты можно завязать любую механику, даже А/В тесты можно проводить.

Но проблема в том, что изначально сегменты создавались вручную, и в какой-то момент их стало слишком много. Чтобы автоматизировать этот процесс, разработчики создали DMP — Data Management Platform. Это относительно молодой проект, ему чуть больше двух лет, но он полностью уже себя оправдал.

В сегодняшней статье руководитель команды DMP & CDP Евгений Чмель рассказал, что получилось в результате.

Читать 📍https://habr.com/ru/company/oleg-bunin/blog/650473/

Как мы создавали Data Management Platform: архитектура, проблемы, выводы

Для таргетинга мы в Ozon используем сегменты, в которые группируем пользователей по интересам, а они могут быть определены через систему трекинга событий. Последние в свою очередь формируются в...

1.43K views09:56

Media is too big

VIEW IN TELEGRAM

Всем привет!

AWS задаёт стандарты на рынке облачных технологий. Но и в России облака развиваются, а курс доллара и законодательство делает их ещё более востребованными. Однако многие архитектурные решения и DevOps-практики слишком сильно различаются на российском и американском рынках cloud-провайдеров.

Возможно ли в России реализовать архитектурные решения, устоявшиеся в западной DevOps-культуре?

👉 Узнаем на выступлении Сергея Спорышева из ITSumma.
https://clck.ru/b2zfs

Основываясь на своем богатом опыте по разработке и DevOps-сопровождению для российских клиентов и практике, полученной в работе в качестве DevOps-саппорта для американских клиентов, Сергей сравнит возможности разных провайдеров.

📍Спешите запланировать своё участие в HighLoad++. Расписание и билеты -
https://clck.ru/b2zgU

👍2

1.42K views15:31

Всем привет!

О том, как эволюционировала архитектура Яндекс.Афиши – узнаем у руководителей разработки Александра Полякова и Михаила Сурина.
📋 https://clck.ru/bF7Cm

Они расскажут, как переезжали с REST на GraphQL. Пояснят, почему они выбрали технологию GraphQL, какие проблемы и задачи решали с ее помощью.

Прослушав их доклад, вы поймёте, подходит ли GraphQL вашему проекту и как сделать переход безболезненным. Узнаете про подходы и принципы, которых следует придерживаться, чтобы не выстрелить себе в ногу. Затронут вопросы типизации данных, безопасности, скорости работы API, расскажут про концепт даталоадеров.

✅ Встречаемся 17 и 18 марта в Москве, в Крокус Экспо!

⚡️Купить билет уже сейчас можно на сайте - https://clck.ru/bF7FG

1.32K viewsedited 09:01

Привет, друзья!

О том, как работает С++-движок рекламного сервера и с какими проблемами прошлось столкнуться разработчикам – поговорим с Дмитрием Корчагиным. Он является руководителем группы разработки сервиса, отвечающего за подбор и ранжирование рекламных объявлений — рекламного сервера myTarget.
📋 https://clck.ru/bGdD7

На своем выступлении Дмитрий расскажет об архитектуре сервиса, отвечающего за подбор рекламных объявлений. Поделится о том, как они боролись с фродом рекламодателей. Научились без потерь переживать несколько часов без синхронизации данных. А также как они выдерживают лимиты откруток кампаний в распределенной системе из нескольких сотен серверов.

План доклада:
* общая схема работы myTarget;
* очереди задач;
* синхронизация индекса;
* работа с метриками и статистикой;
* как решалась проблема с бесплатным для рекламодателя показом баннеров.

📍Спешите запланировать своё участие в HighLoad++. Расписание и билеты - https://clck.ru/bGdZ3

1.26K views13:05

Привет, друзья!

Эволюцию акторной системы обсудим на выступлении Алексея Станкевичуса (Яндекс).
Он руководит группой разработки распределенного хранилища и распределенной платформы YDB.
📋 https://clck.ru/bHZAW

Существует несколько подходов к созданию эффективных многопоточных приложений на С++. В Yandex Database (YDB) выбрали модель акторов и с нуля создали свою акторную систему. С тех пор прошло более 7 лет, и сегодня акторная система исполняется на десятках тысяч серверов. Чтобы пройти путь к созданию сложных модульных распределенных систем с помощью модели акторов разработчикам пришлось решить множество проблем.

Из доклада узнаем о некоторых из них:
* как совместить интерактивную нагрузку и фоновые задачи в одном приложении;
* как обеспечить гарантии latency и высокую утилизацию;
* как изолировать подсистемы и обойтись без резервирования CPU.
И, конечно, расскажет, почему выбрали именно модель акторов.

✅ Встречаемся на HighLoad++ 17 и 18 марта в Москве –
https://clck.ru/bHYn3

1.38K views14:27

Всем привет!

О том, как готовили поиск в Delivery Club – узнаем у Евгения Исупова и Ивана Максимова.
📋 https://clck.ru/bQ9ms

На конференции Highload++ Foundation они расскажут почему поиск — это не просто совпадения по полям данных. Как на запрос "Маргарита" появляется пицца, а на запрос "Пьяная бабушка" — бургер из известной сети? Каким образом на запрос "Макдональдс" вернуть не только сам ресторан, но и другие бургерные?

В докладе они поделятся об архитектуре поиска в Delivery Club, а также о повышении его релевантности с помощью ML-инструментов без потери в скорости ответа сервиса.

✅ Встречаемся на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/bQA7W

1.29K viewsedited 13:33

This media is not supported in your browser

VIEW IN TELEGRAM

Всем привет!

Поговорим с Владимиром Витковским о лучших практиках, на которых основан очень быстрый сборщик логов, используемый в Ozon.
📋 https://clck.ru/bR3ap

Владимир расскажет, как с помощью этого инструмента они сократили издержки на сбор логов в 10 раз по CPU и добились 100% доставляемости логов.

Вы узнаете:
* как организована общая архитектура сборщика логов;
* как написать быстрый плагин для чтения логов из файлов;
* как оптимизировать внутреннюю обработку потока логов;
* как правильно распараллелить обработку;
* как гарантировать доставку.

✅ Встречаемся на HighLoad++ 17 и 18 марта в Москве. Подробная информация и билеты на сайте – https://clck.ru/bR42b

🔥3

1.65K views15:05