HighLoad++
6K subscribers
2.3K photos
138 videos
15 files
2.14K links
Официальный канал профессиональной конференции разработчиков высоконагруженных систем

Встречаемся 6 и 7 ноября в Москве на HighLoad++ 2025: https://highload.ru/moscow/2025

Общаемся в чатике https://t.iss.one/HighLoadTalks
Download Telegram
@DDoS_Guard — отечественный провайдер защиты от DDoS-атак.

Компания самостоятельно разрабатывает и совершенствует технологии, предоставляет полную защиту от DDoS на уровнях L3-L7 с бесплатным CDN, а также защищенные облачные решения – VDS и выделенные серверы.

За 12 лет работы компании более 3 000 000 сайтов получили надежную защиту. Среди них множество сервисов, затрагивающих жизни тысяч людей: вузы, платежные платформы, СМИ, банки, маркетплейсы и другие.

На стенде @DDoS_Guard можно будет пообщаться с техническими специалистами, а SRE-инженер Владимир Радонец выступит с докладом об увлекательном переезде с K8s на Nomad. До встречи!

Реклама ООО «ДДОС-ГВАРД» erid: LjN8KQVDb
❤‍🔥4🔥2👏1
Авито.Автозагрузка: от 4 млн до 80 млн активных объявлений. Евгений Толмачев расскажет, как они искали проблемные места для поддержки роста х20.

Автозагрузка — это инструмент, позволяющий клиентам автоматизировать работу со своими объявлениями. Он состоит из множества сервисов и входит в топ-10 потребителей ресурсов в компании.

За все время существования они привыкли к линейному росту — каждый год продукт увеличивался в 1,5-2 раза, но в 2021 году все изменилось. Для запуска важных продуктовых инициатив им требовалось поддержать рост х20 и несмотря на то, что они имели неплохой «запас прочности», к таким цифрам не были готовы.

На Saint HighLoad++ 2023 Евгений уже рассказывал, как они готовили к росту один из своих сервисов. В этот раз он поделится опытом поддержки роста х20 уже на уровне всей компании и расскажет:

• как они искали узкие места и потенциальные точки отказа среди нескольких десятков сервисов, через которые проходит объявление перед тем, как попасть на Авито;

• о подходе к нагрузочному тестированию, который позволил им за квартал справиться с задачей, которую они изначально оценили в несколько человеко-лет;

• об основных проблемных местах в их архитектуре и решениях, которые помогли с ними справиться;

• о концепте инструмента прогнозирования нагрузки и проактивного поиска проблемных мест, который в будущем поможет исправлять их заранее.

🖐 Встречаемся 27 и 28 ноября на HighLoad++ 2023.

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Частичная модификация объектов в Yandex Object Storage: Александр Снопов расскажет, как они улучшают работу ФС поверх S3.

Объектные хранилища являются популярными системами хранения данных с отличной масштабируемостью, простым API и подходят для большого спектра задач. Однако для некоторых приложений возможностей стандартного объектного хранилища может оказаться недостаточно, а именно, когда для работы требуется интерфейс ФС.

Сейчас уже есть возможность работать с Yandex Object Storage как с ФС с помощью GeeseFS, про которую они рассказывали в прошлом году. Но для хорошего решения им сильно не хватало возможности частичной перезаписи объектов - метода PATCH. Про него и будет доклад.

В докладе Александр расскажет про:

- задачи, для которых не хватает стандартного S3 API, и хочется работать с хранилищем как с ФС;
- какие возможности предоставляют в этом плане различные облачные провайдеры;
- подробности про то, как они решали эту проблему в прошлом и чего не хватало для счастья;
- технические аспекты реализации частичной модификации объектов, проблемы, с которыми они столкнулись;
- что получилось в итоге, какие возможности дает метод PATCH и что планируется в будущем.

Ждём вас 27 и 28 ноября на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1
С Максимом Набоких поговорим про Kubernetes без интернета.

Kubernetes сейчас запускают везде, в том числе и в банках, и в КИИ. Только вот с интернетом там дела не то, чтобы обстоят плохо, его нет от слова совсем.

В докладе Максим расскажет про установку самого популярного решения для запуска контейнеров там, где не ступал ни один пакет из публичной сети.

- Рассмотрим целевую схему закрытого контура.
- Отдельно остановимся на нюансах работы инструментов для создания безопасной среды.
- Максим покажет, как они готовят дистрибутив к установке.
- Обсудим нюансы, возникающие на тех масштабах, на которых это делает Флант.
- Не обойдем стороной и доставку приложений в закрытых окружениях.

Ждём вас 27 и 28 ноября на HighLoad++ 2023 🖐

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Eventual consistency в stateful-сервисе обсудим с Дмитрием Исаевым.

Поговорим вот о чём:

- Распределенное хранилище размером 80+ Тб.
- Проблемы масштабирования.
- Невозможность строгих гарантий.
- Откуда взялась потребность усложнять простую схему.
- Как изначально звучал продуктовый заказ.
- Как устроена транзакционность в Метрике.
- Какие проблемы возникают, когда появляются связи между пользователями.
- Дмитрий расскажет, как они пошли «в лоб» и к чему это привело.
- Как они пришли к идее «команд».
- Переход к eventual consistency.
- Планировщик и decision maker как участник конвейера.

Встречаемся на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍1🔥1
Огорчает ли ChatGPT Даниила Подольского? Расскажут в своём докладе Варвара Подольская и Даниил Подольский.

Узнаем:

- Возможно ли пройти собеседование на сеньора при помощи ChatGPT.
- Как использовать ChatGPT эффективно, отвечая на вопросы и генерируя код на Golang.
- Как изменить процесс собеседования, чтобы действительно проверить знания разработчика.
- Что действительно нужно учить в Golang, чтобы соревноваться с ChatGPT.

Встречаемся на HighLoad++ 2023, в рамках которой пройдёт Golang Conf 2023 🖐

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Внутренняя платформа для разработки и разработчиков: за что платит бизнес? Александр Чубинский предлагает «справедливую» модель управления затратами в общей платформе Яндекса.

Представим, что вы предприимчивый лидер инженерной команды, которая предоставляет зрелую платформу для разработчиков широкому кругу команд в вашей компании. Компания достаточно большая и быстро растет, затраты на платформу становятся видны на основных финансовых радарах. Продукты компании являются или претендуют на то, чтобы быть самостоятельными бизнесами, в любом случае их волнует собственный P&L. В этот самый момент вы можете столкнуться с некоторыми из нижеперечисленных проблем:

- потребители не знают, во сколько им обходится платформа. Рассматривают ее как условно бесплатное образование и медицину в СССР, с соответствующим отношением — не вдумчивым потреблением;

- руководство компании не знает, как гибко контролировать траты на платформу, на каких потребителей нужно создавать давление и какое;

- потребители создают давление на платформу вида «перееду во внешнее облако, там лучше и дешевле»;

- руководитель платформы сталкивается со сложностями в обосновании роста команды платформы, каждый раз приходится искать новые аргументы;

- если потребители — самостоятельные бизнесы, то у них возникают сложности с расходными статьями в P&L.

В рамках доклада мы рассмотрим подход, который позволит перевести вашу платформу на новый уровень зрелости продукта, из состояния «всем всё бесплатно» в состояние вдумчивого и экономного потребления с гибкой и прозрачной системой затрат. Рассмотрим техническую реализацию на примере Яндекса и обсудим варианты экономических моделей.

Ждём вас на HighLoad++ 2023 🖐

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥21
Зачем делать прожорливый софт. Георгий Меликов расскажет принципы reconcillation loop (привет, K8s!).

Мир не идеален — любая крупная система состоит из множества отдельных подсистем. Не все из них мы можем контролировать при работе над нашей задачей. А согласно закону Мёрфи, если что-нибудь может пойти не так, оно обязательно пойдёт не так. Применительно к созданию распределённых систем это означает, что абсолютно всё вокруг когда-нибудь сломается.

И вот в таких условиях нам нужно разрабатывать софт, который не потребует постоянного внимания со стороны своего создателя.

Георгий расскажет про практики и свой опыт создания софта с self-healing на принципах closed loop automation (что является основной причиной высокой стабильности всеми любимого K8s), сравним с привычным в индустрии event-based-подходом, и честно признаемся об увеличении накладных расходов и излишней трате денег работодателя в счёт своего спокойного сна ночью.

🙌 До скорой встречи на HighLoad++ 2023 – юбилейной, 20-й и самой масштабной из всех прошедших конференций HighLoad++.

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Слишком… много… асинхронщины… На что обращать внимание при работе с фичей из десятка сервисов, обрабатывающих 15 000 асинхронных задач в секунду? Узнаем из доклада Виктора Бурцева.

В клиент-серверной архитектуре каждый разработчик рано или поздно сталкивается с обработкой асинхронных задач. Это частая практика, но что делать, когда вы разрабатываете новую фичу, которая становится настолько прожорливой, что таких задач становится десятки тысяч в секунду.

На примере внедрения в Яндекс.Go новой технологии Live Activity от Apple поговорим про:

- сложность отладки и поиска проблем асинхронных задач;
- почему не нужно пытаться брать слишком много задач на каждую ноду;
- как быть, если асинхронность добавляется еще и на клиенте;
- почему в таких случаях не стоит пользоваться вашей основной базой данных;
- как держать ваше состояние консистентным без возможности сервисам сообщать о своем состоянии друг другу;
- зачем нужно иметь возможность конфигурировать выполнение таких задач.

🖐 Ждём вас 27 и 28 ноября на HighLoad++ 2023.

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤩2🔥1
Media is too big
VIEW IN TELEGRAM
Доклад Антона Дорфмана с HighLoad++ 2022 о том, как ломают промышленные контроллеры, которые могут устроить взрыв на электростанции или затопить маленький город. Теперь вы будете знать, о чём спросить риелтора перед покупкой дома.

#ТопДокладовHighLoad2022
1👍1
Под капотом быстрого сплитования трафика для А/B-тестирования: Дмитрий Волков расскажет про оптимизацию производительности и инфраструктурные уроки.

В эпоху быстро меняющихся потребностей пользователей, платформа A/B-тестирования становится ключевым инструментом принятия решений в любом продуктовом сервисе. С учетом того, что онлайн-кинотеатр Okko обслуживает миллионы пользователей по всей России и имеет нагрузку в несколько тысяч запросов каждую секунду, они стремятся к тому, чтобы сервис сплитования трафика для А/B экспериментов был максимально незаметным для пользователей.
Отсюда и цель: время ответа при расчете групп для А/В-экспериментов должно быть не более 10 мс. Поэтому возникает вопрос: как именно они достигают такой эффективности, и что может пойти не так?

В своём докладе Дмитрий поделится:

- что такое A/B-эксперименты, и как происходит сплитование трафика в них;
- как они искали узкие места в производительности сервиса на Python и устраняли их;
- как им удалось разогнать сервис до времени ответа в 5 мс в 99,9% запросов, но всё равно наблюдать большой процент запросов, отвалившихся по тайм-ауту;
- как они расследовали причины тайм-аутов к своему сервису и нашли проблемы там, где не ждали — в инфраструктуре. И как это обнаружение помогло другим сервисам компании;
- что бы они сказали сами себе, если бы встретились полгода назад.

Ждём вас на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Пётр Зайцев — основатель компании Percona по разработке ПО для работы с базами данных, предприниматель в области open source, инвестор, ментор и adviser. Кроме Percona, участвует в проектах Altinity, которые занимаются технологией ClickHouse; FerretDB — альтернативой MongoDB и ряде других. Мы расспросили Петра, как дойти до такого уровня экспертизы и что мешает современным IT-бизнесменам.

📍Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/774998/
👍5
Алексей Морозов расскажет про Zero-cost I/O и fault tolerance в распределенном глубоком обучении.

Узнаем, как они в Яндексе сделали zero-cost-инфраструктуру распределенного обучения поверх распределенной транзакционной файловой системы:

1. Никаких модификаций однопоточного однопроцессного кода обучения на Python — экономим время DataScientist’а. Не нужно быть бэкендером-профессионалом, чтобы писать распределенный код обучения.

2. Никакого дополнительного оверхеда по производительности под Python GIL при переходе к распределенному обучению — улучшаем утилизацию железа.

3. Автоматическое масштабирование обучений с 1 GPU на сотни видеокарт, I/O на чтение/запись в десятки GB/s — улучшаем общую емкость систем обучения.

Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1🔥1
С Дани Эль-Айясс и Александром Абрамовым кратко обсудим историю NLP: от T9 до ChatGPT.

В рамках доклада спикеры осветят историческую хронологию того, как человечество пришло к текущему состоянию NLP-индустрии (появление ChatGPT и других LLM), какие челленджи, сложности и препятствия стояли перед сообществом и что нас может ждать дальше.

Обсудим следующее:

1. Состояние NLP до появления модели трансформера в 2017 году.
2. Что такое языковые модели.
3. Появление GPT-1, BERT, и как transfer learning изменил индустрию.
4. Появление GPT-2 и zero-shot.
5. Появление GPT-3, больших языковых моделей и few-shot.
6. Появление инструктивных моделей Flan-T5, Instruct-GPT, ChatGPT.
7. Их возможности, ограничения и перспективы.

Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🖐

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1
LLMops: Ирина Николаева расскажет, что есть, кроме ChatGPT, и как вы можете развернуть это.

Из доклада Ирины вы узнаете:

1. ML-ликбез. Про используемые в дальнейшем термины простыми словами.
2. Классический MLops и его принципы.
3. Почему Large Language Models действительно такие крутые.
4. Эволюция генерации языка. Как мир пришел к LLM.
5. Многообразие LLM: основные модели и их особенности.
6. Развернуть LLM и радоваться жизни: обзор способов, лицензий и требований к железу.
7. Квантизация и файн тьюнинг — убрать нельзя использовать.
8. Векторные базы данных и LangChain.
9. LLM всегда ли нужен?
10. Заключение.

Встречаемся уже совсем скоро на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2🤩1
Prompt engineering: путь к эффективной работе с ChatGPT разберём на мастер-классе от Ильи Козырева.

Мы начнем с основных принципов работы языковых моделей и детально разберем роль промптов во взаимодействии с ChatGPT. Особое внимание уделим мастерству формулировки промптов, которое является ключевым для извлечения максимальной пользы из возможностей искусственного интеллекта.

На мастер-классе рассмотрим как аспекты применения ИИ в разработке и тестировании, так и методы работы с ChatGPT для проектирования архитектуры. Разберем конкретную архитектурную задачу, вместе спроектируем архитектуру решения, используя ChatGPT в качестве copilot ассистента архитектора.

Участники мастер-класса смогут на практике улучшить свои промпты и получить ценный навык для работы с современными языковыми моделями.

Ждём вас 27 и 28 ноября на HighLoad++ 2023 🙌

Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️Друзья, на HighLoad++ 2023 все офлайн-билеты проданы! Но у вас еще есть возможность присоединиться к нам онлайн.

Для онлайн-участников будут доступны:

- Все презентации спикеров
- Видеозаписи всех докладов
- Трансляция всех докладов. Митапы и воркшопы не транслируются️
- Вопросы к спикерам в telegram-чате
- Доступ к трансляции для одного пользователя

Купить онлайн-билет

Ждем вас в эфире 27 и 28 ноября 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
🔥Открытая трансляция Главного зала HighLoad++ 2023!

Самая крутая новость ноября: 27 и 28 ноября пройдет открытая трансляция Главного зала HighLoad++ 2023. Это стало возможным благодаря поддержке нашего генерального партнёра, компании Яндекс.

Просто зарегистрируйтесь и смотрите

В программе доклады лучших спикеров:

Павел Капля (Яндекс) - Алиса 6 лет спустя.

Александр Кирсанов (VK, ВКонтакте) - Математический хайлоад: большие, очень большие и немыслимо большие числа.

Евгений Россинский (ИВИ) - Как из Python и палок собрать детектор аномалий для highload.

Вы сможете не только посмотреть интересные доклады ТОПовых разработчиков, но и задать им вопросы.

Регистрируйтесь и присоединяйтесь к просмотру 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥91
Как выглядит борьба со спамерами в Антифроде билайн глазами Data Scientist? Узнаем из доклада Наталии Багровой.

Команда Антиспам (подразделение Антифрод) занимается созданием услуги по защите абонентов от нежелательных (навязчивых, рекламных) спам-вызовов, а также повышением информированности абонентов о таких звонках.

Услуга работает на уровне сети, не задействуя устройство абонента, и блокирует подозрительные звонки, перенаправляя их на голосового ассистента, а абонент получает SMS или push-уведомление о характере звонка.

Наталия начнет доклад с краткого обзора рынка антиспам-услуг и существующих решений, сравнит их с целевым дизайном, к которому они пришли в билайн. Обрисует текущую ситуацию на цифрах в терминах количества звонков, приходящихся на их базу, и их распределении внутри дня, активных номеров и их лайф-тайма, особенности трафика спам-номеров.

Перед тем, как мы сконцентрируемся на сердце услуги — алгоритмах машинного обучения, отвечающих за обнаружение токсичного трафика, мы рассмотрим доступные им способы получения таргета и их ограничения, а также технические (подмена номеров, задержка данных) и логические (использование одного номера под разные цели) сложности определения спама.

Затем проведем обзор комплекса существующих моделей и офлайн- и онлайн-метрик, которые они отслеживают. Наталия пояснит, почему была выбрана именно такая конфигурация и какие альтернативы были отброшены — и почему.

Далее расскажет про то, как устроено А/В-тестирование у них в команде, и поделится краткими результатами первых пилотов.

И в завершение мы пройдемся по ближайшими планам, которые им предстоят для поддержания качества алгоритмов с учетом изменения поведения спамерами (появление номеров-однодневок, перевод трафика в WhatsApp, маскировка под положительный трафик).


Ждём вас 27 и 28 ноября на HighLoad++ 2023 🖐️

Программа конференции и онлайн-билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Сергей Жемжицкий расскажет про Data Sketches — как съесть слона целиком (даже если он бесконечный).

При обработке и анализе данных часто возникают задачи, которые сложно масштабировать из-за огромного количества требуемых вычислительных ресурсов или значительного количества времени для получения точных результатов. Примеры таких задач — подсчет уникальных элементов, подсчет распределения элементов, определение частоты тех или иных элементов и т. д.

Если приблизительные результаты при решении подобных задач допустимы, то существует класс алгоритмов, называемых потоковыми или скетчами, которые позволяют получить результат (в заданных пределах погрешности) на несколько порядков быстрее. В случае пакетной обработки данных, жизнеспособных альтернатив часто может и не быть, а в случае потоковой обработки данных скетчи — единственное известное жизнеспособное решение.

Дата-скетчи (HyperLogLog, CPC, Theta, Count-min, Fdt, KLL и др.) могут стать отличным инструментом для всех, кому необходимо извлекать полезную информацию из больших объемов данных на ежедневной основе, используя приемлемое количество времени и ресурсов.

Ждём вас 27 и 28 ноября на HighLoad++ 2023 🙌

Программа конференции и онлайн-билеты на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1