Media is too big
VIEW IN TELEGRAM
Яндекс выложил в open source свое файловое хранилище для map reduce. На его примере Павел Сушин рассказал, как сделать действительно огромную сетевую файловую систему и почему эта разработка радикально отличается от уже существующих решений вроде HDFS и CEPH.
🔥10⚡2👍2
Часто типовые задачи на деле оказываются сложными. Даже с крутыми инструментами, которые вроде как можно использовать из коробки всё совсем не просто. Давайте посмотрим как сделан поиск в интернет-магазине сервиса
⠀
📍Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/767066/
⠀
📍Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/767066/
❤1
⠀
Друзья, напоминаем, что 15 октября (сегодня) у вас еще есть возможность выбрать самых достойных номинантов Премии HighLoad++.
Каждый ваш голос - это благодарность IT-лидерам и их решениям за вклад в развитие экосистемы интернет-разработки в России.
⠀
В этом году компания VK поддержала специальную номинацию «Развивающие проекты», посвященную людям и проектам, которые создают условия для развития: профессиональных разработчиков, новичков в IT и экспертных сообществ, специалистов в молодых цифровых профессиях или одарённых школьников.
Чтобы проголосовать вам необходимо авторизоваться в системе и выбрать трех достойных номинантов.
Вы можете распределить свои голоса между основным голосованием и спец.номинацией.
Имена победителей мы узнаем 27 ноября на церемонии награждения!
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
Доклад Дмитрия Кырхларова – это экспертный рассказ про организацию инфраструктуры для средних компаний, которая базируется на 10+ летнем опыте объединения нескольких десятков небольших компаний.
⠀
Из доклада Дмитрия узнаем вот о чем:
⠀
- Путь от техдолга в 20 лет до построения катастрофо-устойчивого решения в IT-компании среднего размера.
Не пытайтесь повторить. Все трюки выполнены профессионалами, которые не знали во что ввязываются.
- Попурри из подходов и решений, которые позволяют не бояться отказа целого дата-центра.
- Организация мониторинга и алертинга, особенности построения гео-распределенных кластеров БД, воспроизводимость серверов, сегментация production контура и прочая.
- Формула баланса надежности, скорости разработки и стоимости владения, которая нам подошла на этапе перестройки.
⠀
Ждем вас 27 и 28 ноября на профессиональной конференции для разработчиков высоконагруженных систем HighLoad++ 2023 в Москве 🖐
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Из доклада Дмитрия узнаем вот о чем:
⠀
- Путь от техдолга в 20 лет до построения катастрофо-устойчивого решения в IT-компании среднего размера.
Не пытайтесь повторить. Все трюки выполнены профессионалами, которые не знали во что ввязываются.
- Попурри из подходов и решений, которые позволяют не бояться отказа целого дата-центра.
- Организация мониторинга и алертинга, особенности построения гео-распределенных кластеров БД, воспроизводимость серверов, сегментация production контура и прочая.
- Формула баланса надежности, скорости разработки и стоимости владения, которая нам подошла на этапе перестройки.
⠀
Ждем вас 27 и 28 ноября на профессиональной конференции для разработчиков высоконагруженных систем HighLoad++ 2023 в Москве 🖐
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2⚡1❤1
С Александром Калошиным и Константином Пастор-Гертье обсудим бойлерплейт как инструмент стандартизации Go проектов.
⠀
Процесс написания микросервисного приложения неразрывно связан с большим количеством связей и однотипных переиспользуемых пакетов. Всегда не хочется в таких случая писать один и тот же код, когда он может быть сгенерирован.
⠀
Однако в нашей отрасли не так-то много генераторов микросервисов, а те, что есть заставляют вендор-лочиться.
⠀
Александр с Константином расскажут, почему, а главное, как они сделали ещё один генератор микросервисов. Поделятся почему это оказалось не так тривиально и с какими сложностями они столкнулись, и как спустя некоторое время они осознали дзен. Под капотом расскажут, как использовали protobuf, uberfx, писали хуки. Поделятся, как рефлектили всё что можно и стандартизировали работу с логами, конфигами и процесс сборки и деплоя.
⠀
Встречаемся на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023 🙌
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Процесс написания микросервисного приложения неразрывно связан с большим количеством связей и однотипных переиспользуемых пакетов. Всегда не хочется в таких случая писать один и тот же код, когда он может быть сгенерирован.
⠀
Однако в нашей отрасли не так-то много генераторов микросервисов, а те, что есть заставляют вендор-лочиться.
⠀
Александр с Константином расскажут, почему, а главное, как они сделали ещё один генератор микросервисов. Поделятся почему это оказалось не так тривиально и с какими сложностями они столкнулись, и как спустя некоторое время они осознали дзен. Под капотом расскажут, как использовали protobuf, uberfx, писали хуки. Поделятся, как рефлектили всё что можно и стандартизировали работу с логами, конфигами и процесс сборки и деплоя.
⠀
Встречаемся на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023 🙌
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
Реализовать OLAP: Софья Новожилова расскажет, как они делали колоночное хранение в YDB.
⠀
YDB — это платформа, которая умеет обрабатывать большой поток быстрых транзакций (OLTP, Online Transaction Processing).
⠀
Помимо этого, она даёт всю необходимую инфраструктуру для базы данных:
⠀
- репликации
- отказоустойчивый сторадж
- автошардирование
- query processing
- grpс-клиенты
- систему доставки данных и проч.
⠀
Имея такой стартовый набор, Софья с командой захотели научить YDB обрабатывать другой тип запросов — аналитические (OLAP, Online Analytical Processing).
⠀
Казалось бы, давайте поменяем систему хранения, упакуем данные по колонкам и получим профит. Но достаточно ли этого?
⠀
Ответ на данный вопрос, а также на вопросы: зачем это было нужно и какая польза от таких расширений системе в целом — будет в докладе.
⠀
Ждем вас 27 и 28 ноября в Москве на HighLoad++ 2023 🙌
⠀
✅ Ознакомиться с программой конференции и купить билет можно на сайте в описании канала @HighLoadChannel
⠀
YDB — это платформа, которая умеет обрабатывать большой поток быстрых транзакций (OLTP, Online Transaction Processing).
⠀
Помимо этого, она даёт всю необходимую инфраструктуру для базы данных:
⠀
- репликации
- отказоустойчивый сторадж
- автошардирование
- query processing
- grpс-клиенты
- систему доставки данных и проч.
⠀
Имея такой стартовый набор, Софья с командой захотели научить YDB обрабатывать другой тип запросов — аналитические (OLAP, Online Analytical Processing).
⠀
Казалось бы, давайте поменяем систему хранения, упакуем данные по колонкам и получим профит. Но достаточно ли этого?
⠀
Ответ на данный вопрос, а также на вопросы: зачем это было нужно и какая польза от таких расширений системе в целом — будет в докладе.
⠀
Ждем вас 27 и 28 ноября в Москве на HighLoad++ 2023 🙌
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
Из доклада Сергея Прилуцкого узнаем про zkSNARKs - компактные неинтерактивные пруфы для масштабирования и безопасности.
⠀
Доклад описывает технологию zkSNARKs, используемую для масштабирования сервисов и в различных zero-knowledge протоколах. Эта молодая технология сейчас находится на острие развития современной криптографии, ей занимаются в топовых университетах мира, а решения на ее основе позволяют доказывать исполнение вычислений на trustless клиентах с легкой, constant-sized верификацией на стороне сервера.
⠀
Она идеально ложится на блокчейн технологии, где легкая верификация располагается на сильно ограниченной в ресурсах блокчейн-стороне, но и для других архитектур открывает множество новых возможностей. Например, сверхлегкие доказательства наличия пользователя в некотором списке, аутентификация без обращения к базе пользователей, доказательства нахождения некоторого значения в storage и т.п.
⠀
Сергей расскажет про основную концепцию арифметических circuits, покажет практические примеры простых доказательств, опишет дизайн некоторых протоколов и ограничения подобных решений. Сама технология уже несколько лет успешно используется в production, где отвечает за реальные деньги пользователей, используется для масштабирования и защиты финансовых активов, активно развивается в проектах, не имеющих аналогов в традиционном поле.
⠀
Ждем вас 27 и 28 ноября в Москве на HighLoad++ 2023 🙌
⠀
✅ Ознакомиться с программой конференции и купить билет можно на сайте в описании канала @HighLoadChannel
⠀
Доклад описывает технологию zkSNARKs, используемую для масштабирования сервисов и в различных zero-knowledge протоколах. Эта молодая технология сейчас находится на острие развития современной криптографии, ей занимаются в топовых университетах мира, а решения на ее основе позволяют доказывать исполнение вычислений на trustless клиентах с легкой, constant-sized верификацией на стороне сервера.
⠀
Она идеально ложится на блокчейн технологии, где легкая верификация располагается на сильно ограниченной в ресурсах блокчейн-стороне, но и для других архитектур открывает множество новых возможностей. Например, сверхлегкие доказательства наличия пользователя в некотором списке, аутентификация без обращения к базе пользователей, доказательства нахождения некоторого значения в storage и т.п.
⠀
Сергей расскажет про основную концепцию арифметических circuits, покажет практические примеры простых доказательств, опишет дизайн некоторых протоколов и ограничения подобных решений. Сама технология уже несколько лет успешно используется в production, где отвечает за реальные деньги пользователей, используется для масштабирования и защиты финансовых активов, активно развивается в проектах, не имеющих аналогов в традиционном поле.
⠀
Ждем вас 27 и 28 ноября в Москве на HighLoad++ 2023 🙌
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Real-time распознавание лиц: методы обучения быстрых и точных моделей для работы на мобильных девайсах узнаем из доклада Вадима Селютина.
⠀
Наиболее точные решения по распознаванию лиц строятся на основе больших моделей глубокого обучения. Для успешного продуктового внедрения на мобильные платформы в условиях ограниченных вычислительных ресурсов эти модели должны быть не только точными, но также быстрыми и легковесными.
⠀
В этом докладе разберем следующее:
⠀
- как выбрать современную компактную архитектуру с наилучшим балансом скорости и качества
- какие трудности могут возникнуть при распределенном обучении face recognition модели на датасетах с миллионами изображений и сотнями тысяч классов
- при помощи каких методов передачи знаний от больших моделей к более маленьким можно минимизировать потери в точности из-за сокращения размера архитектуры
⠀
Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🖐
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Наиболее точные решения по распознаванию лиц строятся на основе больших моделей глубокого обучения. Для успешного продуктового внедрения на мобильные платформы в условиях ограниченных вычислительных ресурсов эти модели должны быть не только точными, но также быстрыми и легковесными.
⠀
В этом докладе разберем следующее:
⠀
- как выбрать современную компактную архитектуру с наилучшим балансом скорости и качества
- какие трудности могут возникнуть при распределенном обучении face recognition модели на датасетах с миллионами изображений и сотнями тысяч классов
- при помощи каких методов передачи знаний от больших моделей к более маленьким можно минимизировать потери в точности из-за сокращения размера архитектуры
⠀
Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🖐
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
Об эволюции архитектуры транскодера узнаем из доклада Дмитрия Лукшто.
⠀
Дмитрий расскажет:
⠀
- как они перекодируют видео пользователей в самые популярные разрешения, считают видео сигнатуры, генерируют субтитры
- как учились приоритизировать живых пользователей и batch задачи
- как жить, если у вас тысячи воркеров, кластер на десятки тысяч ядер, который нужно использовать эффективно
- как они обрабатывают в среднем сотни тысяч видео в сутки, длительностью в тысячи часов
- как значительно улучшили утилизацию железа и скорость транскодирования, изменив архитектуру
- как обработать задачу за гарантированное время, если ваш кластер полностью загружен, и вы не умеете предсказывать eta для задач
⠀
Ждем вас на HighLoad++ 2023 🖐
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Дмитрий расскажет:
⠀
- как они перекодируют видео пользователей в самые популярные разрешения, считают видео сигнатуры, генерируют субтитры
- как учились приоритизировать живых пользователей и batch задачи
- как жить, если у вас тысячи воркеров, кластер на десятки тысяч ядер, который нужно использовать эффективно
- как они обрабатывают в среднем сотни тысяч видео в сутки, длительностью в тысячи часов
- как значительно улучшили утилизацию железа и скорость транскодирования, изменив архитектуру
- как обработать задачу за гарантированное время, если ваш кластер полностью загружен, и вы не умеете предсказывать eta для задач
⠀
Ждем вас на HighLoad++ 2023 🖐
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Apache Spark — популярный стандарт ETL/ELT-процессов. На нём пишут бизнес-задачи и обработки машинных моделей. Запросы происходят в оперативной памяти. Спортивный программист Алексей Шишкин расскажет как в рамках YTsaurus сделать Apache Spark ещё эффективней.
⠀
📍Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/768284/
⠀
📍Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/768284/
ETL на Kafka + Confluent, проблемы и их решение с помощью Go обсудим на докладе Никиты Степанченко и Юры Саргсяна.
Возникла необходимость улучшения системы хранения данных о товарах. Они решили построить систему на базе Kafka, Confluent и kSQL для обработки огромного объема быстро меняющихся данных о товарах при ~9к сообщений в секунду в пиках при штатной работе и ~50к в секунду при нештатной работе.
⠀
Никита с Юрой расскажут о следующем:
⠀
- Причины, по которым они решили написать свою ETL систему и выбрали эти технологии.
- Как построить решение на основе Kafka, Confluent и kSQL для обработки большого объема меняющихся данных и создать микросерверную архитектуру на Go с помощью небольшой команды.
- Проблемы, с которыми они столкнулись при разработке и использовании данной системы.
- Как они решили эти проблемы, переписав часть системы (Sink-коннекторы) на Go.
⠀
🖐 Встречаемся на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023.
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
Возникла необходимость улучшения системы хранения данных о товарах. Они решили построить систему на базе Kafka, Confluent и kSQL для обработки огромного объема быстро меняющихся данных о товарах при ~9к сообщений в секунду в пиках при штатной работе и ~50к в секунду при нештатной работе.
⠀
Никита с Юрой расскажут о следующем:
⠀
- Причины, по которым они решили написать свою ETL систему и выбрали эти технологии.
- Как построить решение на основе Kafka, Confluent и kSQL для обработки большого объема меняющихся данных и создать микросерверную архитектуру на Go с помощью небольшой команды.
- Проблемы, с которыми они столкнулись при разработке и использовании данной системы.
- Как они решили эти проблемы, переписав часть системы (Sink-коннекторы) на Go.
⠀
🖐 Встречаемся на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023.
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Media is too big
VIEW IN TELEGRAM
YTsaurus — это будущее DWH, наш новый герой, который подвинет Hadoop. Филипп Козьмин рассказал об этом в своем докладе на Saint HighLoad++ 2023 🖐
👍2😁1
MaaS - Мониторинг как сервис обсудим с Валентином Лебедевым и Анной Журбенко.
⠀
Из доклада узнаем:
⠀
- Как использовать мониторинг на пользу, не подглядывая в монитор соседа
- Как узнавать о проблемах с сервисами до первого обращения клиента
- Как не «утонуть» в постоянно дребезжащих алертах
- Как мониторинг улучшает отношения между бизнесом и ИТ
⠀
🖐 Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023.
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Из доклада узнаем:
⠀
- Как использовать мониторинг на пользу, не подглядывая в монитор соседа
- Как узнавать о проблемах с сервисами до первого обращения клиента
- Как не «утонуть» в постоянно дребезжащих алертах
- Как мониторинг улучшает отношения между бизнесом и ИТ
⠀
🖐 Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023.
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2
Доклад Кирилла Борисова - это методологический доклад про то, как важно организовать мониторинг упрощающий нахождение проблем и не перегруженный лишней информацией.
⠀
Одним из антипаттернов наблюдаемости является Wall of Dashboard. Во многих компаниях существует огромное количество дашбордов, они создают 2 основные проблемы: информационную перегрузку и потерю фокуса. Также больше количество дашбордов добавляет сложность восприятия и затруднение выявления важных трендов. Ответьте себе на вопрос: Можно ли, посмотрев на дашборды, понять работает ли система? Если ответ нет, то вы выбрали нужный доклад.
⠀
В докладе проведем аналогии с разным сферами, в которых тоже используется статус панели для определения «живости» сервиса, рассмотрим один из вариантов правильной организации дашбордов. Рассмотрим стратегию упрощения дашбордов Разберем, как четко определенные метрики могут помочь в создании более понятных и эффективных дашбордов.
⠀
Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🖐
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
Одним из антипаттернов наблюдаемости является Wall of Dashboard. Во многих компаниях существует огромное количество дашбордов, они создают 2 основные проблемы: информационную перегрузку и потерю фокуса. Также больше количество дашбордов добавляет сложность восприятия и затруднение выявления важных трендов. Ответьте себе на вопрос: Можно ли, посмотрев на дашборды, понять работает ли система? Если ответ нет, то вы выбрали нужный доклад.
⠀
В докладе проведем аналогии с разным сферами, в которых тоже используется статус панели для определения «живости» сервиса, рассмотрим один из вариантов правильной организации дашбордов. Рассмотрим стратегию упрощения дашбордов Разберем, как четко определенные метрики могут помочь в создании более понятных и эффективных дашбордов.
⠀
Встречаемся 27 и 28 ноября в Москве на HighLoad++ 2023 🖐
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2🔥2
Domain Driven Design в Go – Илья Сергунин в своем докладе расскажет, что это не больно (почти).
⠀
DDD – подход, состоящий из множества элементов, и, если смотреть на этот клубок сверху, можно ужаснуться и отложить все его преимущества в долгий ящик.
⠀
С другой стороны, мы можем идти привычной дорогой к клубку легаси, с которым сложно работать. Данную дилемму можно свести к двум стульям и решить ее элегантно, идя постепенно, а не «Разбежавшись, прыгать со скалы».
⠀
Взяв CRUD, с которого чаще всего начинают множество проектов, мы постепенно соберём бизнес-правила и преобразуем кусочек за кусочком в доменную модель, применяя тактические паттерны DDD (Factory, Value Object, Entity, Aggregate, Repository), учитывая все их особенности в Go.
⠀
Дополнительно Илья познакомит нас с опенсорсными инструментами, которые нам помогают дружить: Go Way и DDD. Они:
⠀
- Позволяют не плодить getter и setter через сохранение публичных свойств у структур, но с запретом их редактировать вне домена.
- Следят за тем, чтобы слои инфраструктуры и приложения не врастали в домен.
- Отделяют представления (БД, API и т.д.) от домена.
⠀
Ждем вас на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023 🖐
⠀
✅ Программа конференции и билеты на сайте в описании канала @HighLoadChannel
⠀
DDD – подход, состоящий из множества элементов, и, если смотреть на этот клубок сверху, можно ужаснуться и отложить все его преимущества в долгий ящик.
⠀
С другой стороны, мы можем идти привычной дорогой к клубку легаси, с которым сложно работать. Данную дилемму можно свести к двум стульям и решить ее элегантно, идя постепенно, а не «Разбежавшись, прыгать со скалы».
⠀
Взяв CRUD, с которого чаще всего начинают множество проектов, мы постепенно соберём бизнес-правила и преобразуем кусочек за кусочком в доменную модель, применяя тактические паттерны DDD (Factory, Value Object, Entity, Aggregate, Repository), учитывая все их особенности в Go.
⠀
Дополнительно Илья познакомит нас с опенсорсными инструментами, которые нам помогают дружить: Go Way и DDD. Они:
⠀
- Позволяют не плодить getter и setter через сохранение публичных свойств у структур, но с запретом их редактировать вне домена.
- Следят за тем, чтобы слои инфраструктуры и приложения не врастали в домен.
- Отделяют представления (БД, API и т.д.) от домена.
⠀
Ждем вас на HighLoad++ 2023, в рамках которой пройдет Golang Conf 2023 🖐
⠀
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
⠀
Друзья, с 1 ноября стоимость билетов на HighLoad++ 2023 вырастет и станет максимальной. Но если забронировать билет до 31 октября, то текущая стоимость зафиксируется и у вас еще будет несколько дней для оплаты.
⠀
На HighLoad++ 2023 вас ждет:
⠀
- супер насыщенная программа из 150+ докладов на самые актуальные темы, связанные с большими и высоконагруженными IT-системами
- самая высокая концентрация IT-профессионалов страны
- классное времяпрепровождение в крутой тусовке единомышленников
Ждем вас 27 и 28 ноября в Москве на HighLoad++ 2023 🙌
⠀
✅ Ознакомиться с программой конференции и забронировать билет можно на сайте в описании канала @HighLoadChannel
Please open Telegram to view this post
VIEW IN TELEGRAM