🖐️ В 14:00 приходите в зал «Сан-Паулу» на круглый стол «Хаос-инжиниринг: от стратегии к практике — как повысить устойчивость систем через экспериментальные подходы»
Будет обсуждаться, как хаос-инжиниринг помогает выявлять и устранять слабые места систем, интегрируется с процессами управления инцидентами и повышает зрелость SRE-практик.
Эксперты поделятся своим опытом внедрения подхода в крупных компаниях, рассмотрят роль собственных платформ хаос-тестирования и способы их интеграции в CI/CD, а также обсудят ключевые вызовы: обучение команд, автоматизацию, создание сценариев и оценка эффекта от внедрения.
Вы сможете активно участвовать в дискуссии, будет выделено время внутри обсуждения спикеров также на мнение из зала.
Эксперты-участники круглого стола:
🔴 Евгений Харченко — Senior Community Lead DevOps-сообщества в Райффайзен Банке,
🔴 Кирилл Пономарев — руководитель направления по развитию платформ разработки Chaos Platform в Райффайзен Банке,
🔴 Сергей Реусин — независимый эксперт, SRE Lead,
🔴 Андрей Матвеев — старший разработчик в команде надежности Такси,
🔴 Дмитрий Баскаков — отвечает за развитие инфраструктурных сервисов и платформенных решений (IDP) как продуктов в mindbox.
Будет обсуждаться, как хаос-инжиниринг помогает выявлять и устранять слабые места систем, интегрируется с процессами управления инцидентами и повышает зрелость SRE-практик.
Эксперты поделятся своим опытом внедрения подхода в крупных компаниях, рассмотрят роль собственных платформ хаос-тестирования и способы их интеграции в CI/CD, а также обсудят ключевые вызовы: обучение команд, автоматизацию, создание сценариев и оценка эффекта от внедрения.
Вы сможете активно участвовать в дискуссии, будет выделено время внутри обсуждения спикеров также на мнение из зала.
Эксперты-участники круглого стола:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
🖐️ Доклады, мастер-класс и воркшоп, которые стартуют в 14:40
🔴 Зал «Конгресс-холл». Интерпретация данных мониторинга на базе TSDB: ключевые ошибки и решения на примере Prometheus. Владимир Гурьянов (Флант)
Технически насыщенный доклад про сложности восприятия метрик из-за особенностей их хранения и отображения на примере Прометеуса. Полезно для людей, желающих хорошо понимать про то, что говорят им метрики.
🔴 Зал «Кейптаун». DRP для высоконагруженных динамических финтех-систем. Михаил Соловьев (Т-Банк)
Михаил поделится вариантом работы с Disaster Recovery Plan, который поможет поддерживать его в актуальном состоянии, несмотря на часто изменяемые внешние условия.
🔴 Зал «Рио-де-Жанейро». Как построить рабочее место для обучения, чтобы всё работало? Лев Николаев (Техническая академия Росатома)
Лев расскажет о том, как виртуальные машины, контейнеры могут быть применимы в образовании. С их помощью можно организовать удаленную работу слушателя и преподавателя и обеспечить слушателю готовое преднастроенное рабочее место, доступное сразу из браузера на отечественном дистрибутиве Astra Linux.
🔴 Зал «Сингапур». Как управлять горизонтальным масштабированием в больших проектах с помощью собственного on-premise-автоскейлера. Илья Семёнов (Сбер), Алексей Игнатов (Приглашенный эксперт)
Подключить autoscaling — это только вершина айсберга, особенно если вы работаете на своем железе. Данный рассказ — квинтэссенция опыта внедрения автоматического изменения ресурсов на больших объемах запросов в среде с высокой конкурентностью на ресурсы.
🔴 Зал «Уфа». Мастер-класс «Argo CD: Push me, Pull me, Deploy me! — Developer’s satisfaction!». Егор Салиев, Николай Пушкарёв (Hilbert Team)
Многие компании реализуют подход GitOps как часть Developers Platform. Этот воркшоп позволит понять, с чего начать дорогу к платформе в разрезе ArgoCD и его компонентов. Как правильно собрать пайплайны и написать необходимый код для Argo Apps и Argo Rollouts.
Участникам рекомендуется прийти со своим ноутбуком.
🔴 Зал «Дели+Калькутта». Непрерывность как вид искусства. И почему доступности в 3,5 девятки вам достаточно. Глеб Тильтиков (МТС Диджитал)
Глеб расскажет о реальном применении SRE-практик, на личном примере рассмотрит оправданное добавление ещё одной девятки и когда от заботы о «pets» нужно переходить к «cattle».
🔴 Зал «Пекин». Декларативное партиционирование PostgreSQL. Денис Пантилеенко (МАКСИМ Технология)
Технически нагруженный сложный доклад про то, как жить с большими таблицами и высокими нагрузками. Денис расскажет про проблемы, с которыми сталкиваются инженеры при росте баз данных, и про то, как их решать.
🔴 Зал «Шанхай». Воркшоп «Как ускорить адаптацию и усилить команду с помощью правильного онбординга». Екатерина Лысенко (Независимый эксперт)
В интерактивном формате обсудим, как сделать так, чтобы новые сотрудники проще вливались в команду и быстрее начинали перформить.
Технически насыщенный доклад про сложности восприятия метрик из-за особенностей их хранения и отображения на примере Прометеуса. Полезно для людей, желающих хорошо понимать про то, что говорят им метрики.
Михаил поделится вариантом работы с Disaster Recovery Plan, который поможет поддерживать его в актуальном состоянии, несмотря на часто изменяемые внешние условия.
Лев расскажет о том, как виртуальные машины, контейнеры могут быть применимы в образовании. С их помощью можно организовать удаленную работу слушателя и преподавателя и обеспечить слушателю готовое преднастроенное рабочее место, доступное сразу из браузера на отечественном дистрибутиве Astra Linux.
Подключить autoscaling — это только вершина айсберга, особенно если вы работаете на своем железе. Данный рассказ — квинтэссенция опыта внедрения автоматического изменения ресурсов на больших объемах запросов в среде с высокой конкурентностью на ресурсы.
Многие компании реализуют подход GitOps как часть Developers Platform. Этот воркшоп позволит понять, с чего начать дорогу к платформе в разрезе ArgoCD и его компонентов. Как правильно собрать пайплайны и написать необходимый код для Argo Apps и Argo Rollouts.
Участникам рекомендуется прийти со своим ноутбуком.
Глеб расскажет о реальном применении SRE-практик, на личном примере рассмотрит оправданное добавление ещё одной девятки и когда от заботы о «pets» нужно переходить к «cattle».
Технически нагруженный сложный доклад про то, как жить с большими таблицами и высокими нагрузками. Денис расскажет про проблемы, с которыми сталкиваются инженеры при росте баз данных, и про то, как их решать.
В интерактивном формате обсудим, как сделать так, чтобы новые сотрудники проще вливались в команду и быстрее начинали перформить.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Друзья, в 15:50 приходите на следующие доклады, круглый стол и мастер-класс:
🔴 Зал «Конгресс-холл». Как построить IТ-платформу с нуля — опыт Туту. Максим Скоморохов (tutu.ru)
Первое выступление про опыт создания и развития внутренней платформы в Туту. Спикер расскажет про построение современной платформы с использованием подходов Cloud-Native и Infrastructure as Definition, раскроет архитектуру и предоставляемые сервисы, покажет сценарии и затронет метрики.
🔴 Зал «Кейптаун». Свое или чужое: почему и как мы делаем нашу хаос-платформу. Кирилл Пономарев (Райффайзен Банк)
В 2024 году была создана собственная платформа для хаос-тестирования, чтобы устранить ограничения существующих инструментов. В докладе эксперт расскажет, почему был выбран этот путь, как на это отреагировали команды, каких результатов удалось достичь и какие есть планы по развитию платформы.
🔴 Зал «Рио-де-Жанейро». Как девопсы контейнеризацию с виртуализацией дружили. Олег Сапрыкин (Флант)
Если вы еще не решили, что выбрать — контейнеризацию или виртуализацию, то доклад все расставит на свои места.
🔴 Зал «Сан-Паулу». Круглый стол «DevOps-ИИнженер». Александр Качмашев (Точка), Александр Козлов (СберТех), София Филиппова (Raft), Анна Лучник (Независимый консультант)
Обсудим наболевшие и животрепещущие вопросы относительно использования ИИ в работе DevOps: правда можно? точно безопасно? хотя бы помогает? нас всех заменят роботы?
Эксперты:
Александр Качмашев (Точка) — делает инфраструктуру удобной для разработчиков. Катает кубы,
Александр Козлов (СберТех) — уже несколько лет занимается разработкой интеграционной платформы в Сбере,
София Филиппова (Raft) — Backend SDE и специалист в области ML с опытом управления разработкой. Работает в R&D, дружит с большими и маленькими языковыми моделями, проектирует backend на Python и Node.js,
Анна Лучник — архитектор-исследователь. Изучает, как принимать решения, которые решают первоначальную проблему и не создают новых.
Участники смогут активно участвовать в дискуссии — будет выделено время на мнение из зала.
🔴 Зал «Сингапур». Мастер-класс «Нетворкать: когда, с кем, зачем и как?!». Алексей Обровец (Независимый эксперт, Obrovets.ru)
Алексей расскажет про нетворкинг. В чём его отличие от обычного разговора и про то, как его, собсно, разговаривать. Очень рекомендуем сходить, а на афтепати попрактиковать услышанное.
🔴 Зал «Дели+Калькутта». Укрощение хаоса логов с помощью модели OpenTelemetry, Vector и ClickHouse. Итоги за два года. Дмитрий Синявский (Ви.Tech)
Vector, Kafka, ClickHouse — уже вполне обкатанный стек, но каким образом уже внутри этого стека провести оптимизацию, с какими проблемами при этом можно столкнуться и как их решить.
🔴 Зал «Пекин». Трейсинг в hh ru. Как мы выросли от 1 тысячи до 1 миллиона событий в секунду без семплирования. Александр Казанцев (hh.ru)
Этот доклад будет полезен инженерам, которые находятся в процессе построения/перестроения своей собственной системы трейсинга. Рассматриваются несколько вариантов архитектуры системы, жизненные циклы и процессы поиска новой архитектуры под возросшие нагрузки.
Первое выступление про опыт создания и развития внутренней платформы в Туту. Спикер расскажет про построение современной платформы с использованием подходов Cloud-Native и Infrastructure as Definition, раскроет архитектуру и предоставляемые сервисы, покажет сценарии и затронет метрики.
В 2024 году была создана собственная платформа для хаос-тестирования, чтобы устранить ограничения существующих инструментов. В докладе эксперт расскажет, почему был выбран этот путь, как на это отреагировали команды, каких результатов удалось достичь и какие есть планы по развитию платформы.
Если вы еще не решили, что выбрать — контейнеризацию или виртуализацию, то доклад все расставит на свои места.
Обсудим наболевшие и животрепещущие вопросы относительно использования ИИ в работе DevOps: правда можно? точно безопасно? хотя бы помогает? нас всех заменят роботы?
Эксперты:
Александр Качмашев (Точка) — делает инфраструктуру удобной для разработчиков. Катает кубы,
Александр Козлов (СберТех) — уже несколько лет занимается разработкой интеграционной платформы в Сбере,
София Филиппова (Raft) — Backend SDE и специалист в области ML с опытом управления разработкой. Работает в R&D, дружит с большими и маленькими языковыми моделями, проектирует backend на Python и Node.js,
Анна Лучник — архитектор-исследователь. Изучает, как принимать решения, которые решают первоначальную проблему и не создают новых.
Участники смогут активно участвовать в дискуссии — будет выделено время на мнение из зала.
Алексей расскажет про нетворкинг. В чём его отличие от обычного разговора и про то, как его, собсно, разговаривать. Очень рекомендуем сходить, а на афтепати попрактиковать услышанное.
Vector, Kafka, ClickHouse — уже вполне обкатанный стек, но каким образом уже внутри этого стека провести оптимизацию, с какими проблемами при этом можно столкнуться и как их решить.
Этот доклад будет полезен инженерам, которые находятся в процессе построения/перестроения своей собственной системы трейсинга. Рассматриваются несколько вариантов архитектуры системы, жизненные циклы и процессы поиска новой архитектуры под возросшие нагрузки.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2
🖐️ В 17:00 стартуют заключительные доклады первого дня DevOpsConf 2025:
🔴 Зал «Конгресс-холл». Состояние инжиниринга на 2025 год. Игорь Курочкин (Enabling.team)
Platform Engineering, Reliability Engineering, Observability Engineering... Почему что-то стали называть отдельным инжинирингом и что внутри них интересного происходит, расскажет Игорь на своём обзорном докладе.
🔴 Зал «Кейптаун». Катастрофоустойчивость для ВКС. Как мы реализовывали георезервирование для «стартапа». Никита Турцаков, Александр Кузьмин (К2Тех)
Из первых уст — о сложностях и их преодолении при сопровождении продукта российской ВКС. Рост нагрузки, проблемы инфраструктуры. Через тернии к стабильному и геораспределенному решению.
🔴 Зал «Рио-де-Жанейро». Docker Swarm жив! Евгений Коваленко (РТЛабс)
Kubernetes для маленького проекта выглядит слишком дорогим? Евгений расскажет о том, как можно в production жить на Docker Swarm, с каким проблемами можно столкнуться и как восстанавливать.
🔴 Зал «Уфа». Как мы автоматизировали и ускорили выкатки релизов API Почты в 20 раз. Павел Лиморенко (VK, Mail)
Подход, который может повторить почти каждый. Павел подробно расскажет о том, как ускориться, правильно передать полную ответственность за фичу разработчику, какие грабли можно собрать на этом пути и что нужно измерять в процессе для оценки результата.
🔴 Зал «Дели+Калькутта». Fail-митап. Екатерина Фирсова (Altenar), Алексей Мерсон (Т-Банк), Антон Морев (Wormsoft), Андрей Синицын (Ozon), Дмитрий Синявский (Ви.Tech), Алексей Цыкунов (Hilbert Team), Глеб Тильтиков (МТС Диджитал), Андрей Лагунов (ecom.tech)
Митап, в котором люди рассказывают свои истории о том, как они что-то разломали. Без записи, поэтому стоит ожидать только самых интересных аварий и ошибок.
🔴 Зал «Пекин». Автоматизированное создание стандартных сред: от Docker до Debian + kFreeBSD в Hypersphere OS.
Поговорим про дистрибутивы линукс и бсд. Приходите со своими задачами и вопросами — посмотрите на них со стороны Hypersphere OS на практике! Программный комитет конференции просто рад этой теме.
Platform Engineering, Reliability Engineering, Observability Engineering... Почему что-то стали называть отдельным инжинирингом и что внутри них интересного происходит, расскажет Игорь на своём обзорном докладе.
Из первых уст — о сложностях и их преодолении при сопровождении продукта российской ВКС. Рост нагрузки, проблемы инфраструктуры. Через тернии к стабильному и геораспределенному решению.
Kubernetes для маленького проекта выглядит слишком дорогим? Евгений расскажет о том, как можно в production жить на Docker Swarm, с каким проблемами можно столкнуться и как восстанавливать.
Подход, который может повторить почти каждый. Павел подробно расскажет о том, как ускориться, правильно передать полную ответственность за фичу разработчику, какие грабли можно собрать на этом пути и что нужно измерять в процессе для оценки результата.
Митап, в котором люди рассказывают свои истории о том, как они что-то разломали. Без записи, поэтому стоит ожидать только самых интересных аварий и ошибок.
Поговорим про дистрибутивы линукс и бсд. Приходите со своими задачами и вопросами — посмотрите на них со стороны Hypersphere OS на практике! Программный комитет конференции просто рад этой теме.
Please open Telegram to view this post
VIEW IN TELEGRAM