DevOps&SRE Library
17.9K subscribers
461 photos
4 videos
2 files
4.78K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3&registryType=bloggersPermission
Download Telegram
📌Добавляем 3 сентября в календари!

Авито устраивает IT-квест и вечеринку для инженеров в секретном месте в честь открытия офиса в Нижнем Новгороде.

Обещают много нетворка, Fuckup Night и инсайты о том, что у Авито «под капотом». Пересылайте пост друзьям, с которыми пойдёте, и не забудьте зарегистрироваться по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Top 10 Status Page Examples: What We Like and What’s Missing

https://www.checklyhq.com/blog/top-10-status-page-examples
Redesigning Workers KV for increased availability and faster performance

https://blog.cloudflare.com/rearchitecting-workers-kv-for-redundancy
⚡️Тест по мониторингу архитектуры

Ответьте на 15 вопросов и проверьте, насколько вы готовы к обучению на курсе — "Observability: мониторинг, логирование, трейсинг" от Отус.

Научитесь строить эффективные системы мониторинга и логирования. Курс идеально подойдет администраторам Linux, DevOps-инженерам и разработчикам, которые хотят повысить квалификацию и увеличить доход.

➡️ ПРОЙТИ ТЕСТ: https://vk.cc/cOZbig

🤝 Бонусом за успешно пройденный тест, получишь доступ к записям лучших вебинаров курса.

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqvEEiYJ
6 Reasons You Don't Need an SRE Team

The model of large SRE teams covering many services in a vague and nebulous way that's open to repeated re-interpretation is mostly a side-effect of (a) cargo-culting the building of these large groups, or (b) retrofitting SRE/DevOps onto existing groups without the company-wide reliability focus required (or the fortitude to decide you didn't need such a large group to do SRE).


https://log.andvari.net/6reasons.html
Синтаксис Python освоили, а что дальше?
Работа с БД, парсинг и собственные пет‑проекты


В новом бесплатном курсе от Selectel собраны обучающие материалы для первых шагов в мире реального программирования. Меньше теории — больше практики.

После прохождения курса вы научитесь:
▪️работать с базами данных и брокерами сообщений,
▪️создавать приложения с графическим интерфейсом,
▪️автоматизировать получение данных.

Начните курс в Академии Selectel: https://slc.tl/m4ixl

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2Vtzqw5L42v
Запустите карьеру инженера на оплачиваемой программе развития МТС ПРО и работайте с самыми востребованными технологиями!

Почему это крутой старт?
Зарплата 115 000 рублей (до вычета налогов), за классные результаты работы ее могут повысить в течение программы.
Гибридный график: три дня в офисе и два — удаленно.
— Практический опыт на реальных проектах.
— Наставничество опытных менторов и поддержка команды.

Открыты направления:
— Аппаратный разработчик
— Радиоинженер
— Сетевой инженер-разработчик
— Инженер IP/MPLS, ЦОД
— Архитектор облака
— DevOps-инженер
— Инженер SRE

Начинайте карьеру с МТС ПРО — выбирайте трек и поднимайте свой экспертный уровень вместе с лучшими!
Регистрируйтесь: https://u.to/EdlVIg
Choosing the right OpenTelemetry Collector distribution

https://www.datadoghq.com/blog/otel-collector-distributions
Setting Up OpenTelemetry on the Frontend Because I Hate Myself

Frontend developers deserve so much better from OpenTelemetry, especially since they stand to benefit so much.


https://thenewstack.io/setting-up-opentelemetry-on-the-frontend-because-i-hate-myself
OpenTelemetry configuration gotchas

https://blog.frankel.ch/opentelemetry-gotchas
Мониторинг PostgreSQL в Zabbix

🚀 О чём этот урок?


PostgreSQL — надёжная и мощная СУБД, но без грамотного мониторинга она может преподнести неприятные сюрпризы. На этом уроке мы разберём, как выстроить мониторинг PostgreSQL в Zabbix так, чтобы вовремя замечать проблемы и поддерживать стабильность работы кластера.

Погрузимся в архитектуру PostgreSQL, рассмотрим ключевые метрики и процессы, влияющие на производительность, а также разберём, как отслеживать реплики и контролировать состояние бэкапов.

🎯 Что вы получите:
— Чёткое понимание, как организовать мониторинг PostgreSQL через Zabbix
— Навык настройки метрик и алертов для стабильной работы кластера
— Практику по отслеживанию репликации и состоянию резервных копий
— Уверенность в том, что база «не упадёт внезапно»

👉 Регистрация и подробности о курсе Observability: мониторинг, логирование, трейсинг: https://vk.cc/cP2lYA

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv8GmpN
Achieving High Availability with distributed database on Kubernetes at Airbnb

We chose an innovative strategy of deploying a distributed database cluster across multiple Kubernetes clusters in a cloud environment. Although currently an uncommon design pattern due to its complexity, this strategy allowed us to achieve target system reliability and operability.

In this post, we’ll share how we overcame challenges and the best practices we’ve developed for this strategy and we believe these best practices should be applicable to any other strongly consistent, distributed storage systems.


https://medium.com/airbnb-engineering/achieving-high-availability-with-distributed-database-on-kubernetes-at-airbnb-58cc2e9856f4
Introducing Off-CPU Profiling

How Off-CPU profiling works and how to get the most out of it


https://www.polarsignals.com/blog/posts/2025/07/30/introducing-off-cpu-profiling
1