DevOps&SRE Library – Telegram

DevOps&SRE Library

17.9K subscribers

461 photos

4 videos

2 files

4.78K links

Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3&registryType=bloggersPermission

Download Telegram

About

Blog

Apps

Platform

DevOps&SRE Library

17.9K subscribers

DevOps&SRE Library

Tracing GenAI Applications Is Not Enough

https://krisztianfekete.org/tracing-genai-applications-is-not-enough

2.43K views07:00

DevOps&SRE Library

📌

Добавляем 3 сентября в календари!

Авито устраивает IT-квест и вечеринку для инженеров в секретном месте в честь открытия офиса в Нижнем Новгороде.

Обещают много нетворка, Fuckup Night и инсайты о том, что у Авито «под капотом». Пересылайте пост друзьям, с которыми пойдёте, и не забудьте зарегистрироваться по ссылке.

Please open Telegram to view this post

VIEW IN TELEGRAM

2.71K views09:05

DevOps&SRE Library

Top 10 Status Page Examples: What We Like and What’s Missing

https://www.checklyhq.com/blog/top-10-status-page-examples

2.51K views15:00

DevOps&SRE Library

Redesigning Workers KV for increased availability and faster performance

https://blog.cloudflare.com/rearchitecting-workers-kv-for-redundancy

2.2K views07:00

DevOps&SRE Library

⚡️Тест по мониторингу архитектуры

Ответьте на 15 вопросов и проверьте, насколько вы готовы к обучению на курсе — "Observability: мониторинг, логирование, трейсинг" от Отус.

Научитесь строить эффективные системы мониторинга и логирования. Курс идеально подойдет администраторам Linux, DevOps-инженерам и разработчикам, которые хотят повысить квалификацию и увеличить доход.

➡️ ПРОЙТИ ТЕСТ: https://vk.cc/cOZbig

🤝 Бонусом за успешно пройденный тест, получишь доступ к записям лучших вебинаров курса.

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqvEEiYJ

2.37K views09:03

DevOps&SRE Library

6 Reasons You Don't Need an SRE Team

The model of large SRE teams covering many services in a vague and nebulous way that's open to repeated re-interpretation is mostly a side-effect of (a) cargo-culting the building of these large groups, or (b) retrofitting SRE/DevOps onto existing groups without the company-wide reliability focus required (or the fortitude to decide you didn't need such a large group to do SRE).

https://log.andvari.net/6reasons.html

2.09K views15:00

DevOps&SRE Library

Синтаксис Python освоили, а что дальше?
Работа с БД, парсинг и собственные пет‑проекты

В новом бесплатном курсе от Selectel собраны обучающие материалы для первых шагов в мире реального программирования. Меньше теории — больше практики.

После прохождения курса вы научитесь:
▪️работать с базами данных и брокерами сообщений,
▪️создавать приложения с графическим интерфейсом,
▪️автоматизировать получение данных.

Начните курс в Академии Selectel: https://slc.tl/m4ixl

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2Vtzqw5L42v

2.24K views16:02

DevOps&SRE Library

Flame Charts: The Time-Aware Sibling of Flame Graphs

https://www.polarsignals.com/blog/posts/2025/05/28/flamecharts-the-time-aware-sibling-of-flame-graphs

2.05K views07:00

DevOps&SRE Library

Запустите карьеру инженера на оплачиваемой программе развития МТС ПРО и работайте с самыми востребованными технологиями!

Почему это крутой старт?
— Зарплата 115 000 рублей (до вычета налогов), за классные результаты работы ее могут повысить в течение программы.
— Гибридный график: три дня в офисе и два — удаленно.
— Практический опыт на реальных проектах.
— Наставничество опытных менторов и поддержка команды.

Открыты направления:
— Аппаратный разработчик
— Радиоинженер
— Сетевой инженер-разработчик
— Инженер IP/MPLS, ЦОД
— Архитектор облака
— DevOps-инженер
— Инженер SRE

Начинайте карьеру с МТС ПРО — выбирайте трек и поднимайте свой экспертный уровень вместе с лучшими!
Регистрируйтесь: https://u.to/EdlVIg

2.47K views09:01

DevOps&SRE Library

Why I recommend native Prometheus instrumentation over OpenTelemetry

https://promlabs.com/blog/2025/07/17/why-i-recommend-native-prometheus-instrumentation-over-opentelemetry

2.4K views15:00

DevOps&SRE Library

Choosing the right OpenTelemetry Collector distribution

https://www.datadoghq.com/blog/otel-collector-distributions

2.21K views07:00

DevOps&SRE Library

Setting Up OpenTelemetry on the Frontend Because I Hate Myself

Frontend developers deserve so much better from OpenTelemetry, especially since they stand to benefit so much.

https://thenewstack.io/setting-up-opentelemetry-on-the-frontend-because-i-hate-myself

2.14K views15:00

DevOps&SRE Library

OpenTelemetry configuration gotchas

https://blog.frankel.ch/opentelemetry-gotchas

1.93K views07:00

DevOps&SRE Library

How to Name Your Spans

https://blog.olly.garden/how-to-name-your-spans

1.77K views15:00

DevOps&SRE Library

How Meta keeps its AI hardware reliable

https://engineering.fb.com/2025/07/22/data-infrastructure/how-meta-keeps-its-ai-hardware-reliable

1.54K views07:00

DevOps&SRE Library

Мониторинг PostgreSQL в Zabbix

🚀 О чём этот урок?

PostgreSQL — надёжная и мощная СУБД, но без грамотного мониторинга она может преподнести неприятные сюрпризы. На этом уроке мы разберём, как выстроить мониторинг PostgreSQL в Zabbix так, чтобы вовремя замечать проблемы и поддерживать стабильность работы кластера.

Погрузимся в архитектуру PostgreSQL, рассмотрим ключевые метрики и процессы, влияющие на производительность, а также разберём, как отслеживать реплики и контролировать состояние бэкапов.

🎯 Что вы получите:
— Чёткое понимание, как организовать мониторинг PostgreSQL через Zabbix
— Навык настройки метрик и алертов для стабильной работы кластера
— Практику по отслеживанию репликации и состоянию резервных копий
— Уверенность в том, что база «не упадёт внезапно»

👉 Регистрация и подробности о курсе Observability: мониторинг, логирование, трейсинг: https://vk.cc/cP2lYA

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv8GmpN

1.56K views09:03

DevOps&SRE Library

Achieving High Availability with distributed database on Kubernetes at Airbnb

We chose an innovative strategy of deploying a distributed database cluster across multiple Kubernetes clusters in a cloud environment. Although currently an uncommon design pattern due to its complexity, this strategy allowed us to achieve target system reliability and operability.

In this post, we’ll share how we overcame challenges and the best practices we’ve developed for this strategy and we believe these best practices should be applicable to any other strongly consistent, distributed storage systems.

https://medium.com/airbnb-engineering/achieving-high-availability-with-distributed-database-on-kubernetes-at-airbnb-58cc2e9856f4

1.32K views15:00

DevOps&SRE Library

Introducing Off-CPU Profiling

How Off-CPU profiling works and how to get the most out of it

https://www.polarsignals.com/blog/posts/2025/07/30/introducing-off-cpu-profiling

1

675 views07:00