DevOps&SRE Library

SPIFFE & SPIRE: Your Kubernetes Workloads’ Secret Identity Agency

https://medium.com/@mohammedredatarmidi/spiffe-spire-your-kubernetes-workloads-secret-identity-agency-0e8947437871

3.03K views15:02

DevOps&SRE Library

Monitoring Kubernetes Cluster with Prometheus and Grafana using ArgoCD

https://jackjapar.com/monitoring-kubernetes-cluster-with-prometheus-and-grafana-using-argocd

2.9K views07:05

DevOps&SRE Library

Cluster API + Talos + Proxmox = ❤️

https://a-cup-of.coffee/blog/talos-capi-proxmox

2.67K views15:03

DevOps&SRE Library

webdav

A simple and standalone WebDAV server.

https://github.com/hacdias/webdav

2.28K views07:01

DevOps&SRE Library

⚡

Высокая нагрузка перестаёт быть проблемой, когда её можно прогнозировать, контролировать и распределять.

Kubernetes создан для этого, но большинство команд используют лишь малую часть его механизмов.

📌17 декабря в 20:00 МСК на открытом уроке «Инструменты и механизмы Kubernetes для обеспечения высокой нагрузки» в рамках курса «Инфраструктурная платформа на основе Kubernetes» мы разберём:

✔как встроенные возможности K8s обеспечивают стабильность: autoscaling, probes, requests/limits, affinity, Service, Ingress и механизмы балансировки.
✔вы увидите реальные практики DevOps-команд: как Kubernetes масштабирует сервисы под пиковые запросы,
✔управляет ресурсами и предотвращает деградацию производительности.
✔урок позволит понять, какие настройки делают систему эластичной и прогнозируемой.

↪

Зарегистрируйтесь на открытый урок и получите скидку на актуальное обучение: https://vk.cc/cS1wHt

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxeqmVb

Please open Telegram to view this post

VIEW IN TELEGRAM

2.49K views10:02

DevOps&SRE Library

Failure is inevitable: Learning from a large outage, and building for reliability in depth at Datadog

https://www.datadoghq.com/blog/engineering/rethinking-reliability

2.33K views15:04

DevOps&SRE Library

Why we're leaving serverless

Every millisecond matters when you're in the critical path of API authentication. After two years of fighting serverless limitations, we rebuilt our entire API stack and slashed the end-to-end latency.

https://www.unkey.com/blog/serverless-exit

2.22K views07:01

DevOps&SRE Library

Наконец-то ребята из контейнерной платформы “Штурвал” прислушались к сообществу и сделали альтернативу бесячей форме на сайте для получения community-лицензии. Теперь ее можно получить через бота в телеге: @l4_helper_bot .
Может ещё и Open-Source-версию сделают?

2.28K views09:04

DevOps&SRE Library

Advancing Our Chef Infrastructure: Safety Without Disruption

Building a safer, more reliable path forward for Chef at Slack

https://slack.engineering/advancing-our-chef-infrastructure-safety-without-disruption

2.06K views15:00

DevOps&SRE Library

🔥

Открытый урок «Terraform: как работать с ним через GitLab».

🗓 11 декабря в 20:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «CI/CD на основе GitLab».

На вебинаре разберем:
✔ Как использовать Terraform для управления инфраструктурой как кодом (IaC).
✔ Настройку CI/CD-процессов в GitLab для работы с Terraform.
✔ Лучшие практики разграничения окружения и управления конфигурацией.

Кому будет полезно:
- DevOps-лидам, управляющим инфраструктурой и CI/CD.
- Архитекторам, разрабатывающим стратегии инфраструктурной автоматизации.
- Инженерам, внедряющим Terraform в рабочие процессы.

Что вы получите:
- Понимание, Terraform-модули для работы через GitLab.
- Понимание, настройка и оптимизация пайплайнов CI/CD .
- Практические советы по безопасному и эффективному управлению инфраструктурой .

🔗 Ссылка на регистрацию: https://vk.cc/cS7o1o

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqw3RDeh

Please open Telegram to view this post

VIEW IN TELEGRAM

2.08K views16:04

DevOps&SRE Library

Container CPU Requests & Limits Explained with GOMAXPROCS Tuning

In this article, we’re going to cover a few things that might’ve puzzled you if you’ve been running your applications, especially Go applications, in Kubernetes:

- How Kubernetes and the Linux kernel handle CPU stuff for containers
- What the Go runtime does with CPU, and whether you should bother setting GOMAXPROCS
- Which metrics are actually worth paying attention to

Maybe you’ve seen some of these metrics before while keeping an eye on your applications, but didn’t fully know what to make of them. This should help clear that up.

https://victoriametrics.com/blog/kubernetes-cpu-go-gomaxprocs

2.71K views07:04

DevOps&SRE Library

zmx

session persistence for terminal processes

https://github.com/neurosnap/zmx

1.94K views15:04

DevOps&SRE Library

Running our Docker registry on-prem with Harbor

On hosting images without the price tag.

https://dev.37signals.com/running-our-docker-registry-on-prem-with-harbor

1.78K views07:03

DevOps&SRE Library

Чтобы не собирать вручную десятки однотипных команд для облачной CLI, мы в MWS Cloud Platform сделали генератор: он берёт OpenAPI-спеки и сам создаёт готовый инструмент для управления облаком.

В статье кратко:

— почему выбрали Go + Cobra и кодогенерацию;
— как из путей и методов рождаются mws <service> <component> <op>;
— профили, автообновление, удобный вывод;
— что получилось в итоге и зачем это бизнесу.

Читать статью

1.79K views09:08

DevOps&SRE Library

fizzy

This is the source code of Fizzy, the Kanban tracking tool for issues and ideas by 37signals.

https://github.com/basecamp/fizzy

1.59K views15:03

DevOps&SRE Library

🚀 Разгоняем kube-prometheus-stack: секретный ингредиент Observability

🔥 16 декабря в 20:00 мск — бесплатный вебинар от OTUS.

Мониторинг — это сердце инфраструктуры. Но что делать, если именно он начинает проседать под нагрузкой? На вебинаре разберём, как выжать максимум из kube-prometheus-stack, ускорить работу Grafana, разгрузить Prometheus и сделать observability-инфру устойчивой даже во время инцидентов.

Что разберём:
– как повысить отзывчивость Grafana при больших объёмах данных;
– как настроить Prometheus для быстрой обработки метрик;
– как сократить сетевой трафик мониторинга без потери данных;
– архитектурные подходы, которые помогут не «уронить» мониторинг при пиковых нагрузках.

👉 Регистрируйтесь здесь: https://vk.cc/cScBT2

Занятие приурочено к старту курса «Observability: мониторинг, логирование, трейсинг», где вы научитесь проектировать отказоустойчивые observability-системы.

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvqrdcN

1.7K views16:03

DevOps&SRE Library

VERT

VERT is a file conversion utility that uses WebAssembly to convert files on your device instead of a cloud.

https://github.com/VERT-sh/VERT

1.47K views07:02

DevOps&SRE Library

Новые сервисы для надежности вашей инфраструктуры

🔗

Облачный провайдер Cloud․ru выпустил три сервиса в общий доступ на платформе Cloud․ru Evolution. Используйте их, чтобы повысить защиту ваших ресурсов.

➡Evolution Load Balancer v2 помогает быстро и стабильно распределять нагрузку, работая сразу в нескольких зонах доступности. С этим сервисом вы можете быть уверены в стабильности работы своих систем, даже в случае сбоев в одной из зон.

➡Evolution Agent Backup создает резервные копии виртуальных машин из облаков сторонних провайдеров, экономя место и время благодаря полным и инкрементальным копиям.

➡Evolution Disaster Recovery обеспечивает быстрое восстановление работы IT-систем при сбоях или киберинцидентах.

А еще вы можете бесплатно протестировать Evolution Container Security — сервис, который помогает выявлять проблемы безопасности на всех этапах жизненного цикла контейнерных приложений.

Все сервисы работают с поддержкой 24/7, гарантированным SLA и возможностью масштабирования нагрузки.

Please open Telegram to view this post

VIEW IN TELEGRAM

1.49K views09:05

DevOps&SRE Library

Victorialogs vs Loki - Benchmarking Results

TL;DR – After side‑by‑side testing on a 500 GB/7‑day workload, VictoriaLogs cut query latencies by 94 %, shrank storage by ≈40 %, and used < 50 % of the CPU & RAM we previously allocated to Loki. This post explains why we switched.

https://truefoundry.com/blog/victorialogs-vs-loki

1.3K views15:04

DevOps&SRE Library

🎤 «В SREду на кухне» — как вам такое название подкаста?
Вопрос риторический, потому что коллеги из AvitoTech его уже запустили!ㅤㅤ

По названию несложно догадаться, о чём речь: инженеры из Авито собираются обсуждать SRE и как его готовят (и с чем едят). Приглашённые гости тоже будут: в первом сезоне познакомимся с коллегами из Т-Банка, Фланта и Cloud.ru.

И для затравки — основные темы первых выпусков:
➡ Где заканчивается DevOps и начинается SRE?
➡ Kubernetes — наше всё? А правда ли он вам нужен?
➡ Мониторинг и observability — кто за кем следит?
➡ Заменит ли ChatGPT любого SRE?

Слушаем некулинарные дискуссии от шефов по ссылкам ниже:

⚡

Яндекс.Музыка

⚡

YouTube

⚡

Please open Telegram to view this post

VIEW IN TELEGRAM

1.26K views16:04

DevOps&SRE Library

What I Really Mean When I Say “Good Communication” in Incident Response

“Good communication” is one of those phrases everyone nods along to — until the incident hits, and suddenly comms unravel before your eyes.

So here’s what I actually mean when I say communication matters.

https://uptimelabs.io/articles/good-communication-in-incident-response

726 views07:03

About

Blog

Apps

Platform