DevOps&SRE Library
18.3K subscribers
456 photos
4 videos
2 files
4.94K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://www.gosuslugi.ru/snet/67704b536aa9672b963777b3
Download Telegram
kubectl-ai

kubectl-ai acts as an intelligent interface, translating user intent into precise Kubernetes operations, making Kubernetes management more accessible and efficient.


https://github.com/GoogleCloudPlatform/kubectl-ai
ut

A fast, lightweight CLI utility toolkit for developers and IT professionals. ut provides a comprehensive set of commonly-used tools in a single binary, eliminating the need to install and remember multiple utilities or search for random websites to perform simple tasks.


https://github.com/ksdme/ut
shiori

Shiori is a simple bookmarks manager written in the Go language. Intended as a simple clone of Pocket. You can use it as a command line application or as a web application. This application is distributed as a single binary, which means it can be installed and used easily.


https://github.com/go-shiori/shiori
Terraforming With AI

This article will go over using a team of AI agents in conjunction with the Terraform MCP server and Docker's cagent tool to clean up some rather gnarly autogenerated terraform without needing to write any code.


https://dev.to/zloeber/terraforming-with-ai-g0o
cagent

A powerful, easy to use, customizable multi-agent runtime that orchestrates AI agents with specialized capabilities and tools, and the interactions between agents.


https://github.com/docker/cagent
Postgres Migrations Using Logical Replication

Moving a Postgres database isn’t a small task. Typically for Postgres users this is one of the biggest projects you’ll undertake.


https://www.crunchydata.com/blog/postgres-migrations-using-logical-replication
mathesar

Intuitive spreadsheet-like interface that lets users of all technical skill levels view, edit, query, and collaborate on Postgres data directly—self hosted, with native Postgres access control.


https://github.com/mathesar-foundation/mathesar
Non-HA Kubernetes Gotchas: Downtime and Autoscaling Pitfalls with Single Replica Workloads

https://eng.zemosolabs.com/non-ha-kubernetes-gotchas-downtime-and-autoscaling-pitfalls-with-single-replica-workloads-812ac4150d70
kor

Kor is a tool to discover unused Kubernetes resources.


https://github.com/yonahd/kor
homelab

After rebuilding my homelab one too many times, I committed to managing it entirely with GitOps. This repository is the result: a blueprint for a resilient, production-inspired Kubernetes cluster.


https://github.com/theepicsaxguy/homelab
mcp-server-kubernetes

MCP Server that can connect to a Kubernetes cluster and manage it. Supports loading kubeconfig from multiple sources in priority order.


https://github.com/Flux159/mcp-server-kubernetes
mysql-operator

The MySQL Operator for Kubernetes is an operator for managing MySQL InnoDB Cluster setups inside a Kubernetes Cluster. It manages the full lifecycle with set up and maintenance that includes automating upgrades and backup.


https://github.com/mysql/mysql-operator
Как работают инженеры по надёжности в 2025 году?

SRE-инженеры — те, кто держат продакшен в живых, настраивают мониторинг, ловят инциденты и отвечают за аптайм.

Ребята из DevCrowd, которые специализируются на ёмких и открытых отчетах о разных профессиях в IT, запускают свое первое исследование про SRE и DevOps-практики — чтобы понять, как всё устроено изнутри: кто за что отвечает, какие инструменты реально работают и где проходит граница между SRE и DevOps.

💡 Зачем участвовать

– посмотрите, как ваш опыт соотносится с другими инженерами: процессы, зрелость команд, инструменты;

– узнайте, какие reliability-практики внедряют коллеги;

– поможете сделать роль SRE понятнее и заметнее на рынке.

🛠 В опросе задачи, инструменты, мониторинг, алертинг, CI/CD, культура постмортемов и взаимодействие ролей.

🕐 Заполнение займёт около 10 минут.

📝 Пройти опрос → https://survey.alchemer.eu/s3/90909470/SRE-2025

📊 Результаты — в ноябре на devcrowd.ru
YamlQL

Query YAML files with SQL. Transform any YAML structure into a queryable database instantly.


https://github.com/AKSarav/YamlQL
kube-composer

A modern, intuitive Kubernetes YAML generator that simplifies deployment configuration for developers and DevOps teams.


https://github.com/same7ammar/kube-composer
🎥 Вебинар по DevOps: Контейнеризация и безопасность: почему, зачем и как?

👉 На вебинаре вы узнаете:

- Как устроена безопасность контейнеров изнутри.
- Типичные ошибки команд, которые приводят к уязвимостям.
- Практики, которые действительно помогают: от политики прав до сканирования образов.
- Что делать, чтобы контейнеры не стали слабым звеном инфраструктуры.

💪 В результате вебинара вы:

- Понимание, где на самом деле ломаются процессы безопасности в контейнерах.
- Чек-лист практик, которые можно внедрить сразу.
- Навык смотреть на контейнеризацию не только через призму удобства, но и надёжности.

🎁 Все участники вебинара получат специальные условия на полное обучение.

👉 Для участия зарегистрируйтесь: https://vk.cc/cQxZV8

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqwrw8aa
What Is OTLP and Why It's the Future of Observability

You're probably reading this because you don't want to sink time or money into proprietary protocols and agents anymore. Why would you? They tie you to a single vendor, force you to adapt to their quirks, and make it painful to change direction later.

What you really need is an open, consistent way to instrument, collect, and move your telemetry without worrying about compatibility or lock-in. That's exactly what OpenTelemetry (OTel) gives you. And at the center of it all is the OpenTelemetry Protocol (OTLP), the common language that makes your services, collectors, and backends speak fluently with each other.

This guide will walk you through OTLP in detail: what it is, why it matters, and how to use it in real pipelines. By the end, you'll see how embracing OTLP and pairing it with an OTel-native backend helps you solve the challenges of modern observability while keeping your stack open, reliable, and free of lock-in.


https://www.dash0.com/knowledge/opentelemetry-protocol-otlp
Создаем и настраиваем выделенные серверы через Terraform

Если вы хотите автоматизировать управление IT-инфраструктурой и сократить время на ее развертывание, вы точно придете к использованию Terraform. Через него можно поднять сервер нужной конфигурации, прописать сетевую связность и внешние доступы, гибко настроить ОС и сеть на сервере.

И, кстати, через Terraform вы можете управлять не только облачными ресурсами. В Selectel эта фича теперь доступна и для «железной» инфраструктуры на базе выделенных серверов. Вы получаете изолированность и высокую производительность железа с гибким «облачным» управлением.

Единый Terraform-провайдер позволяет настроить гибридную инфраструктуру в Selectel. Добавляйте облачные серверы, подключайте сетевые диски, объединяйте и комбинируйте ресурсы между собой — все с помощью одного инструмента.

Попробовать Terraform в Selectel можно бесплатно — ловите 3 000 бонусов на тест. Для этого зарегистрируйтесь в панели, напишите в тикете кодовое слово «TERRAFORM» и ждите одобрения заявки.

Реклама. АО "Селектел". erid:2W5zFJPvsHJ
What are metrics in OpenTelemetry: A Complete Guide

A comprehensive guide to understanding metrics in OpenTelemetry. What they are, how they work, and how to implement them effectively with practical code examples.


https://oneuptime.com/blog/post/2025-08-26-what-are-metrics-in-opentelemetry/view