DevOps&SRE Library
18K subscribers
462 photos
3 videos
2 files
4.84K links
Библиотека статей по теме DevOps и SRE.

Реклама: @ostinostin
Контент: @mxssl

РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3&registryType=bloggersPermission
Download Telegram
Kubernetes 1.33: Resizing Pods Without the Drama (Finally!)

https://itnext.io/kubernetes-1-33-resizing-pods-without-the-drama-finally-88e4791be8d1
Почему летает облако?

Хочется сказать, что благодаря магии, но нет. Облака «летают» благодаря конкретным технологиям.

На серии вебинаров 2 октября наши коллеги из VK Cloud расскажут и покажут, какие решения обеспечивают стабильную работу облака.

Вы увидите, что лежит в основе работы облачных сервисов, например, почты, мессенджера или календаря.

Вас ждут:
5 докладов: про облачную безопасность, Bare Metal, GPU, VDI и Kubernetes
Пошаговые сценарии внедрения без лишних затрат
Кейсы, в которых облачные технологии дают измеримый бизнес-эффект

Все участники получат специальные условия на сервисы Cloud Desktop (создание удаленных рабочих мест в облаке) и Cloud Containers (работа с Kubernetes) от VK Cloud.

Зарегистрироваться
Первый митап по инфраструктуре от Wildberries & Russ

2 октября, сбор участников с 18:00 | Москва и онлайн

В программе — всё самое интересное из мира инфраструктуры: от файловых хранилищ на экстремальных нагрузках до автоматизации репозиториев и философии DevOps.

Доклады:

- Файловое хранилище Wildberries: бескомпромиссный HighLoad | Иван Волков, CTO CDN
- Путь автоматизации репозиториев в Nexus | Владислав Раев, DevOps & DevTools Engineer
- У вас завелся сервис: рекомендации лучших сервисоводов (наверное) | Александр Стовбунский, Tools Team TechLead

Для участия в офлайне регистрация обязательна. После докладов — продуктивный нетворкинг и афтерпати.

Реклама. ООО «Архитектор будущего», ИНН: 3662286029, erid: 2VtzquZWJLU
Securing Kubernetes Traffic with Calico Ingress Gateway

https://www.tigera.io/blog/securing-kubernetes-traffic-with-calico-ingress-gateway
Is It Time to Migrate? A Practical Look at Kubernetes Ingress vs. Gateway API

https://www.tigera.io/blog/is-it-time-to-migrate-a-practical-look-at-kubernetes-ingress-vs-gateway-api
criu

CRIU (stands for Checkpoint and Restore in Userspace) is a utility to checkpoint/restore Linux tasks.

Using this tool, you can freeze a running application (or part of it) and checkpoint it to a hard drive as a collection of files. You can then use the files to restore and run the application from the point it was frozen at. The distinctive feature of the CRIU project is that it is mainly implemented in user space. There are some more projects doing C/R for Linux, and so far CRIU appears to be the most feature-rich and up-to-date with the kernel.

CRIU project is (almost) the never-ending story, because we have to always keep up with the Linux kernel supporting checkpoint and restore for all the features it provides. Thus we're looking for contributors of all kinds -- feedback, bug reports, testing, coding, writing, etc. Please refer to CONTRIBUTING.md if you would like to get involved.

The project started as the way to do live migration for OpenVZ Linux containers, but later grew to more sophisticated and flexible tool. It is currently used by (integrated into) OpenVZ, LXC/LXD, Docker, and other software, project gets tremendous help from the community, and its packages are included into many Linux distributions.


https://github.com/checkpoint-restore/criu
kube-copilot

Kubernetes Copilot powered by LLM, which leverages advanced language models to streamline and enhance Kubernetes cluster management. This tool integrates seamlessly with your existing Kubernetes setup, providing intelligent automation, diagnostics, and manifest generation capabilities. By utilizing the power of AI, Kubernetes Copilot simplifies complex operations and helps maintain the health and security of your Kubernetes workloads.


https://github.com/feiskyer/kube-copilot
🎥 Вебинар по Linux: "Linux Monitoring: как отслеживать и анализировать производительность"

☝️ На вебинаре вы узнаете:
- Основные категории мониторинга: ресурсы, процессы, сеть, логи
- Инструменты для мониторинга в Linux: top, htop, iostat, vmstat, sar, netstat, dstat
- Как собирать и анализировать метрики с помощью системных и сторонних инструментов

💪 В результате вебинара вы:
- Научитесь собирать и анализировать ключевые метрики системы
- Сможете выявлять узкие места и потенциальные проблемы заранее
- Попробуете комбинировать разные инструменты для комплексного мониторинга

Все участники вебинара получат специальные условия на полное обучение курса "Administrator Linux. Professional"

👉 Для участия зарегистрируйтесь: https://vk.cc/cPQF3p

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqua1rBW
mantis

Mantis is a next-generation Infrastructure as Code (IaC) tool that reimagines how we manage cloud and Kubernetes resources. Built as a fork of OpenTofu and powered by CUE, Mantis combines the best of Terraform and Helm while solving their limitations.

To manage cloud resources, Mantis compiles CUE configurations into Terraform compatible json and leverages the Opentofu engine to orchestrate it. To manage K8s resources, Mantis compiles CUE configurations yaml manifests which can be deployed either using mantis or via integrations with Gitops tools like ArgoCD or FluxCD


https://github.com/augur-ai/mantis
oras

OCI registry client - managing content like artifacts, images, packages


https://github.com/oras-project/oras
— Как разогнать кластер Kubernetes до 25 000 подов без потерь производительности?
— Никак, — ответят многие, но у нас есть решение на этот счет.

13 октября в 17:00 VK Cloud проведет вебинар, где будем рассматривать кейс Битрикс24 и расскажем, какие инструменты и практики применяет компания для стабильной работы кластера.

О чем еще будем говорить

Как определять узкие места архитектуры до того, как они приведут к Downtime.
Почему решения, работающие у тысяч пользователей, не справляются с десятками тысяч.
Как управлять сотнями сервисов и не терять контроль состояний и производительность.
Как построить систему так, чтобы сбои отдельных компонентов не останавливали всю работу.
Как снизить операционные затраты без потери качества сервиса при росте нагрузки.

Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
flagr

Flagr is an open source Go service that delivers the right experience to the right entity and monitors the impact. It provides feature flags, experimentation (A/B testing), and dynamic configuration. It has clear swagger REST APIs for flags management and flag evaluation.


https://github.com/openflagr/flagr
From Utilization to PSI: Rethinking Resource Starvation Monitoring in Kubernetes

From Utilization Confusion to PSI Clarity in Kubernetes


https://blog.zmalik.dev/p/from-utilization-to-psi-rethinking
🗓 Как быстро сохранить и восстановить ресурсы в Kubernetes

Иногда нужно забэкапить пачку однотипных ресурсов и потом без боли восстановить.
Делимся двумя проверенными способами.

1⃣ kubectl-neat + yq
Очищаем YAML от лишних метаданных и превращаем массив в отдельные документы:


kubectl get <resource> -n <namespace> -o yaml \
| kubectl-neat \
| yq eval '.items[] | split_doc' - > resources.yaml

kubectl apply -f resources.yaml


2⃣ kubedump
Автоматизирует сохранение/восстановление по проектам:


kubedump dump <namespace> --resources <resource> --project <project-name>
kubedump restore --project <project-name>


Что выбрать?
kubectl-neat + yq: лёгкий, гибкий, для разовых задач.
kubedump: для регулярных бэкапов и больших кластеров.

Бонус:
Лимиты ресурсов в Kubernetes
Как настроить basicAuth в Traefik

Больше лайфхаков и практичных утилит для инженеров DevOps — в CORTEL

Реклама ООО "Кортэл"
ИНН: 7816246925
Please open Telegram to view this post
VIEW IN TELEGRAM
Inside Intra-Node Pod Traffic in Kubernetes: How Kindnet with PTP Moves Packets

https://itnext.io/inside-intra-node-pod-traffic-in-kubernetes-how-kindnet-with-ptp-moves-packets-ffbbc07612b7
The Story Behind the Great Sidecar Debate

Many, many pixels have been burned on the topic of sidecars of late.

If you’ve been paying any attention at all to the cloud-native ecosystem, you’ve doubtless run across discussions about the merits - or lack thereof - of sidecars. In a lot of ways, this is kind of silly: sidecars are a fairly low-level implementation pattern, and it would probably make sense to see them considered an implementation detail rather than the latest hot marketing topic. In other ways, though, we live in an imperfect world and we often do have to pull back the curtains to take a look at the technology underneath the tools we use: understanding the tradeoffs made by our tool choices is often critical to getting the most out of those tools, and architectural decisions are always about tradeoffs.

For various reasons, I ended up being the one to take on the job of pulling back the curtain on both Linkerd’s choice to use the sidecar pattern and Istio Ambient’s choice to avoid it, and look into the ramifications of those choices. I did this in the obvious way: I ran both meshes under load and measured things about them. It was simultaneously frustrating and fascinating, often in surprising ways.


https://linkerd.io/2025/05/21/behind-the-great-sidecar-debate/index.html
⁉️Готовы перейти от разработки к управлению людьми и проектами?

8 октября в 20:00 МСК приглашаем на открытый урок «Всё о курсе Team Lead: прямой разговор с руководителем программы». На вебинаре мы честно расскажем, что ждёт студентов на курсе, какие темы будут разобраны и какую ценность вы получите. Это возможность услышать инсайды о программе из первых уст и задать любые вопросы напрямую руководителю.

Урок будет полезен тем, кто уже задумывается о переходе в роль тимлида: старшим инженерам, начинающим руководителям и всем, кто хочет развиваться в IT-менеджменте.

Открытый урок проходит в преддверие старта курса «Team Lead».

Зарегистрируйтесь сейчас и узнайте, как повышение квалификации поможет вам вырасти в эффективного лидера: https://vk.cc/cQ18xm

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqvv2r6y