Библиотека задач по DevOps | тесты, код, задания
2.87K subscribers
134 photos
5 videos
2 files
284 links
Задачи и тесты по DevOps для тренировки и обучения.

По рекламе: @proglib_adv

Наши каналы: https://t.iss.one/proglibrary/9197

Учиться у нас: https://proglib.io/w/2b07c285

Для обратной связи: @proglibrary_feeedback_bot
Download Telegram
При настройке CI/CD пайплайна для деплоя микросервисов в Kubernetes, какой подход наиболее корректный для минимизации downtime?

👾 — Применять kubectl delete для Pod’ов, а затем kubectl apply для новых
👍 — Использовать стратегию деплоя RollingUpdate с настройкой maxUnavailable и maxSurge
🥰 — Всегда разворачивать новую версию в отдельном namespace и вручную переключать трафик
⚡️ — Отключать readiness/liveness пробы на время деплоя, чтобы Pod быстрее стартовал

🐸Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🥰21
Media is too big
VIEW IN TELEGRAM
Подсматриваем за кухней ситуационного центра VK — будет полезно всем, кто интересуется SRE 👌

Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».

Смотрим в VK Видео, Дзене или на YouTube.
Вы настраиваете мониторинг в продакшн-кластере Kubernetes. Важно отслеживать состояние Pod’ов, сервисов и метрики производительности приложений. Какой стек инструментов будет наиболее корректным выбором?

👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде

🐸Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?

👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать

🐸Библиотека задач по DevOps
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9