При настройке CI/CD пайплайна для деплоя микросервисов в Kubernetes, какой подход наиболее корректный для минимизации downtime?
👾 — Применять kubectl delete для Pod’ов, а затем kubectl apply для новых
👍 — Использовать стратегию деплоя RollingUpdate с настройкой maxUnavailable и maxSurge
🥰 — Всегда разворачивать новую версию в отдельном namespace и вручную переключать трафик
⚡️ — Отключать readiness/liveness пробы на время деплоя, чтобы Pod быстрее стартовал
🐸 Библиотека задач по DevOps
👾 — Применять kubectl delete для Pod’ов, а затем kubectl apply для новых
👍 — Использовать стратегию деплоя RollingUpdate с настройкой maxUnavailable и maxSurge
🥰 — Всегда разворачивать новую версию в отдельном namespace и вручную переключать трафик
⚡️ — Отключать readiness/liveness пробы на время деплоя, чтобы Pod быстрее стартовал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🥰2❤1
Media is too big
VIEW IN TELEGRAM
Подсматриваем за кухней ситуационного центра VK — будет полезно всем, кто интересуется SRE 👌
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
Вы настраиваете мониторинг в продакшн-кластере Kubernetes. Важно отслеживать состояние Pod’ов, сервисов и метрики производительности приложений. Какой стек инструментов будет наиболее корректным выбором?
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
🐸 Библиотека задач по DevOps
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
🐸 Библиотека задач по DevOps
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9