В CI/CD пайплайне часто случаются фейлы при деплое в Kubernetes из-за того, что некоторые сервисы ещё не успели подняться, а другие уже начинают к ним обращаться. Какой подход будет наиболее правильным для решения этой проблемы?
👾 — Увеличить таймаут деплоя в CI/CD и просто ждать дольше
👍 — Использовать readinessProbe и livenessProbe в манифестах Pod’ов, чтобы контролировать доступность сервисов
🥰 — Настроить в пайплайне ручное подтверждение перед каждым шагом деплоя
⚡️ — Отключить проверки доступности сервисов и надеяться, что при рестарте всё заработает
🐸 Библиотека задач по DevOps
👾 — Увеличить таймаут деплоя в CI/CD и просто ждать дольше
👍 — Использовать readinessProbe и livenessProbe в манифестах Pod’ов, чтобы контролировать доступность сервисов
🥰 — Настроить в пайплайне ручное подтверждение перед каждым шагом деплоя
⚡️ — Отключить проверки доступности сервисов и надеяться, что при рестарте всё заработает
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
При настройке CI/CD пайплайна для деплоя микросервисов в Kubernetes, какой подход наиболее корректный для минимизации downtime?
👾 — Применять kubectl delete для Pod’ов, а затем kubectl apply для новых
👍 — Использовать стратегию деплоя RollingUpdate с настройкой maxUnavailable и maxSurge
🥰 — Всегда разворачивать новую версию в отдельном namespace и вручную переключать трафик
⚡️ — Отключать readiness/liveness пробы на время деплоя, чтобы Pod быстрее стартовал
🐸 Библиотека задач по DevOps
👾 — Применять kubectl delete для Pod’ов, а затем kubectl apply для новых
👍 — Использовать стратегию деплоя RollingUpdate с настройкой maxUnavailable и maxSurge
🥰 — Всегда разворачивать новую версию в отдельном namespace и вручную переключать трафик
⚡️ — Отключать readiness/liveness пробы на время деплоя, чтобы Pod быстрее стартовал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🥰2❤1
Media is too big
VIEW IN TELEGRAM
Подсматриваем за кухней ситуационного центра VK — будет полезно всем, кто интересуется SRE 👌
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
👍1🥰1🤩1
Вы настраиваете мониторинг в продакшн-кластере Kubernetes. Важно отслеживать состояние Pod’ов, сервисов и метрики производительности приложений. Какой стек инструментов будет наиболее корректным выбором?
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
🐸 Библиотека задач по DevOps
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
🐸 Библиотека задач по DevOps
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1
В Kubernetes у вас есть микросервис, который обрабатывает критичные данные. Вы хотите ограничить его доступ к ресурсам хоста и сети для повышения безопасности. Какой механизм Kubernetes стоит использовать?
👾 — ConfigMap
👍 — NetworkPolicy и PodSecurityContext
🥰 — HorizontalPodAutoscaler
⚡️ — Liveness и Readiness пробы
🐸 Библиотека задач по DevOps
👾 — ConfigMap
👍 — NetworkPolicy и PodSecurityContext
🥰 — HorizontalPodAutoscaler
⚡️ — Liveness и Readiness пробы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
👍1
7 октября стартует второй поток курса «AI-агенты для DS-специалистов».
За 5 недель вы научитесь собирать агентов, которые уже сейчас будут помогать бизнесу.
В кружке выше Максим Шаланкин, наш преподаватель, рассказывает подробнее — включай, чтобы не пропустить.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩1
В Kubernetes вы хотите реализовать blue-green deployment, чтобы минимизировать риски при выкатывании новой версии приложения. Какой подход будет наиболее правильным?
👾 — Обновить Deployment стратегией RollingUpdate и выставить maxUnavailable=0
👍 — Запустить новую версию как отдельный Deployment/Service и переключить трафик на неё после проверки
🥰 — Удалить старый Deployment и сразу задеплоить новый
⚡️ — Настроить HPA (HorizontalPodAutoscaler), чтобы он автоматически включал новую версию
🐸 Библиотека задач по DevOps
👾 — Обновить Deployment стратегией RollingUpdate и выставить maxUnavailable=0
👍 — Запустить новую версию как отдельный Deployment/Service и переключить трафик на неё после проверки
🥰 — Удалить старый Deployment и сразу задеплоить новый
⚡️ — Настроить HPA (HorizontalPodAutoscaler), чтобы он автоматически включал новую версию
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8⚡2