Media is too big
VIEW IN TELEGRAM
Подсматриваем за кухней ситуационного центра VK — будет полезно всем, кто интересуется SRE 👌
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
Какие метрики эффективности используют в VK, почему SRE-инженеру важен продуктовый подход и каких инструментов не хватает на рынке — всё это обсуждают в свежем выпуске подкаста «Кофе-брейк VK».
Смотрим в VK Видео, Дзене или на YouTube.
Вы настраиваете мониторинг в продакшн-кластере Kubernetes. Важно отслеживать состояние Pod’ов, сервисов и метрики производительности приложений. Какой стек инструментов будет наиболее корректным выбором?
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
🐸 Библиотека задач по DevOps
👾 — ELK (Elasticsearch, Logstash, Kibana)
👍 — Prometheus + Grafana
🥰 — Nagios + Shell-скрипты
⚡️ — Top + htop на каждой ноде
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10
В продакшене вы заметили, что один из контейнеров постоянно перезапускается с ошибкой Exit Code 137. Что это значит и как правильно действовать?
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
🐸 Библиотека задач по DevOps
👾 — Контейнер завершён вручную через docker stop; нужно убрать авто-рестарт
👍 — Контейнер был убит системой из-за превышения лимита памяти (OOMKilled); нужно проанализировать использование памяти и скорректировать лимиты/код
🥰 — Ошибка возникает из-за неправильного Dockerfile; нужно пересобрать образ с --no-cache
⚡️ — Это стандартный код успешного завершения; можно игнорировать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9
В Kubernetes у вас есть микросервис, который обрабатывает критичные данные. Вы хотите ограничить его доступ к ресурсам хоста и сети для повышения безопасности. Какой механизм Kubernetes стоит использовать?
👾 — ConfigMap
👍 — NetworkPolicy и PodSecurityContext
🥰 — HorizontalPodAutoscaler
⚡️ — Liveness и Readiness пробы
🐸 Библиотека задач по DevOps
👾 — ConfigMap
👍 — NetworkPolicy и PodSecurityContext
🥰 — HorizontalPodAutoscaler
⚡️ — Liveness и Readiness пробы
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4