DevOps | Вопросы собесов
5.36K subscribers
32 photos
985 links
Download Telegram
🤔 Сервис типа кластер P со значением nan, что это значит?

Если в системе мониторинга или логах кластерный сервис (Cluster P) показывает значение NaN (Not a Number), это означает, что данные недоступны или не определены.

🚩Возможные причины NaN в кластере

🟠Нет данных от сервиса (сбой мониторинга)
Метрика не обновляется из-за сбоя Prometheus, Zabbix или Grafana.
Датчики или агенты не отправляют данные.
Посмотреть логи агента

  journalctl -u node_exporter --no-pager | tail -20


Проверить доступность сервиса

  curl -s https://service-ip:port/metrics


🟠Ошибка в коде (деление на 0, пустой запрос)
Если метрика рассчитывается (X / Y), но Y = 0, результат будет NaN.
SQL-запрос возвращает пустой результат. Если используется PromQL, попробуйте запросить сырые данные:

  rate(http_requests_total[5m])


Проверить SQL-запрос, если данные идут из базы:

  SELECT AVG(value) FROM metrics WHERE time > now() - interval '1 hour';


🟠Проблема с кластером (узлы не отвечают)
Один или несколько узлов в кластере недоступны. DNS или балансировщик не может найти сервис.
Посмотреть статус узлов:

  kubectl get nodes


Проверить доступность сервиса в кластере:

  kubectl get pods -n monitoring


🟠Проблема с сетью (файрвол, маршрутизация)
Запросы блокируются файрволом (iptables, firewalld). Метрика приходит с другого узла, но между ними нет связи.
Проверить сетевые правила:

  iptables -L -n | grep DROP


Проверить соединение между узлами:

  nc -zv service-ip port


Ставь 👍 и забирай 📚 Базу знаний
Please open Telegram to view this post
VIEW IN TELEGRAM
💊3🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🤔 Разница между SQS и MSK в AWS?

- SQS (Simple Queue Service) — очередь сообщений, проста в использовании, полностью управляется AWS. Поддерживает:
- FIFO и стандартные очереди.
- Не гарантирует точно один раз доставку в стандартном режиме.
- MSK (Managed Streaming for Apache Kafka) — стриминговая платформа, аналог Kafka:
- Позволяет обрабатывать большие потоки данных.
- Сложнее, но более гибко.
SQS — простота, MSK — мощность и контроль.


Ставь 👍 если знал ответ, 🔥 если нет
Забирай 📚 Базу знаний
Please open Telegram to view this post
VIEW IN TELEGRAM