Production Kubernetes Logging-VictoriaLogs
В этой статье разбирают сбор логов Kubernetes (EKS) в VictoriaLogs.
❗️статья на medium.com
В этой статье разбирают сбор логов Kubernetes (EKS) в VictoriaLogs.
❗️статья на medium.com
👍4🔥4
Why I recommend native Prometheus instrumentation over OpenTelemetry
Учитывая хайп вокруг OpenTelemetry, у желающих замониторить свои приложения может возникнуть соблазн использовать OpenTelemetry и его SDK для всех задач инструментирования. Однако, когда дело доходит до генерации метрик в Prometheus, стоит дважды подумать, прежде чем полностью довериться OTel. Вы рискуете не только отказаться от некоторых основных функций, которые делают Prometheus системой мониторинга, но и столкнуться с неудобными проблемами преобразования метрик и обхода их, а также с другими недостатками и сложностями. Именно поэтому автор этой статьи рекомендует использовать собственные клиентские библиотеки инструментирования Prometheus вместо SDK OTel, если нужно получить наилучший опыт мониторинга Prometheus. В этой статье рассмотрены причины такого подхода.
Учитывая хайп вокруг OpenTelemetry, у желающих замониторить свои приложения может возникнуть соблазн использовать OpenTelemetry и его SDK для всех задач инструментирования. Однако, когда дело доходит до генерации метрик в Prometheus, стоит дважды подумать, прежде чем полностью довериться OTel. Вы рискуете не только отказаться от некоторых основных функций, которые делают Prometheus системой мониторинга, но и столкнуться с неудобными проблемами преобразования метрик и обхода их, а также с другими недостатками и сложностями. Именно поэтому автор этой статьи рекомендует использовать собственные клиентские библиотеки инструментирования Prometheus вместо SDK OTel, если нужно получить наилучший опыт мониторинга Prometheus. В этой статье рассмотрены причины такого подхода.
🔥3👍2❤1
Как развернуть простой Kubernetes-кластер с VictoriaMetrics? Пособие для начинающих
Развертывание Kubernetes-кластера и системы мониторинга часто воспринимается как сложная задача, которая требует глубоких знаний и значительных временных затрат. Однако современные инструменты автоматизации позволяют существенно упростить этот процесс, поэтому разобраться смогут и начинающие специалисты.
В этой статье мы подробно рассмотрено, как с помощью Kubespray быстро и эффективно развернуть работоспособный Kubernetes-кластер, а также интегрировать с ним систему мониторинга VictoriaMetrics. Этот подход особенно полезен, когда необходимо оперативно создать тестовое окружение или подготовить базовую инфраструктуру для дальнейшего развития. Читать дальше.
Развертывание Kubernetes-кластера и системы мониторинга часто воспринимается как сложная задача, которая требует глубоких знаний и значительных временных затрат. Однако современные инструменты автоматизации позволяют существенно упростить этот процесс, поэтому разобраться смогут и начинающие специалисты.
В этой статье мы подробно рассмотрено, как с помощью Kubespray быстро и эффективно развернуть работоспособный Kubernetes-кластер, а также интегрировать с ним систему мониторинга VictoriaMetrics. Этот подход особенно полезен, когда необходимо оперативно создать тестовое окружение или подготовить базовую инфраструктуру для дальнейшего развития. Читать дальше.
👎6👍3🔥1
How to use SQL to learn more about your Grafana usage
Grafana использует базу данных для хранения всех своих объектов: пользователи, дашборды и даже источники данных. Каждый раз, когда пользователь создаёт дашборд, в базе данных создаётся новая строка. Эта база данных поддерживает всё в Grafana, что делает её настоящим кладезем информации.
В статье рассказано как использовать этот источник информации для получении данных об использовании Grafana.
Grafana использует базу данных для хранения всех своих объектов: пользователи, дашборды и даже источники данных. Каждый раз, когда пользователь создаёт дашборд, в базе данных создаётся новая строка. Эта база данных поддерживает всё в Grafana, что делает её настоящим кладезем информации.
В статье рассказано как использовать этот источник информации для получении данных об использовании Grafana.
👍5🔥3
VictoriaLogs Practical Ingestion Guide for Message, Time and Streams
Эта статья в блоге VM поможет быстро разобраться в основных концепциях VictoriaLogs. В ней рассматриваются важные сведения из документации, а также распространённые случаи, выявленные в ходе устранения неполадок в реальных ситуациях.
Эта статья в блоге VM поможет быстро разобраться в основных концепциях VictoriaLogs. В ней рассматриваются важные сведения из документации, а также распространённые случаи, выявленные в ходе устранения неполадок в реальных ситуациях.
🔥3👍2👎1
19 августа состоится первый в истории онлайн-митап Zabbix в Казахстане!
Поговорим про планы Zabbix на будущее, траблшутинг проблем, мониторинг сервисов и об опыте построения SLA в банке.
Регистрация
Поговорим про планы Zabbix на будущее, траблшутинг проблем, мониторинг сервисов и об опыте построения SLA в банке.
Регистрация
🔥9👍4👎2🤔2
coroot
Инструмент наблюдаемости с открытым исходным кодом. Coroot превращает метрики, логи и трассировки в аналитические данные и строит карту сервисов.
Возможности
🚀 Наблюдаемость zero-instrumentation
🚀 Метрики, журналы и трассировки собираются автоматически с помощью eBPF
🚀 Coroot предоставляет вам карту сервисов, которая охватывает 100% приложения
🚀 Предустановленные проверки выполняют сбор данных по каждому приложению без какой-либо настройки
Репыч на Гитхабе
Лайв-демо
Сравнение версий (коммьюнити бесплатна навсегда)
Инструмент наблюдаемости с открытым исходным кодом. Coroot превращает метрики, логи и трассировки в аналитические данные и строит карту сервисов.
Возможности
🚀 Наблюдаемость zero-instrumentation
🚀 Метрики, журналы и трассировки собираются автоматически с помощью eBPF
🚀 Coroot предоставляет вам карту сервисов, которая охватывает 100% приложения
🚀 Предустановленные проверки выполняют сбор данных по каждому приложению без какой-либо настройки
Репыч на Гитхабе
Лайв-демо
Сравнение версий (коммьюнити бесплатна навсегда)
🔥9❤4👍3👎1
Kubernetes Monitoring — полное руководство
Это цикл из 10 статей, который объясняет принципы мониторинга кубера по всем канонам наблюдаемости.
Part 1: Architecture
Part 2: Instrumentation, Telemetry, Dashboarding, and Alerting
Part 3: Metrics using the victoria-metrics-k8s-stack
Part 4: Automatically extracting etcd certificates into a secret in Talos with VictoriaMetrics
Part 5: VictoriaMetrics Operator
Part 6: Visualizing with Grafana
Part 7: Alerting
Part 8: Logging with VictoriaLogs
Part 9: Talos Linux System Logs with VictoriaLogs and Vector
Part 10: Kubernetes Event Logging to VictoriaLogs
Сохраняйте в закладки!
❗️Цикл статей опубликован на платформе medium.com
@monitorim_it
Это цикл из 10 статей, который объясняет принципы мониторинга кубера по всем канонам наблюдаемости.
Part 1: Architecture
Part 2: Instrumentation, Telemetry, Dashboarding, and Alerting
Part 3: Metrics using the victoria-metrics-k8s-stack
Part 4: Automatically extracting etcd certificates into a secret in Talos with VictoriaMetrics
Part 5: VictoriaMetrics Operator
Part 6: Visualizing with Grafana
Part 7: Alerting
Part 8: Logging with VictoriaLogs
Part 9: Talos Linux System Logs with VictoriaLogs and Vector
Part 10: Kubernetes Event Logging to VictoriaLogs
Сохраняйте в закладки!
❗️Цикл статей опубликован на платформе medium.com
@monitorim_it
🔥13👍6❤3
Observability at Scale with ClickStack
Приходите 27 августа на вебинар-воркшоп по ClickStack. На этом практическом занятии вы развернуте полноценный стек решений для наблюдения с использованием ClickHouse, OpenTelemetry и HyperDX, будете собирать и сопоставлять журналы, метрики и данные приложений, а также изучать эффективные методы запросов с использованием синтаксиса SQL и Lucene в пользовательском интерфейсе.
Приходите 27 августа на вебинар-воркшоп по ClickStack. На этом практическом занятии вы развернуте полноценный стек решений для наблюдения с использованием ClickHouse, OpenTelemetry и HyperDX, будете собирать и сопоставлять журналы, метрики и данные приложений, а также изучать эффективные методы запросов с использованием синтаксиса SQL и Lucene в пользовательском интерфейсе.
ClickHouse
Observability at Scale with ClickStack
In this 2-hour, instructor-led workshop, you will deploy a complete observability stack using ClickHouse, OpenTelemetry, and HyperDX. You’ll ingest and correlate logs, metrics, and application data, and explore powerful querying techniques through both SQ
👍3🔥2👎1
Why Alert Fatigue is a Major Challenge in Observability
В этом видео Марк Чипурас (руководитель новых продуктов Grafana Labs) разбирает основные принципы работы с усталостью от событий и рассказывает как Grafana помогает бороться с этим явлением.
В этом видео Марк Чипурас (руководитель новых продуктов Grafana Labs) разбирает основные принципы работы с усталостью от событий и рассказывает как Grafana помогает бороться с этим явлением.
👍5🔥3
Автор этих статей задумывался по поводу смены ОС на Arch Linux, но отложил эту затею в долгий ящик. Смотрел различные ролики на YouTube и заметил, что многие пользователи ставят себе Polybar, в котором можно легко настраивать информацию, выводимую на нечто похожее на Панель задач в Windows. Тогда он подумал "А почему бы не сделать такое в винде?!" и сразу начал гуглить что к чему. Попытался найти готовые аналоги, но ничего не впечатлило, поэтому решил написать свою программу на C++.
Мониторинг CPU и RAM на панели задач C++
Мониторинг CPU + RAM в трее. Часть 2
Мониторинг CPU и RAM на панели задач C++
Мониторинг CPU + RAM в трее. Часть 2
👍6🔥2🤔1
What's new in ClickStack. August '25
Каждый месяц разработчики ClickStack делятся последними обновлениями по всему стеку. В августе был добавлен облачный HyperDX, более интеллектуальный поиск, динамическая визуализация, новые SQL-функции и поддержка инвертированных индексов в ClickHouse, что делает наблюдение в ClickHouse быстрее, понятнее и мощнее. Подробнее в блоге.
Каждый месяц разработчики ClickStack делятся последними обновлениями по всему стеку. В августе был добавлен облачный HyperDX, более интеллектуальный поиск, динамическая визуализация, новые SQL-функции и поддержка инвертированных индексов в ClickHouse, что делает наблюдение в ClickHouse быстрее, понятнее и мощнее. Подробнее в блоге.
🔥3👍1
Monitoring FastAPI with Grafana + Prometheus: A 5-Minute Guide
В этой статье рассмотрено как отслеживать работу приложения Python FastAPI с помощью Prometheus и Grafana, работающих локально с Docker Compose. В результате у вас будет дашборд, отображающий частоту запросов, задержку и использование системных ресурсов — все это будет работать локально с помощью Docker Compose. Читать дальше.
❗️Статья на medium.com
В этой статье рассмотрено как отслеживать работу приложения Python FastAPI с помощью Prometheus и Grafana, работающих локально с Docker Compose. В результате у вас будет дашборд, отображающий частоту запросов, задержку и использование системных ресурсов — все это будет работать локально с помощью Docker Compose. Читать дальше.
❗️Статья на medium.com
👍7🔥1
Gonzo
Мощный терминальный клиент для анализа логов в реальном времени, вдохновлённый k9s. Вы сможете анализировать потоки логов с помощью красивых диаграмм, аналитики на основе ИИ и расширенной фильтрации — всё прямо в терминале.
Репыч на Гитхабе
@monitorim_it
Мощный терминальный клиент для анализа логов в реальном времени, вдохновлённый k9s. Вы сможете анализировать потоки логов с помощью красивых диаграмм, аналитики на основе ИИ и расширенной фильтрации — всё прямо в терминале.
Репыч на Гитхабе
@monitorim_it
👍10🔥5❤2
Alerting Best Practices
Алерт подобен звонку в дверь: требует немедленного внимания, отрывая от всего остального. Он требует сосредоточенности и быстрой реакции.
Представьте, что вы живёте в квартире, где дверной звонок звонит без умолку. Вы можете надеть беруши, чтобы заглушить шум, но это лишь замаскирует проблему, а не решит её.
С другой стороны, полное отключение дверного звонка тоже не выход. Вам всё равно хочется знать, когда прибудет ваша еда или посылка.
Дверной звонок, который всегда молчит или постоянно звонит, одинаково бесполезен. Цель — найти правильный баланс, различая, что действительно важно, а что нет.
В этой статье в блоге VM рассматриваются хорошие практики настройки правил оповещения.
Алерт подобен звонку в дверь: требует немедленного внимания, отрывая от всего остального. Он требует сосредоточенности и быстрой реакции.
Представьте, что вы живёте в квартире, где дверной звонок звонит без умолку. Вы можете надеть беруши, чтобы заглушить шум, но это лишь замаскирует проблему, а не решит её.
С другой стороны, полное отключение дверного звонка тоже не выход. Вам всё равно хочется знать, когда прибудет ваша еда или посылка.
Дверной звонок, который всегда молчит или постоянно звонит, одинаково бесполезен. Цель — найти правильный баланс, различая, что действительно важно, а что нет.
В этой статье в блоге VM рассматриваются хорошие практики настройки правил оповещения.
❤9👍4🔥1
Мониторинг Kubernetes с помощью ClickStack
В этом видео рассматривается мониторинг Kubernetes с помощью ClickStack, а также показан процесс: от развёртывания ClickStack с помощью Helm до настройки сбора данных и изучения пользовательского интерфейса HyperDX. А ещё вы увидите как настроить сбор метрик Kubernetes с помощью OpenTelemetry, что даст полное представление о производительности кластера.
В этом видео рассматривается мониторинг Kubernetes с помощью ClickStack, а также показан процесс: от развёртывания ClickStack с помощью Helm до настройки сбора данных и изучения пользовательского интерфейса HyperDX. А ещё вы увидите как настроить сбор метрик Kubernetes с помощью OpenTelemetry, что даст полное представление о производительности кластера.
🔥4👍2
Как я перестал бояться алертов и полюбил дежурства
Статья о том, как причесать мониторинг, чтобы он не отвлекал по пустякам. Опыт автора.
Это вторая часть. Первая была Как я перестал тушить пожары и начал говорить с бизнесом на языке SLO.
Статья о том, как причесать мониторинг, чтобы он не отвлекал по пустякам. Опыт автора.
Это вторая часть. Первая была Как я перестал тушить пожары и начал говорить с бизнесом на языке SLO.
🔥9👍3
VictoriaLogs: What if logs management became simple and performant?
В то время как метрики позволяют наблюдать за развитием событий с течением времени, а трассировки позволяют отслеживать перемещение запроса платформе, логи предоставляют подробный контекст , важный для понимания событий. Статья о том как приручить VicrtoriaLogs.
В то время как метрики позволяют наблюдать за развитием событий с течением времени, а трассировки позволяют отслеживать перемещение запроса платформе, логи предоставляют подробный контекст , важный для понимания событий. Статья о том как приручить VicrtoriaLogs.
🔥7👍2
How should Prometheus handle OpenTelemetry resource attributes?
В OpenTelemetry (OTel) есть так называемые атрибуты ресурсов , которые представляют собой дополнительную информацию об источнике метрики, например, о службе, хосте или среде, которые ее сгенерировали.
Prometheus, будучи базой данных временных рядов, использует метки для идентификации и запроса метрик. Преобразование атрибутов ресурсов в метки может привести к так называемому «взрыву метрик», то есть к созданию слишком большого количества уникальных комбинаций, которые перегружают систему. Обычно это происходит, если атрибуты часто меняются или содержат много уникальных значений, таких как идентификаторы пользователей или имена подов. Подробнее о способах решения этой проблемы в статье в блоге Grafana.
В OpenTelemetry (OTel) есть так называемые атрибуты ресурсов , которые представляют собой дополнительную информацию об источнике метрики, например, о службе, хосте или среде, которые ее сгенерировали.
Prometheus, будучи базой данных временных рядов, использует метки для идентификации и запроса метрик. Преобразование атрибутов ресурсов в метки может привести к так называемому «взрыву метрик», то есть к созданию слишком большого количества уникальных комбинаций, которые перегружают систему. Обычно это происходит, если атрибуты часто меняются или содержат много уникальных значений, таких как идентификаторы пользователей или имена подов. Подробнее о способах решения этой проблемы в статье в блоге Grafana.
👍2❤1🔥1
Как мониторить сотни инстансов PostgreSQL и не сойти с ума
Если вы инженер в крупной компании, а особенно если ваша организация поставляет свои услуги в виде SaaS-решений, то вам так или иначе придется решать задачу мониторинга работы всех ваших баз PostgreSQL. На них часто бывает завязан функционал, важный для компании с точки зрения финансовых рисков, поэтому крайне желательно организовать не только мониторинг, но и получение уведомлений, когда что-то идет не по плану (или пойдет в ближайшем будущем). В этой статье рассмотрено несколько способов, как это можно сделать:
🚀 «Все сам» на Prometheus + Grafana (странно, что в списке нет Zabbix)
🚀 Готовые решения open-source (как ни странно это Percona Monitoring and Management и pgAdmin 4)
🚀 Платные решения (pganalyze, Tantor (это авторы этой статьи, поэтому странно, если бы их не было в этом списке)
✍️ Напишите в комментах, что вы используете для мониторинга ваших экземпляров PostgreSQL.
Если вы инженер в крупной компании, а особенно если ваша организация поставляет свои услуги в виде SaaS-решений, то вам так или иначе придется решать задачу мониторинга работы всех ваших баз PostgreSQL. На них часто бывает завязан функционал, важный для компании с точки зрения финансовых рисков, поэтому крайне желательно организовать не только мониторинг, но и получение уведомлений, когда что-то идет не по плану (или пойдет в ближайшем будущем). В этой статье рассмотрено несколько способов, как это можно сделать:
🚀 «Все сам» на Prometheus + Grafana (странно, что в списке нет Zabbix)
🚀 Готовые решения open-source (как ни странно это Percona Monitoring and Management и pgAdmin 4)
🚀 Платные решения (pganalyze, Tantor (это авторы этой статьи, поэтому странно, если бы их не было в этом списке)
✍️ Напишите в комментах, что вы используете для мониторинга ваших экземпляров PostgreSQL.
👍4🔥2