Мониторим ИТ
8.2K subscribers
242 photos
2 files
1.58K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Cron Monitoring — exploring Open Source Softwares

We at Trell have started implementing monitoring on all the Cron Jobs in our ecosystem. It lets us keep account of all the Cron Jobs under various projects which are present. Читать дальше.
Grafana: How to export graphs as images and email them

Grafana is one of the most used dashboarding and alerting tools, it has many features but recently i noticed that lacked the capability to send graphs as emails in a scheduled manner. Читать дальше.
Couchbase Grafana Monitoring in Trendyol

Couchbase is one of the NoSQL database technologies used in Trendyol. So it is crucial to have well-rounded monitoring. However, before we dive into the monitoring, let’s look at our clusters. Читать дальше.
Tracing Node.js application with OpenTelemetry & Jaeger UI

In this tutorial I will demonstrate how to trace and instrument Node.js application with OpenTelemetry. Читать дальше.
Announcing Grafana Mimir, the most scalable open source TSDB in the world

Yet another TSDB. Сегодня анонсировали Grafana Mimir, которая, как предполагается, будет альтернативой Cortex или Thanos. Подробнее по ссылке.
Что нового в плане мониторинга в PostgreSQL (Алексей Лесовский)

Расшифровка доклада Алексея Лесовского про то, что нового есть в PostgreSQL в плане мониторинга. Читать на Хабре.
How to reduce your Prometheus cost

Пишут как снизили количество инжестируемых метрик в Prometheus. Читать на Медиуме.
How Prometheus Operator facilitates Prometheus configuration updates

The goal: Update Prometheus configuration nicely! Читать дальше на Медиуме.
Using Environment Variables for Configuration, Provisioning, and Dashboards in Grafana

The number of use cases operating Grafana as a platform to build modern applications is increasing. Compared to a single central Grafana instance, we are looking at multiple distributed installations with new kinds of data sources. Читать дальше на Медиуме.
Обход аутентификации и способы выполнения произвольного кода в ZABBIX

В этой статье мы поговорим о некоторых атаках на систему мониторинга Zabbix и рассмотрим сценарии удаленного выполнения кода (RCE). Дальше на Хабре.
Grafana и автотесты: учимся измерять работу тестов

Grafana позволяет собрать на одном экране разную информацию:
⚡️результаты тестов в режиме реального времени,
⚡️срезы по окружениям, браузерам и чему угодно ещё,
⚡️скорость выполнения тестов,
⚡️покрытие тестами страниц и действий на них,
⚡️результаты релизов.

На примерах тестов вы узнаете, как Grafana помогает в анализе результатов автотестирования, чтобы точнее понимать, что происходит. Читать дальше на Хабре.
Installing Grafana plugins from a Private repository

Grafana Marketplace application is one of our favorite features introduced in Grafana 8. It allows installing registered plugins from the official Grafana repository when connected to the Internet, but how to upgrade and manage Grafana plugins without access to external network? Читать дальше.
How we scaled our new Prometheus TSDB Grafana Mimir to 1 billion active series

Полторы недели назад Grafana анонсировала собственную TSDB Mimir, и вот теперь рассказывает как они затестили Mimir с миллиардом серий данных.

Блог Grafana
How relabeling in Prometheus works

Relabeling is a powerful tool that allows you to classify and filter Prometheus targets and metrics by rewriting their label set. Блог Grafana.
How summary metrics work in Prometheus

A summary is a metric type in Prometheus that can be used to monitor latencies (or other distributions like request sizes). For example, when you monitor a REST endpoint you can use a summary and configure it to provide the 95th percentile of the latency. If that percentile is 120ms that means that 95% of the calls were faster than 120ms, and 5% were slower. Читать дальше.
How To Troubleshoot Slow Linux Servers

atop, free, ncdu, iotop и nethogs
5 Network Performance and Analysis Tools For Linux

iperf, tcpdump, hping, netstat и scapy
Упрощаем мониторинг и управление контейнерами Docker при помощи инструментов CLI

Dockly, Dive, Ctop, Dry, Lazy Docker, Poco, Sen и Skopeo.