Мониторим ИТ
8.14K subscribers
232 photos
2 files
1.57K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Кастомизируем дашборды в Grafana для инженеров по холодоснабжению ЦОДа

Система мониторинга инженерной инфраструктуры – это нервная система дата-центра. С ее помощью инженеры вовремя видят неприятные симптомы на графиках и предотвращают проблемы в работе кондиционеров, бесперебойников, сетевых устройств и других элементов инженерных систем. В этой статье расскажем, как и для каких задач наши инженеры создают кастомные дашборды с помощью графического плагина FlowCharting для Grafana.Читать дальше.
Серия постов по траблшутингу производительности Linux

Linux troubleshooting: CPU analysis

Linux troubleshooting: Memory analysis

Linux troubleshooting: Disk analysis
Data Manipulation panel plugin for Grafana

Working on a commercial project, we created a data manipulation panel plugin that can be used to insert, update application data, and modify configuration directly from your Grafana dashboard. Читать дальше.
SRE - Difference Between SLAs, SLOs and SLIs

Пришло время разобраться, если ещё не. На Медиум!
Парочка статей по сетевому мониторингу

Network diagnostics with mtr

Monitoring network connections with ss
GoAlert

Расскажите, а кто-то использует в работе этот инструмент для графика дежурств, цепочек эскалации и нотификаций? Как вам?

Ссылка на проект.
Новый шаблон Zabbix для HP MSA 2040/2060 и Primera. Совместим с Zabbix 6.0 и не использует внешних скриптов.

Репозиторий
How to collect Prometheus metrics with the OpenTelemetry Collector and Grafana

OpenTelemetry is a set of APIs, SDKs, tooling, and integrations that are designed for the creation and management of telemetry data such as traces, metrics, and logs. Читать дальше.
Галс Софтвэр приглашает на курс по Elastic Stack 8, который состоится уже через месяц — 20-22 июля.

За 3 дня вы узнаете, как устроена и работает новая версия одного из популярных инструментов для аналитики и хранения неструктурированных данных.

Elastic Stack — комплексное решение, состоящее из нескольких компонентов: Elasticsearch, Kibana, Logstash и Beats. Изучение документации по каждому из компонентов и их взаимодействии на сайте вендора может отнять немало времени. Не лучший вариант, если нужно приступать к работе с решением уже вчера. Мы предлагаем освоить основные принципы в теории и на практике за 3 дня. После обучения работа с документацией будет сводиться к поиску только нужной информации, вместо её изучения от и до.

На лабораторной работе мы установим отказоустойчивый кластер Elasticsearch 8, научимся разбирать лог-файлы, настроим безопасность, оповещения в телегу, поработаем с ILM и SLM.

👉 Подробнее о курсе и заявка на обучение

Задать вопросы о курсе можно @galssoftware

Мы ведём канал об Elastic @elasticstack_ru
Учим zabbix-agent «есть» на ходу и не давиться пользовательскими параметрами (UserParameter)

Интересная статья об унификации UserParameter в конфигурации Zabbix Agent. На Хабр!
A set of modern Grafana dashboards for Kubernetes

In this article, I will present a set of modern Grafana dashboards I made for Kubernetes, explain why I decided to create them and how they work. Читать дальше на Медиуме.
Why is the Prometheus Agent Mode So Great?

Пользуетесь Prometheus Agent? Небольшая статья о нем.
👍1
Monitor Ansible Playbook Executions

I planned to use an ansible, a configuration management tool, in a production system. When it comes to the production system, it is important to know which configurations are applied successfully and which aren’t.

After spending some time on the internet, I couldn’t find an easy way to monitor failed execution. Hence I come up with this solution.

Читать дальше на Медиуме.
На днях уже писал про Grafana OnCall, который теперь стал полностью открытым. Среди его функционала есть цепочки эскалации, графики дежурств и вообще он крайне удобен для управления алертами. В этой инструкции вы узнаете как настроить интеграцию Zabbix и Grafana OnCall.
Grafana dashboards: A complete guide to all the different types you can build

В этой небольшой статье бэстпрэктис по организации дашбордов в Grafana. Многое читатели этого канала, конечно, знают, но, возможно, будет что-то новое. Читать статью.
Logging Bash History via Promtail, Loki and Grafana

Когда очень нужно знать кто безобразничал. Читать дальше.
Monitor Server with Telegram Bot and Python

Рубрика "Работает и ладно". Наколенный мониторинг из сами понимаете чего: Telegram и Python. Читать как это сделать.