Мониторим ИТ
8.14K subscribers
230 photos
2 files
1.57K links
Канал о наблюдаемости (Monitoring & Observability): логи, трейсы, метрики.

Реклама: @gals_ad_bot
Вопросы: @antoniusfirst

@usr_bin_linux — Linux, Kubernetes, Docker, Terraform, etc.

@zabbix_ru — только Zabbix

@elasticstack_ru — ElasticSearch/OpenSearch
Download Telegram
Linux — How to Evaluate Network Performance?

Полезные инструменты для бенчмаркинга сетевой части Linux. Медиум.
На Ютубе есть интересный канал, посвящённый Заббикс. Это канал Дмитрия Ламберта - руководителя группы технической поддержки из Заббикс. Там регулярно выходят видосы с полезными лайфхаками относительно Заббикс.

Ссылка на канал.
Monitor Nginx Metrics with GrafanaDR: A Step-by-Step Guide

Let’s imagine that you have a small project where not everything (or nothing) is containerized. Therefore orchestration, convenient Loki, and other tools for monitoring and analytics of requests are not used (but if I missed something, you can correct it in the comments). Читать дальше.
Новый шаблон от Zabbix для Proxmox

Скачать
What makes VictoriaMetrics the next leading choice for open-source monitoring

After researching a few solutions like Thanos, Cortex, Grafana-Mimir, and VictoriaMetrics. It’s clear to say that in my opinion, VictoriaMetrics is the winner and the best fit for my purposes & needs. Читать дальше.
6 Metrics to Watch for on Your K8s Cluster

We’ll be covering the most critical metrics based on k8s’s metadata which form a good baseline for monitoring your workloads and making sure they’re in a healthy state. Читать дальше.
Запуск облачного стека мониторинга с использованием нескольких ЦОДов

Когда я общаюсь с клиентами, они рассказывают мне о том, что их приложения работают в двух центрах обработки данных, но при более детальном изучении оказывается, что их стек наблюдения доступен только в одном из них.

Это знание, как откровение, снизошло на многих в марте 2021 года. Один из крупнейших европейских провайдеров облачных услуг (OVHcloud) пережил масштабный пожар в одном из своих дата-центров, что вызвало серьезные перебои в работе даже таких крупных клиентов, как правительство Франции.

На следующий день после инцидента мой коллега, отвечающий за управление качеством, спросил меня, сможем ли мы выдержать подобную катастрофу. Это побудило меня задуматься о превращении нашего единого стека мониторинга в стек высокой доступности, работающего на базе нескольких центров обработки данных. Читать дальше.
Кастомизируем дашборды в Grafana для инженеров по холодоснабжению ЦОДа

Система мониторинга инженерной инфраструктуры – это нервная система дата-центра. С ее помощью инженеры вовремя видят неприятные симптомы на графиках и предотвращают проблемы в работе кондиционеров, бесперебойников, сетевых устройств и других элементов инженерных систем. В этой статье расскажем, как и для каких задач наши инженеры создают кастомные дашборды с помощью графического плагина FlowCharting для Grafana.Читать дальше.
Серия постов по траблшутингу производительности Linux

Linux troubleshooting: CPU analysis

Linux troubleshooting: Memory analysis

Linux troubleshooting: Disk analysis
Data Manipulation panel plugin for Grafana

Working on a commercial project, we created a data manipulation panel plugin that can be used to insert, update application data, and modify configuration directly from your Grafana dashboard. Читать дальше.
SRE - Difference Between SLAs, SLOs and SLIs

Пришло время разобраться, если ещё не. На Медиум!
Парочка статей по сетевому мониторингу

Network diagnostics with mtr

Monitoring network connections with ss
GoAlert

Расскажите, а кто-то использует в работе этот инструмент для графика дежурств, цепочек эскалации и нотификаций? Как вам?

Ссылка на проект.
Новый шаблон Zabbix для HP MSA 2040/2060 и Primera. Совместим с Zabbix 6.0 и не использует внешних скриптов.

Репозиторий
How to collect Prometheus metrics with the OpenTelemetry Collector and Grafana

OpenTelemetry is a set of APIs, SDKs, tooling, and integrations that are designed for the creation and management of telemetry data such as traces, metrics, and logs. Читать дальше.
Галс Софтвэр приглашает на курс по Elastic Stack 8, который состоится уже через месяц — 20-22 июля.

За 3 дня вы узнаете, как устроена и работает новая версия одного из популярных инструментов для аналитики и хранения неструктурированных данных.

Elastic Stack — комплексное решение, состоящее из нескольких компонентов: Elasticsearch, Kibana, Logstash и Beats. Изучение документации по каждому из компонентов и их взаимодействии на сайте вендора может отнять немало времени. Не лучший вариант, если нужно приступать к работе с решением уже вчера. Мы предлагаем освоить основные принципы в теории и на практике за 3 дня. После обучения работа с документацией будет сводиться к поиску только нужной информации, вместо её изучения от и до.

На лабораторной работе мы установим отказоустойчивый кластер Elasticsearch 8, научимся разбирать лог-файлы, настроим безопасность, оповещения в телегу, поработаем с ILM и SLM.

👉 Подробнее о курсе и заявка на обучение

Задать вопросы о курсе можно @galssoftware

Мы ведём канал об Elastic @elasticstack_ru
Учим zabbix-agent «есть» на ходу и не давиться пользовательскими параметрами (UserParameter)

Интересная статья об унификации UserParameter в конфигурации Zabbix Agent. На Хабр!
A set of modern Grafana dashboards for Kubernetes

In this article, I will present a set of modern Grafana dashboards I made for Kubernetes, explain why I decided to create them and how they work. Читать дальше на Медиуме.