Мониторим ИТ
7.7K subscribers
127 photos
1 video
2 files
1.41K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Observability at Scale with ClickStack

Приходите 27 августа на вебинар-воркшоп по ClickStack. На этом практическом занятии вы развернуте полноценный стек решений для наблюдения с использованием ClickHouse, OpenTelemetry и HyperDX, будете собирать и сопоставлять журналы, метрики и данные приложений, а также изучать эффективные методы запросов с использованием синтаксиса SQL и Lucene в пользовательском интерфейсе.
👍3🔥2👎1
Why Alert Fatigue is a Major Challenge in Observability

В этом видео Марк Чипурас (руководитель новых продуктов Grafana Labs) разбирает основные принципы работы с усталостью от событий и рассказывает как Grafana помогает бороться с этим явлением.
👍5🔥3
Автор этих статей задумывался по поводу смены ОС на Arch Linux, но отложил эту затею в долгий ящик. Смотрел различные ролики на YouTube и заметил, что многие пользователи ставят себе Polybar, в котором можно легко настраивать информацию, выводимую на нечто похожее на Панель задач в Windows. Тогда он подумал "А почему бы не сделать такое в винде?!" и сразу начал гуглить что к чему. Попытался найти готовые аналоги, но ничего не впечатлило, поэтому решил написать свою программу на C++.

Мониторинг CPU и RAM на панели задач C++


Мониторинг CPU + RAM в трее. Часть 2
👍6🔥2🤔1
What's new in ClickStack. August '25

Каждый месяц разработчики ClickStack делятся последними обновлениями по всему стеку. В августе был добавлен облачный HyperDX, более интеллектуальный поиск, динамическая визуализация, новые SQL-функции и поддержка инвертированных индексов в ClickHouse, что делает наблюдение в ClickHouse быстрее, понятнее и мощнее. Подробнее в блоге.
🔥3👍1
Monitoring FastAPI with Grafana + Prometheus: A 5-Minute Guide

В этой статье рассмотрено как отслеживать работу приложения Python FastAPI с помощью Prometheus и Grafana, работающих локально с Docker Compose. В результате у вас будет дашборд, отображающий частоту запросов, задержку и использование системных ресурсов — все это будет работать локально с помощью Docker Compose. Читать дальше.

❗️Статья на medium.com
👍7🔥1
🔥 «Орки тут» — бесплатный митап ЮMoney для DevOps-инженеров

Встречаемся в четверг, 28 августа, в 19:00 (мск) — приходите на митап в Санкт-Петербурге или подключайтесь онлайн.

Эксперты из ЮMoney расскажут, как работают над инфраструктурой:

🟣 Тайна замка ЮMoney: связность приложений через призму активного развития компании.
🟣 Внедрение Egress.
🟣 DevOps как следствие... деградации разработки.
🟣 Как из скрипта вырос продукт.

Зарегистрируйтесь, чтобы принять участие. Все подробности — на сайте митапа «Орки тут»
Please open Telegram to view this post
VIEW IN TELEGRAM
👎16👍4🔥1
Gonzo

Мощный терминальный клиент для анализа логов в реальном времени, вдохновлённый k9s. Вы сможете анализировать потоки логов с помощью красивых диаграмм, аналитики на основе ИИ и расширенной фильтрации — всё прямо в терминале.

Репыч на Гитхабе

@monitorim_it
👍10🔥52
Alerting Best Practices

Алерт подобен звонку в дверь: требует немедленного внимания, отрывая от всего остального. Он требует сосредоточенности и быстрой реакции.

Представьте, что вы живёте в квартире, где дверной звонок звонит без умолку. Вы можете надеть беруши, чтобы заглушить шум, но это лишь замаскирует проблему, а не решит её.

С другой стороны, полное отключение дверного звонка тоже не выход. Вам всё равно хочется знать, когда прибудет ваша еда или посылка.

Дверной звонок, который всегда молчит или постоянно звонит, одинаково бесполезен. Цель — найти правильный баланс, различая, что действительно важно, а что нет.

В этой статье в блоге VM рассматриваются хорошие практики настройки правил оповещения.
9👍4🔥1
Мониторинг Kubernetes с помощью ClickStack

В этом видео рассматривается мониторинг Kubernetes с помощью ClickStack, а также показан процесс: от развёртывания ClickStack с помощью Helm до настройки сбора данных и изучения пользовательского интерфейса HyperDX. А ещё вы увидите как настроить сбор метрик Kubernetes с помощью OpenTelemetry, что даст полное представление о производительности кластера.
🔥4👍2
Как я перестал бояться алертов и полюбил дежурства

Статья о том, как причесать мониторинг, чтобы он не отвлекал по пустякам. Опыт автора.

Это вторая часть. Первая была Как я перестал тушить пожары и начал говорить с бизнесом на языке SLO.
🔥9👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Топ-менеджеры российских компаний «прожарят» ИТ-тренды на пленарной сессии Orion Digital Day

Помните механику голосования звездного жюри в шоу «Голос»? А что, если голосовать будут звезды российского ИТ-рынка, и не за песни, а за технологические тренды — Zero Trust, FinOps и AI?

В похожем формате пройдет одна из пленарных сессий Orion Digital Day 2025 — ИТ-конференции от Orion soft, создавших платформу виртуализации zVirt. Участники вместе с аудиторией проголосуют «верю/не верю», разбирая самые громкие технологические тренды года.

Мы не только «прожарим» ИТ-тренды, но и замерим боль ИТ-директоров на круглом столе в формате телеигры «Сто к одному».

Вам нужны еще причины зарегистрироваться?

📍Спикеры C-level из red_mad_robot, «Газпром нефти», СберСтрахования, Алроса и других топовых ИТ-компаний, промышленности и финансового сектора.

📍Технологические митапы с разбором результатов внедрения инфраструктурного ПО, live-демо и лаборатории для самостоятельного тестирования.

🔥 И все это — в антураже гоночного шоу: дорогие спорткары, гоночные симуляторы и музыкальное шоу в завершение вечера.

📌Регистрируйтесь и зовите коллег — им точно зайдет.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎82🔥2👍1
VictoriaLogs: What if logs management became simple and performant?

В то время как метрики позволяют наблюдать за развитием событий с течением времени, а трассировки позволяют отслеживать перемещение запроса платформе, логи предоставляют подробный контекст , важный для понимания событий. Статья о том как приручить VicrtoriaLogs.
🔥7👍2
How should Prometheus handle OpenTelemetry resource attributes?

В OpenTelemetry (OTel) есть так называемые атрибуты ресурсов , которые представляют собой дополнительную информацию об источнике метрики, например, о службе, хосте или среде, которые ее сгенерировали.

Prometheus, будучи базой данных временных рядов, использует метки для идентификации и запроса метрик. Преобразование атрибутов ресурсов в метки может привести к так называемому «взрыву метрик», то есть к созданию слишком большого количества уникальных комбинаций, которые перегружают систему. Обычно это происходит, если атрибуты часто меняются или содержат много уникальных значений, таких как идентификаторы пользователей или имена подов. Подробнее о способах решения этой проблемы в статье в блоге Grafana.
👍2🔥2
🕕 В этом сообщении 775 знаков. 60 лет назад для его обработки требовались мощности, способные разместиться только в целом здании — Главном вычислительном центре Госплана. Сегодня даже в вашем смартфоне больше оперативной памяти и возможностей для работы с данными.

Проследить, как менялась материальная архитектура наравне с архитектурой цифровой и какую роль в этом сыграли инженеры, можно на экскурсии «Вычисляя архитектуру» 😊

Эта коллаборация компаний YADRO и «Глазами инженера» — отличный шанс изучить центр Москвы с точки зрения проектировщика, а не обывателя. Опытный гид расскажет, как инженерные идеи авангардистов стали художественными манифестами, а бетон — средством коммуникации.

💙 Узнать о коллаборации больше и купить билеты на сентябрьские экскурсии можно по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3👎2
Онлайн-митап честных кейсов по сетевой безопасности
⌛️16 сентября в 15:00

Надоело слушать рассказы о фичах?
🔗 Присоединяйтесь ко второму митапу от Positive Technologies, где специалисты по ИБ поделятся честным опытом работы с PT Sandbox и PT NAD.

В программе
🔴 Реальные кейсы обнаружения угроз
🔴 Сценарии использования песочницы и системы поведенческого анализа трафика
🔴 Синергия PT NAD и PT Sandbox для максимальной защиты

Будет интересно всем, кто занимается сетевой безопасностью, уже использует или только планирует внедрять продукты Positive Technologies.

Регистрируйтесь, чтобы узнать много технических деталей и практических инсайтов!
👍2
Как мониторить сотни инстансов PostgreSQL и не сойти с ума

Если вы инженер в крупной компании, а особенно если ваша организация поставляет свои услуги в виде SaaS-решений, то вам так или иначе придется решать задачу мониторинга работы всех ваших баз PostgreSQL. На них часто бывает завязан функционал, важный для компании с точки зрения финансовых рисков, поэтому крайне желательно организовать не только мониторинг, но и получение уведомлений, когда что-то идет не по плану (или пойдет в ближайшем будущем). В этой статье рассмотрено несколько способов, как это можно сделать:

🚀 «Все сам» на Prometheus + Grafana (странно, что в списке нет Zabbix)

🚀 Готовые решения open-source (как ни странно это Percona Monitoring and Management и pgAdmin 4)

🚀 Платные решения (pganalyze, Tantor (это авторы этой статьи, поэтому странно, если бы их не было в этом списке)


✍️ Напишите в комментах, что вы используете для мониторинга ваших экземпляров PostgreSQL.
👍4🔥1
Why VictoriaMetrics? A Practical Guide to Scalable and Faster Monitoring Than Prometheus

Если вы используете Prometheus для мониторинга и сталкиваетесь с проблемой высокого использования оперативной памяти, больших объемов данных, проблемами масштабируемости и низкой скоростью запросов , пришло время прочитать эту статью и рассмотреть возможность использования VictoriaMetrics.

✍️ Напишите в комментах какие проблемы испытываете с Prometheus и есть ли в планах миграция на другое решение.

❗️статья на medium.com
2
Мониторинг PostgreSQL в Zabbix

🚀 О чём этот урок?
PostgreSQL — надёжная и мощная СУБД, но без грамотного мониторинга она может преподнести неприятные сюрпризы. На этом уроке мы разберём, как выстроить мониторинг PostgreSQL в Zabbix так, чтобы вовремя замечать проблемы и поддерживать стабильность работы кластера.

Погрузимся в архитектуру PostgreSQL, рассмотрим ключевые метрики и процессы, влияющие на производительность, а также разберём, как отслеживать реплики и контролировать состояние бэкапов.

🎯 Что вы получите:
- Чёткое понимание, как организовать мониторинг PostgreSQL через Zabbix
- Навык настройки метрик и алертов для стабильной работы кластера
- Практику по отслеживанию репликации и состоянию резервных копий
- Уверенность в том, что база «не упадёт внезапно»

👉 Регистрация и подробности о курсе Observability: мониторинг, логирование, трейсинг: https://otus.pw/9zY4/?erid=2W5zFJsoUrk

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
👎7👍21
IT Elements 2025: где будет всё ИТ-сообщество этой осенью

10-11 сентября в третий раз состоится уютная конференция для айтишников — IT Elements 2025, посвященная ИТ-инфраструктуре, сетям, кибербезу, данным и ИИ.

Что будет: 2000+ участников ежедневно, 6 тематических залов, 100+ спикеров и десятки дискуссий, 30+ вендорских демозон, лаборатории и хардкорные воркшопы.

Из интересного:
▪️ Дискуссия «Мониторинг — это инструмент инженера или критически важная система для бизнеса?» с представителями альянса разработчиков мониторинга.
▪️ Доклад от «Лаборатории Числитель»: Визуализация мониторинга, но не Grafana. Тогда что?
▪️ Большая пленарка об антихрупкости архитектуры.
▪️ Кейс успешного внедрения Observability‑платформы от AB Digital.

Программа и регистрация доступны на сайте конференции. Участие бесплатное.
🔥2👍1
Oracle Database Metrics Exporter

Метрики OpenTelemetry для мониторинга СУБД Oracle (если она у вас, конечно, есть).
👍5🔥2