Мониторим ИТ – Telegram

Мониторим ИТ

7.58K subscribers

101 photos

2 files

1.39K links

Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)

Download Telegram

About

Blog

Apps

Platform

Мониторим ИТ

7.58K subscribers

Мониторим ИТ

⚡️Как превратить российскую виртуализацию zVirt в комплексную платформу с элементами самообслуживания, мониторинга, аналитики и управления?

Шаг 1: Мониторинг и аналитика — оценка текущего состояния zVirt, выявление узких мест и планирование масштабирования.

Шаг 2: Расширенное управление zVirt — автоматизация задач управления, создания виртуальных ресурсов, применение ресурсных квот и разделение инфраструктуры на проекты.

Шаг 3: Гибридное облако — объединение zVirt с другими платформами виртуализации в едином портале с централизованным управлением.

Обо всех подробностях рассказываем на онлайн-вебинаре 18 июня.

👉Подробности и регистрация

👎6🤔4🔥2👍1

2.83K views10:00

Мониторим ИТ

Как настроить мониторинг, чтобы не проспать проблему

В статье рассказывают как настроить мониторинг так, чтобы проблемы ловились сразу — ещё до того, как начнут ломиться сообщения в поддержку. По большей части описание инструментария.

🔥3👍1

2.83K views10:53

Мониторим ИТ

Как мониторить k8s при помощи Grafana, Prometheus, AlertManager и Promtail с Loki вы узнаете из этого цикла статей:

How to create a Monitoring Stack using Kube-Prometheus-stack (Part 1)

How to create a Monitoring Stack: Evolving our Kubernetes Monitoring Stack (part 2)

❗️Статьи на medium.com

🔥5👍1

3.03K views13:00

Мониторим ИТ

VictoriaTraces? Вы серьезно?

В VictoriaMetrics у нас уже решения для метрик и логирования: Victoria Metrics и Victoria Logs. Наблюдаемость, как известно, включает в себя метрики, логи и трейсы. Так где же VictoriaTraces ?

Если вам интересно, планируют ли они покрыть еще и трейсы, то в этой статье приоткрывается завеса тайны. В этой статье вендор делится результатами исследования распределенной трассировки и рассматривает два ключевых вопроса: будет ли VictoriaTraces и насколько конкурентоспособной она может быть?

🔥10👍1

3.12K views07:00

Мониторим ИТ

Terraforming Your Grafana Alerts for Kubernetes Clusters

Дашборды в Grafana не всегда можно удачно затеррарформить, а вот оповещения вполне себе. В этой статье автор разбирает примеры алертинга для кластера Kubernetes.

❗️Статья на medium.com

🔥2👍1

3.92K views13:00

Мониторим ИТ

📊 Grafana: продвинутый уровень визуализации и алертинга

🔥 19 июня в 20:00 мск приглашаем на бесплатный вебинар «Grafana — продвинутое использование» с Анатолием Бенем.Это больше, чем графики — это визуальный интеллект вашей системы.

Что вас ждёт:

– переменные, шаблоны и динамические панели для гибкой визуализации,
– создание информативных дашбордов с PromQL и данными из Prometheus, Loki, Elasticsearch и других источников,
– настройка умных алертов и управление инцидентами,
– подключение плагинов, настройка авторизации, best practices для команд.

Узнайте, как превратить Grafana в мощный центр наблюдаемости, настроенный под вашу инфраструктуру.

👉 Регистрируйтесь по ссылке: https://otus.pw/p7Uw/?erid=2W5zFGAck7r

Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

❤1

2.32K views10:00

Мониторим ИТ

Митап для всех, кто хоть раз ронял прод

📍 19 июня | 17:30

Поговорим про опыт работы с Rust, разберемся, что делать с инфраструктурным зоопарком.

Будут живые дискуссии, дебаты и мерч за лучшую историю про инженерный провал :)

Регистрация по ссылке, оффлайн или онлайн: https://slc.tl/ggsx6

Чтобы не пропустить митап и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxQ3on6

2.43K views10:00

Мониторим ИТ

How to import Prometheus-style alerts and recording rules to Grafana-managed alerts and recording rules

Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.

🔥5👍1

2.32K views14:45

Мониторим ИТ

Mastering the OpenTelemetry Transformation Language (OTTL)

Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.

В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.

👍3

2.3K views07:00

Мониторим ИТ

«Изучаем OpenTelemetry: современный мониторинг систем»

OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.

🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.

📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.

Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖

Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W

👍6❤2

2.48K views14:00

Мониторим ИТ

Обнаружение аномалий в данных временных рядов с помощью статистического анализа

Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.

👍5🔥1

2.94K views18:35

Мониторим ИТ

Configure and customize Kubernetes Monitoring easier with Alloy Operator

В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.

🔥3👍2

2.55K views07:06

Мониторим ИТ

Migrating to ClickStack from Elastic

В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.

🔥4

4.01K views13:05

Мониторим ИТ

Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений

statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.

🔥6👎2👍1

2.79K views09:12

Мониторим ИТ

Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud

В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.

👍2🔥2❤1

2.46K views08:51

Мониторим ИТ

VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling

VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.

🔥5👍3

2.63K views12:02

Мониторим ИТ

Собираем трейс в Laravel и отправляем в Zipkin

В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.

🔥2👍1

2.99K views16:02

Мониторим ИТ

🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.

Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».

Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️ Что общего и разного у AppArmor, SeLinux, seccomp
▶️ Как NetworkPolicy относится к теме предотвращения
▶️ Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️ Как Luntry помогает предотвращать Runtime угрозы

Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC

Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться.

РЕГИСТРАЦИЯ:
🤖 ТГ-Бот | 🌐 Сайт + почта

#реклама
О рекламодателе

❤1

3.07K views13:36

Мониторим ИТ

Сложности перехода к SRE

Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.

👎2👍1

3.23K views12:06

Мониторим ИТ

kl

Интерактивный просмотрщик журналов Kubernetes для терминала.

Репыч на Гитхабе

🔥3👍1

2.6K views06:00