How to import Prometheus-style alerts and recording rules to Grafana-managed alerts and recording rules
Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.
Статья в блоге Grafana посвящена новой функциональности в Grafana 12, которая позволяет массово импортировать существующие файлы правил Prometheus, Grafana Loki или Grafana Mimir в оповещения и правила записи, управляемые Grafana, непосредственно через пользовательский интерфейс.
🔥5👍1
Mastering the OpenTelemetry Transformation Language (OTTL)
Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.
В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.
Экосистема OpenTelemetry продолжает развиваться одновременно с другими мощными инструментами, которые улучшают стратегию наблюдения. Среди них — выделяется язык преобразования OpenTelemetry (OTTL), который обладает возможностями манипулирования и преобразования телеметрических данных.
В этой статье рассматривается, что такое OTTL, как он работает и как его можно использовать для максимального увеличения ценности данных о наблюдаемости с минимальными усилиями.
👍3
«Изучаем OpenTelemetry: современный мониторинг систем»
OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.
🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.
📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.
Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖
Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W
OpenTelemetry сегодня – это отраслевой стандарт сбора и передачи данных телеметрии, а также набор инструментов, позволяющий интерпретировать подаваемые системой сигналы о своем состоянии. Основатели проекта Тед Янг и Остин Паркер создали руководство изучению OpenTelemetry для всех, кто хочет глубоко разобраться в наблюдаемости.
🔍 Что внутри?
– Настройка и диагностика OpenTelemetry.
– Лучшие практики наблюдаемости для Kubernetes, AWS Lambda и других облачных сервисов.
– Как инструментировать свои сервисы и библиотеки с
помощью OpenTelemetry.
📌 Для кого?
DevOps, SRE, бэкенд-разработчики и все, кто хочет вывести мониторинг на новый уровень.
Выведите мониторинг на новый уровень!
Ознакомиться с книгой на сайте издательства 📖
Реклама: ООО” МЕЙЛ ПЛЮС” ИНН 7802524386 ERID: 2VtzqumhF2W
👍6❤2
Обнаружение аномалий в данных временных рядов с помощью статистического анализа
Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.
Настройка оповещений для различных метрик не всегда представляет из себя тривиальную задачу. В некоторых случаях может быть вполне достаточно простого порогового значения, например, для отслеживания свободного места на диске устройства. Вы можете просто установить оповещение о том, что осталось 10% свободного места, и все готово. То же самое касается и мониторинга доступной памяти на сервере. Далее в переводе статьи на Хабре.
👍5🔥1
Configure and customize Kubernetes Monitoring easier with Alloy Operator
В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.
В helm chart Kubernetes Monitoring появилась возможность динамической настройки сбора данных телеметрии с помощью Alloy Operator. В этой стать в блоге Grafana рассказано об этом подробнее.
🔥3👍2
Migrating to ClickStack from Elastic
В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.
В этом руководстве описан подход к миграции с Elastic Stack на ClickStack. Фокус сделан на стратегии параллельной работы, которая минимизирует риск, используя сильные стороны ClickHouse в рабочих нагрузках наблюдаемости. Документация ClickHouse.
🔥4
Как я по вечерам разрабатывал Statuser — платформу для мониторинга доступности приложений
statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
statuser.cloud — простой сервис для мониторинга доступности сайтов и серверов. В этой статье на Хабре автор рассказывает как вечерами и на выходных делал Statuser (и продолжает делать): с какими проблемами сталкивался, как выбирал стек, как не бросил проект на полпути — и что получилось в итоге.
🔥6👎2👍1
Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud
В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
👍2🔥2❤1
VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling
VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
🔥5👍3
Собираем трейс в Laravel и отправляем в Zipkin
В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
🔥2👍1
🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.
Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».
Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️ Что общего и разного у AppArmor, SeLinux, seccomp
▶️ Как NetworkPolicy относится к теме предотвращения
▶️ Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️ Как Luntry помогает предотвращать Runtime угрозы
Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC
Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться.
РЕГИСТРАЦИЯ:
🤖 ТГ-Бот | 🌐 Сайт + почта
#реклама
О рекламодателе
Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».
Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️ Что общего и разного у AppArmor, SeLinux, seccomp
▶️ Как NetworkPolicy относится к теме предотвращения
▶️ Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️ Как Luntry помогает предотвращать Runtime угрозы
Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC
Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться.
РЕГИСТРАЦИЯ:
🤖 ТГ-Бот | 🌐 Сайт + почта
#реклама
О рекламодателе
❤1
Сложности перехода к SRE
Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
👎2👍1
Приглашаем IT-руководителей ритейла поделиться экспертным опытом для развития системы мониторинга кассовых мест ScanKass.
Условия:
Вознаграждение:
1. Доступ в закрытое Telegram-сообщество IT-руководителей ритейла с нетворкингом
2. Приглашение на конференцию по управлению техподдержкой
3. Результаты исследования + обсуждение
4. Полгода бесплатного доступа к системе мониторинга ScanKass (без ограничений)
5. На выбор:
▸ Сертификат эксперта в разработке IT-продукта (с подписью CEO) или
▸ Сертификат на 2 000 ₽ в маркетплейс на выбор
О продукте:
Регистрация
Вопросы: @D_Kisova
Ваш опыт поможет создать технологии будущего для ритейла!
Реклама. ООО "СКАНКАСС", ИНН 1841111286. ERID: 2Vtzqx3u39Q
Условия:
▸ IT-руководитель/директор
▸ Опыт управления: от 2 лет
▸ Сеть: 40–400 кассовых мест
▸ Дата: 30.06–06.07 в удобное время
▸ Формат: онлайн интервью (30–60 мин)
▸ Конфиденциально
Вознаграждение:
1. Доступ в закрытое Telegram-сообщество IT-руководителей ритейла с нетворкингом
2. Приглашение на конференцию по управлению техподдержкой
3. Результаты исследования + обсуждение
4. Полгода бесплатного доступа к системе мониторинга ScanKass (без ограничений)
5. На выбор:
▸ Сертификат эксперта в разработке IT-продукта (с подписью CEO) или
▸ Сертификат на 2 000 ₽ в маркетплейс на выбор
О продукте:
ScanKass – профессиональная система мониторинга кассовых мест:
▸ Ошибки в реальном времени
▸ Снижение простоев
▸ Статистика для решений о ремонте оборудования
▸ Удаленное управление кассами
Регистрация
Вопросы: @D_Kisova
Ваш опыт поможет создать технологии будущего для ритейла!
Реклама. ООО "СКАНКАСС", ИНН 1841111286. ERID: 2Vtzqx3u39Q
❤1
arkime
Arkime — это масштабируемая система анализа сети и захвата пакетов с открытым исходным кодом.
Репыч на Гитхабе
Arkime — это масштабируемая система анализа сети и захвата пакетов с открытым исходным кодом.
Репыч на Гитхабе
🔥7👍1
ElastAlert 2 на практике: как создать универсальное правило для мониторинга событий
Одной из ключевых задач при работе с Elastic Stack является настройка эффективной системы уведомлений. Это позволяет оперативно реагировать на происходящие события и минимизировать последствия сбоев или атак. В таком контексте фреймворк ElastAlert 2 представляет собой мощный инструмент, который значительно расширяет возможности встроенных уведомлений Elastic Stack, обеспечивая гибкость и детализацию алертов.
В этой статье автор рассказывает о том, какое одно универсальное правило для мониторинга событий в ElastAlert 2 охватывает все основные варианты условий срабатывания. Рассмотрено, как можно использовать ElastAlert 2 для расширения функциональности алертинга в Kibana и как интегрировать оба инструмента для более эффективного мониторинга событий. Читать дальше.
Одной из ключевых задач при работе с Elastic Stack является настройка эффективной системы уведомлений. Это позволяет оперативно реагировать на происходящие события и минимизировать последствия сбоев или атак. В таком контексте фреймворк ElastAlert 2 представляет собой мощный инструмент, который значительно расширяет возможности встроенных уведомлений Elastic Stack, обеспечивая гибкость и детализацию алертов.
В этой статье автор рассказывает о том, какое одно универсальное правило для мониторинга событий в ElastAlert 2 охватывает все основные варианты условий срабатывания. Рассмотрено, как можно использовать ElastAlert 2 для расширения функциональности алертинга в Kibana и как интегрировать оба инструмента для более эффективного мониторинга событий. Читать дальше.
Хабр
ElastAlert 2 на практике: как я создал универсальное правило для мониторинга событий
В наш век технологий обработка данных и мониторинг систем становятся критически важными. Поэтому для обеспечения бесперебойной работы я часто использую в своих проектах Elastic Stack (ранее известный...
👍6❤1🔥1
AlertCLI: Когда Alertmanager слишком серьёзен
AlertCLI — утилита для работы с Alertmanager, которая превращает страдания от мониторинга в менее мучительные страдания. Потому что давайте признаем: когда в 3 часа ночи звонит PagerDuty, хочется не решать проблемы, а решить того, кто их создал.
Описание на Хабре
Репыч на Гитхабе
AlertCLI — утилита для работы с Alertmanager, которая превращает страдания от мониторинга в менее мучительные страдания. Потому что давайте признаем: когда в 3 часа ночи звонит PagerDuty, хочется не решать проблемы, а решить того, кто их создал.
Описание на Хабре
Репыч на Гитхабе
👍4🔥3
Jaeger v2
Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.
Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.
👍4
What is Observability 3.0?
То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.
❗️Статья на medium.com
То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.
❗️Статья на medium.com
❤3👍3
Faster incident response through distributed tracing: Inside Glovo's use of Traces Drilldown
Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.
Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.
🔥3👍1