Мониторим ИТ
7.58K subscribers
101 photos
2 files
1.39K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Adaptive alerting: faster, better insights with the new metrics forecasting UI in Grafana Cloud

В Grafana обновился подход к расчету прогнозов (работает только в Cloud-версии). Раньше они отправляли данные и параметры в бэкэнд, запускали модель и отправляли ее обратно в фронтэнд, чтобы пользователи могли ее просмотреть. Теперь этап создания и настройки прогноза переехал в фронтэнд. Работает на баще библиотеки augurs . Augurs выполняет всю работу в фронтэнде на этапе настройки. После этого прогнозные данные отправляются в бэкэнд. Подробнее в блоге Grafana.
👍21🔥1
VictoriaLogs Unleashed: Cluster Version Now Available for Exceptional, Linear Scaling

VM объявляет о выпуске версии VictoriaLogs Cluster. Кластер VictoriaLogs решает проблему масштабируемости. Теперь можно распределить инфраструктуру логирования по нескольким узлам, гарантируя, что производительность будет соответствовать требованиям. Подробнее в блоге VM.
🔥4👍3
Собираем трейс в Laravel и отправляем в Zipkin

В этой статье автор рассказывает о библиотеке (Laravel Zipkin Tracer), которую он разработал изучая трейсинг в php.
🔥2👍1
🚨 Предотвращение угрозы всегда дешевле, чем расследование инцидента и устранение его последствий 💥 Но сказать проще, чем сделать.

Давайте разберемся, как и с помощью чего можно избавиться от большого класса инцидентов в кластерах Kubernetes. Приходите 10 июля в 11:00 на вебинар Luntry «Предотвращение Runtime угроз в контейнерах и Kubernetes».

Разберем в прямом эфире:
▶️ Чем отличается детектирование, реагирование и предотвращение
▶️  Что общего и разного у AppArmor, SeLinux, seccomp
▶️  Как NetworkPolicy относится к теме предотвращения
▶️  Что такое Linux Security Module (LSM) и при чем тут eBPF
▶️  Как Luntry помогает предотвращать Runtime угрозы

Кому будет полезно
- AppSec
- DevSecOps
- Platform team
- SOC

Вебинар бесплатный. Чтобы получить напоминание об эфире и запись после него, надо зарегистрироваться. 

РЕГИСТРАЦИЯ:
🤖 ТГ-Бот  |  🌐 Сайт + почта

#реклама
О рекламодателе
1
Сложности перехода к SRE

Понятие SRE прочно закрепилось в современном ИТ. В свое время подход Site Reliability Engineering произвел революцию в отношении организаций к надежности и производительности систем. Зародившись в Google, SRE позволяет преодолеть разрыв между разработкой и эксплуатацией, обеспечивая надежную, масштабируемую инфраструктуру, которая соответствует ожиданиям пользователей. По сути, SRE — это не просто поддержание систем в рабочем состоянии, это создание интеллектуальной, самовосстанавливающейся инфраструктуры, которая сводит к минимуму ручное вмешательство. Внедряя стратегические практики SRE, организации могут превратить свои технические операции из реактивного устранения неполадок в проактивную оптимизацию. Читать дальше на Хабре.
👎2👍1
kl

Интерактивный просмотрщик журналов Kubernetes для терминала.

Репыч на Гитхабе
🔥3👍1
Приглашаем IT-руководителей ритейла поделиться экспертным опытом для развития системы мониторинга кассовых мест ScanKass.

Условия:
IT-руководитель/директор
▸ Опыт управления: от 2 лет
▸ Сеть: 40–400 кассовых мест
▸ Дата: 30.06–06.07 в удобное время
▸ Формат: онлайн интервью (30–60 мин)
Конфиденциально


Вознаграждение:
1. Доступ в закрытое Telegram-сообщество IT-руководителей ритейла с нетворкингом
2. Приглашение на конференцию по управлению техподдержкой
3. Результаты исследования + обсуждение
4. Полгода бесплатного доступа к системе мониторинга ScanKass (без ограничений)
5. На выбор:
▸ Сертификат эксперта в разработке IT-продукта (с подписью CEO) или
▸ Сертификат на 2 000 ₽ в маркетплейс на выбор

О продукте:
ScanKass – профессиональная система мониторинга кассовых мест:
▸ Ошибки в реальном времени
▸ Снижение простоев
▸ Статистика для решений о ремонте оборудования
▸ Удаленное управление кассами


Регистрация
Вопросы:
@D_Kisova

Ваш опыт поможет создать технологии будущего для ритейла!

Реклама. ООО "СКАНКАСС", ИНН 1841111286. ERID: 2Vtzqx3u39Q
1
arkime

Arkime — это масштабируемая система анализа сети и захвата пакетов с открытым исходным кодом.

Репыч на Гитхабе
🔥6👍1
ElastAlert 2 на практике: как создать универсальное правило для мониторинга событий

Одной из ключевых задач при работе с Elastic Stack является настройка эффективной системы уведомлений. Это позволяет оперативно реагировать на происходящие события и минимизировать последствия сбоев или атак. В таком контексте фреймворк ElastAlert 2 представляет собой мощный инструмент, который значительно расширяет возможности встроенных уведомлений Elastic Stack, обеспечивая гибкость и детализацию алертов.

В этой статье автор рассказывает о том, какое одно универсальное правило для мониторинга событий в ElastAlert 2 охватывает все основные варианты условий срабатывания. Рассмотрено, как можно использовать ElastAlert 2 для расширения функциональности алертинга в Kibana и как интегрировать оба инструмента для более эффективного мониторинга событий. Читать дальше.
👍61🔥1
AlertCLI: Когда Alertmanager слишком серьёзен

AlertCLI — утилита для работы с Alertmanager, которая превращает страдания от мониторинга в менее мучительные страдания. Потому что давайте признаем: когда в 3 часа ночи звонит PagerDuty, хочется не решать проблемы, а решить того, кто их создал.

Описание на Хабре

Репыч на Гитхабе
👍4🔥2
Jaeger v2

Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.
👍4
What is Observability 3.0?

То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.

❗️Статья на medium.com
3👍3
Faster incident response through distributed tracing: Inside Glovo's use of Traces Drilldown

Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.
🔥3👍1
dockprom

Решение с открытым исходным кодом для мониторинга контейнеров Docker совместно с Prometheus, Grafana , cAdvisor , NodeExporter и возможностью отправки оповещений в AlertManager.

Репыч на Гитхабе
👍9🤔2🔥1
KubeShark: Wireshark for Kubernetes

Wireshark — известный инструмент для захвата пакетов, анализа и устранения неполадок. TCPDump/Wireshark дает возможность визуализировать и понимать, что происходит в сети. Представьте, если бы что-то подобное было возможно в K8s, если бы вы могли видеть, что именно происходит при развертывании кластера, получении подов, создании учетной записи службы и как различные процессы взаимодействуют друг с другом и т. д.

Чтобы увидеть, что именно происходит при запуске команды kubectl, можно просто использовать флаг verbose, например, kubectl get pods -v=6. Уровень вербализации начинается с 0 и заканчивается на 9, где 0 — это минимум, а 9 — максимум вербализации.

Kubectl с флагом -v позволяет видеть вызовы API L7, но не позволяет отслеживать сетевой трафик. Kubeshark захватывает L3 и L7, фактически у него есть доступ ко всему пакету L2. А еще он включает дашборд для визуализации примерно того же самого, как и в Wireshark.

Статья с описанием kubeshark (❗️статья на medium.com)

Репыч на Гитхабе
👍7🔥51
Облако ITENTIS CLOUD: технологии топов, цена без наценки (и живая поддержка!)

Нашли брендовую вещь в надежном маркете на 30% дешевле? Вот и мы так же. 😉

ITENTIS CLOUD — не "бюджетный" вариант. Это ВСЕ те же технологии, что у Яндекса, Mail или VK (VPC, Kubernetes, S3, снимки, автомасштабирование), но...

🔥 ...ЗНАЧИТЕЛЬНО ДЕШЕВЛЕ! 🔥

Зачем платить за бренд? Получите то же самое (а кое-что лучше) и сэкономьте. Не верите? Сравните тарифы! Надежные дата-центры Tier III, как у всех.

И главное — наша поддержка. Вот где мы их РЕАЛЬНО обходим:

💩 У них: очереди, боты, ответ "в течение 24 часов".
😍 У нас: живой, компетентный специалист 24/7. Не бот! Настоящий человек, который РАЗБЕРЕТСЯ. Ответ за минуты. Сложный Kubernetes? Объясним и поможем. Это наш стандарт.

Что вы получаете за меньшие деньги:

1. Та же "начинка": все ключевые технологии (VPC, Kubernetes, S3 и т.д.) — как у топов.
2. Надежность: Tier III, 2FA, шифрование, брандмауэры.
3. Скорость: запуск кластера быстрее доставки пиццы.
4. Простой контроль: интуитивное управление.
5. ГЛАВНОЕ: цена, от которой улыбнетесь + поддержка, которая реально спасает.

"А подвох?"
Да нигде!

14 дней БЕСПЛАТНО: Протестируйте всё.
БЕСПЛАТНАЯ миграция: Перенесем ваши проекты без простоев.
Гарантия возврата: Риск — ноль.

‼️ Понравится? Расскажите друзьям! Реферальная программа: за каждого клиента — бонус или скидка. Без мишуры.

Итог:
ITENTIS CLOUD = Технологии топов + Честная цена + Человеческая поддержка 24/7.

Хватит переплачивать и ждать ответа! Получите максимум.

👉 Действуйте выгодно:

1. Сравните тарифы: https://itentis.cloud
2. Пишите:
🤖 Telegram-бот: @itentis_bot (Фраза: "Хочу облако дешевле Яндекса!")
✉️ Почта: [email protected]
3. Скажите: "Читал пост про ЭКОНОМИЮ в облаке!" 🚀 (Получите бонус!)
4. Следите за обновлениями в @itentis

Мощное облако. Честная цена. Люди на связи.

Реклама. ООО «АВАНГАРД», ИНН 7729648547, erid: 2VtzquyfDAf
👎2
От хаоса к ясности с дашбордами Grafana: как компания EA, выпускающая видеоигры, отслеживает более 200 показателей

В своем выступлении на GrafanaCON 2025 инженер-программист EA Кенн Чен рассказал, как он использовал Grafana для создания того, что он называет системой «функционального дашборда», который позволяет разработчикам эффективно отслеживать статус приложения. Раньше полный обзор мог быть завершен за несколько часов — «или, может быть, никогда, я буду честен», — пошутил он, — а теперь работа может быть выполнена за малую часть этого времени. «Наши разработчики после надлежащего обучения могут просмотреть 200 показателей примерно за 10 минут», — сказал он, — «и это позволяет всегда следить за всем, что важно». Читать дальше в блоге Grafana.
🔥3👍1
Как мы написали поверх Sentry кастомную систему профилирования приложения на проде

В этой статье автор рассказывает что можно сделать, если пользователи постоянно жалуются, что приложение тормозит, а вы не знаете, почему. Читать на Хабре.
🔥6👍3👎1
Как виртуальная машина в облаке пишет данные на диск?

Рассказываем в новом выпуске реалити Building the Cloud на примере MWS Cloud Platform — нового облака от MWS.

Разберём:
как работает связка "ВМ-диск" под капотом
как это реализовано в MWS Cloud Platform
наш опыт использования SPDK и v-host user
как планируем развивать системы хранения данных в новом облаке

Эфир будет интересен бэкенд-инженерам, системным инженерам и DevOps-специалистам и всем, кто интересуется облаками.

За лучший вопрос — фирменный мерч.

📆 16 июля в 14:00 (мск)
Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
What's new in ClickStack?

Примерно месяц назад был анонсирован ClickStack — стек наблюдения с открытым исходным кодом, созданный на основе ClickHouse, который упрощает объединение журналов, метрик, трассировок и воспроизведения сеансов — и все это на базе одного и того же о движка.

Одно из самых больших преимуществ ClickStack заключается в том, как он объединяет быстрый поиск и быстрые агрегации по данным с высокой кардинальностью и широкими событиями в открытом исходном коде. Используя OpenTelemetry для сбора данных и HyperDX в качестве уровня пользовательского интерфейса, ClickStack обеспечивает полный готовый опыт наблюдения, от приема до мощного визуального исследования.

Месяц — это долгий срок в ClickHouse. С момента первого релиза вендор активно работал над добавлением новых функций и улучшений, чтобы сделать ClickStack ещё мощнее и проще в использовании. Начиная с этого месяца, они будут регулярно публиковать новости о новых возможностях, чтобы пользователи могли быстро воспользоваться последними улучшениями в ClickStack.

Подробнее в блоге Clickhouse
👍5🔥3