Мониторим ИТ

Jaeger v2

Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.

👍4

2.98K views06:02

Мониторим ИТ

What is Observability 3.0?

То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.

❗️Статья на medium.com

❤3👍3

3.25K views14:11

Мониторим ИТ

Faster incident response through distributed tracing: Inside Glovo's use of Traces Drilldown

Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.

🔥3👍1

3.49K views17:03

Мониторим ИТ

dockprom

Решение с открытым исходным кодом для мониторинга контейнеров Docker совместно с Prometheus, Grafana , cAdvisor , NodeExporter и возможностью отправки оповещений в AlertManager.

Репыч на Гитхабе

👍10🤔3🔥1

2.97K views05:00

Мониторим ИТ

KubeShark: Wireshark for Kubernetes

Wireshark — известный инструмент для захвата пакетов, анализа и устранения неполадок. TCPDump/Wireshark дает возможность визуализировать и понимать, что происходит в сети. Представьте, если бы что-то подобное было возможно в K8s, если бы вы могли видеть, что именно происходит при развертывании кластера, получении подов, создании учетной записи службы и как различные процессы взаимодействуют друг с другом и т. д.

Чтобы увидеть, что именно происходит при запуске команды kubectl, можно просто использовать флаг verbose, например, kubectl get pods -v=6. Уровень вербализации начинается с 0 и заканчивается на 9, где 0 — это минимум, а 9 — максимум вербализации.

Kubectl с флагом -v позволяет видеть вызовы API L7, но не позволяет отслеживать сетевой трафик. Kubeshark захватывает L3 и L7, фактически у него есть доступ ко всему пакету L2. А еще он включает дашборд для визуализации примерно того же самого, как и в Wireshark.

Статья с описанием kubeshark (❗️статья на medium.com)

Репыч на Гитхабе

👍8🔥5❤1

4.61K views12:03

Мониторим ИТ

Облако ITENTIS CLOUD: технологии топов, цена без наценки (и живая поддержка!)

Нашли брендовую вещь в надежном маркете на 30% дешевле? Вот и мы так же. 😉

ITENTIS CLOUD — не "бюджетный" вариант. Это ВСЕ те же технологии, что у Яндекса, Mail или VK (VPC, Kubernetes, S3, снимки, автомасштабирование), но...

🔥 ...ЗНАЧИТЕЛЬНО ДЕШЕВЛЕ! 🔥

Зачем платить за бренд? Получите то же самое (а кое-что лучше) и сэкономьте. Не верите? Сравните тарифы! Надежные дата-центры Tier III, как у всех.

И главное — наша поддержка. Вот где мы их РЕАЛЬНО обходим:

💩 У них: очереди, боты, ответ "в течение 24 часов".
😍 У нас: живой, компетентный специалист 24/7. Не бот! Настоящий человек, который РАЗБЕРЕТСЯ. Ответ за минуты. Сложный Kubernetes? Объясним и поможем. Это наш стандарт.

Что вы получаете за меньшие деньги:

1. Та же "начинка": все ключевые технологии (VPC, Kubernetes, S3 и т.д.) — как у топов.
2. Надежность: Tier III, 2FA, шифрование, брандмауэры.
3. Скорость: запуск кластера быстрее доставки пиццы.
4. Простой контроль: интуитивное управление.
5. ГЛАВНОЕ: цена, от которой улыбнетесь + поддержка, которая реально спасает.

"А подвох?" Да нигде!

14 дней БЕСПЛАТНО: Протестируйте всё.
БЕСПЛАТНАЯ миграция: Перенесем ваши проекты без простоев.
Гарантия возврата: Риск — ноль.

‼️ Понравится? Расскажите друзьям! Реферальная программа: за каждого клиента — бонус или скидка. Без мишуры.

Итог: ITENTIS CLOUD = Технологии топов + Честная цена + Человеческая поддержка 24/7.

Хватит переплачивать и ждать ответа! Получите максимум.

👉 Действуйте выгодно:

1. Сравните тарифы: https://itentis.cloud
2. Пишите:
🤖 Telegram-бот: @itentis_bot (Фраза: "Хочу облако дешевле Яндекса!")
✉️ Почта: [email protected]

3. Скажите: "Читал пост про ЭКОНОМИЮ в облаке!" 🚀 (Получите бонус!)
4. Следите за обновлениями в @itentis

Мощное облако. Честная цена. Люди на связи.

Реклама. ООО «АВАНГАРД», ИНН 7729648547, erid: 2VtzquyfDAf

👎2

2.41K viewsedited 11:04

Мониторим ИТ

От хаоса к ясности с дашбордами Grafana: как компания EA, выпускающая видеоигры, отслеживает более 200 показателей

В своем выступлении на GrafanaCON 2025 инженер-программист EA Кенн Чен рассказал, как он использовал Grafana для создания того, что он называет системой «функционального дашборда», который позволяет разработчикам эффективно отслеживать статус приложения. Раньше полный обзор мог быть завершен за несколько часов — «или, может быть, никогда, я буду честен», — пошутил он, — а теперь работа может быть выполнена за малую часть этого времени. «Наши разработчики после надлежащего обучения могут просмотреть 200 показателей примерно за 10 минут», — сказал он, — «и это позволяет всегда следить за всем, что важно». Читать дальше в блоге Grafana.

🔥4👍1

2.7K views09:25

Мониторим ИТ

Как мы написали поверх Sentry кастомную систему профилирования приложения на проде

В этой статье автор рассказывает что можно сделать, если пользователи постоянно жалуются, что приложение тормозит, а вы не знаете, почему. Читать на Хабре.

🔥7👍3👎1

3.89K views11:07

Мониторим ИТ

Как виртуальная машина в облаке пишет данные на диск?

Рассказываем в новом выпуске реалити Building the Cloud на примере MWS Cloud Platform — нового облака от MWS.

Разберём:
⏺как работает связка "ВМ-диск" под капотом
⏺как это реализовано в MWS Cloud Platform
⏺наш опыт использования SPDK и v-host user
⏺как планируем развивать системы хранения данных в новом облаке

Эфир будет интересен бэкенд-инженерам, системным инженерам и DevOps-специалистам и всем, кто интересуется облаками.

За лучший вопрос — фирменный мерч.

📆 16 июля в 14:00 (мск)

⏩

Зарегистрироваться

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

2.52K views13:04

Мониторим ИТ

What's new in ClickStack?

Примерно месяц назад был анонсирован ClickStack — стек наблюдения с открытым исходным кодом, созданный на основе ClickHouse, который упрощает объединение журналов, метрик, трассировок и воспроизведения сеансов — и все это на базе одного и того же о движка.

Одно из самых больших преимуществ ClickStack заключается в том, как он объединяет быстрый поиск и быстрые агрегации по данным с высокой кардинальностью и широкими событиями в открытом исходном коде. Используя OpenTelemetry для сбора данных и HyperDX в качестве уровня пользовательского интерфейса, ClickStack обеспечивает полный готовый опыт наблюдения, от приема до мощного визуального исследования.

Месяц — это долгий срок в ClickHouse. С момента первого релиза вендор активно работал над добавлением новых функций и улучшений, чтобы сделать ClickStack ещё мощнее и проще в использовании. Начиная с этого месяца, они будут регулярно публиковать новости о новых возможностях, чтобы пользователи могли быстро воспользоваться последними улучшениями в ClickStack.

Подробнее в блоге Clickhouse

👍7🔥3

2.96K views15:05

Мониторим ИТ

Автоматизация мониторинга: как заставить скрипты работать вместо вас

Ручной мониторинг серверов и логов - это как разжигать костёр вместо использования микроволновки. Если вы вручную проверяете логи, доступность сервисов или реагируете на алерты посредством почты - попробуйте перейти на автоматизацию.

Статья наполнена набором скриптов, которые можно использовать в случаях, когда разворачивание системы мониторинга кажется избыточным.

👍4❤2🔥2

2.72K views06:01

Мониторим ИТ

Introducing ClickStack: The Future of Observability on ClickHouse

В этом видео представители Clickhouse рассказывают о возможностях и преимуществах ClickStack — observability-инструмента.

Напомню, они скрестили HyperDX c ClickHouse и получили ~~франкенштейна~~ ClickStack.

🔥6👍2

3.9K views13:03

Мониторим ИТ

Как работать с инцидентами, когда на кону большие деньги

В этой статье тимлид группы мониторинга в Купере Дарья Попова рассказывает как они выстраивали процессы и инструменты мониторинга и автоматизации — и как это все упростило им жизнь.

🔥9👍1

2.96K views08:09

Мониторим ИТ

Scaling Observability: Why TiDB Moved from Prometheus to VictoriaMetrics

С самого начала Prometheus служил основным инструментом для сбора, хранения, выполнения запросов и наблюдения за метриками производительности в режиме реального времени в компании TiDB. По мере масштабирования развёртываний росли и сложности использования Prometheus. В этой статье рассмотрены эти трудности и причины, по которым TiDB в конечном итоге перешли на VictoriaMetrics — высокопроизводительную базу данных временных рядов и решение для мониторинга с открытым исходным кодом. Читать дальше.

❤6👎2🔥2👍1

2.65K views15:04

Мониторим ИТ

Проблемы с производительностью веб-сервисов: как находить и устранять

Производительность — это базовое требование в разработке. Однако не всегда о базово высокой производительности говорят на этапе обсуждения проекта. Заказчик вряд ли скажет: «Сделайте так, чтобы сайт отвечал за Х мс», но он точно удивится и расстроится, если все будет грузиться медленно. В команде тоже мало кто рад: проект сдан, а теперь приходится выяснять, что тормозит и почему.

Эта статья — для тех, кто хочет понять, где обычно прячутся проблемы с производительностью, как их не пропустить и устранить.

👍5👎3❤2

3.04K views06:02

Мониторим ИТ

Использование метрик для мониторинга облачных баз данных на примере PostgreSQL

Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики от DBaaS в сочетании с Grafana. Они позволяют строить кастомные графики, которые могут быть полезны в той или иной ситуации.

В этой статье DevOps-инженер Selectel Рамиль Адильбеков показывает, как можно настроить базовый стек Prometheus/Grafana, подключить метрики от кластера облачных баз данных и загрузить дашборд.

❤4👍1👎1🔥1

3.3K views12:04

Мониторим ИТ

Three Mighty Alerts Supporting Hugging Face’s Production Infrastructure

В этой статье техническая команда компании Hugging Face по инфраструктуре делится закулисным взглядом на внутреннюю работу боевой инфраструктуры Hugging Face. В этой статье подробно рассматривают три важных оповещения, которые играют уникальную роль в поддержке инфраструктуры, и выясняют, как они помогли поддерживать высокий уровень производительности и бесперебойной работы.

❤1

2.9K views06:06

Мониторим ИТ

Setting Up OpenTelemetry on the Frontend Because I Hate Myself

Представьте себе: у вас прекрасный день, вы приготовили вкусный ужин, прогулялись по окрестностям и чувствуете себя превосходно. Ну, так просто не получится. Прекрасно? У автора этой статьи есть идеальное решение — настройка OpenTelemetry в фронтенд-проекте на ReactJS. Это идеальное решение, когда вы в хорошем настроении и нужно вернуть себе хмурое выражение лица в понедельник утром. В статье разбираются тонкости настройки OpenTelemetry.

👍4🔥2

2.73K views12:01

Мониторим ИТ

Как мы сократили потребление памяти мониторингом на 75%, мигрируя с Prometheus на VictoriaMetrics Agent в OKD-кластерах

В этой статье автор рассказывает про то, как устроен мониторинг в OKD-кластерах, какие у него есть минусы и как они их побороли, мигрируя основную функциональность на VictoriaMetrics Agent.

👍7👎1🔥1

2.88K views05:59

Мониторим ИТ

Как Dropbox восстановил свой стек журналов с помощью Grafana Loki после отключения центра обработки данных

Два года назад из-за отключения электроэнергии центр обработки данных Dropbox был выведен из строя.

Это был не просто центр обработки данных. Это был единственный центр, где Dropbox размещал Grafana Loki , а это означало, что инженеры не могли получить доступ к данным журналов.

«Мы учитывали возможность сбоя в работе центра обработки данных, когда развёртывали Loki, но приоритет этой задачи так и не был достаточно высоким, чтобы внедрить её в несколько центров обработки данных», — сказал Крис Ходжес, инженер по инфраструктурному программному обеспечению в компании, занимающейся облачным хранением данных. «И теперь нам пришлось за это расплачиваться».

Этот инцидент стал переломным моментом для Dropbox, которая превратила единый распределённый кластер Loki в надёжную платформу логирования петабайтного масштаба, одновременно совмещая потребности разработчиков и операционные реалии. В результате Dropbox теперь может обрабатывать до 6 ГБ логов в секунду, имея в хранилище до 5 ПБ данных в любой момент времени в рамках своей расширенной 30-дневной политики хранения. Читать дальше в блоге Grafana.

👍4❤2🔥1

3.05K views12:03

Мониторим ИТ

Кто бы мог подумать несколько лет назад, что Grafana когда-то попадет в квадрант Гартнер по Observability-платформам.

Кстати, кто искал Appdynamics, они теперь выступают от лица Splunk.

Прочитать отчет полностью

👍4🔥2

4.09K views06:17

About

Blog

Apps

Platform