Мониторим ИТ
7.57K subscribers
99 photos
2 files
1.38K links
Это канал о мониторинге ИТ-инфраструктуры и приложений (Monitoring & Observability Channel)

Консультации Настройка Вопросы @antoniusfirst

@usr_bin_linux — канал об ИТ-инфраструктуре (Linux, Kubernetes, Docker, Terraform, etc.)
Download Telegram
Jaeger v2

Цель статьи показать на практике, как внедрить Jaeger в продукт на микросервисах. Ссылку на код всего, о чем пойдет речь дальше, можно найти в конце статьи.
👍4
What is Observability 3.0?

То, что начиналось как разрозненные журналы, метрики и трассировки, превратилось в Observability 2.0 — унифицированный подход, который использует контекстно-обогащенные данные и стандартизированную телеметрию на базе OpenTelemetry. Читать дальше.

❗️Статья на medium.com
3👍3
Faster incident response through distributed tracing: Inside Glovo's use of Traces Drilldown

Статья посвящена опыту использования в Glovo инструмента от Grafana — Traces Drilldown.
🔥3👍1
dockprom

Решение с открытым исходным кодом для мониторинга контейнеров Docker совместно с Prometheus, Grafana , cAdvisor , NodeExporter и возможностью отправки оповещений в AlertManager.

Репыч на Гитхабе
👍9🤔2🔥1
KubeShark: Wireshark for Kubernetes

Wireshark — известный инструмент для захвата пакетов, анализа и устранения неполадок. TCPDump/Wireshark дает возможность визуализировать и понимать, что происходит в сети. Представьте, если бы что-то подобное было возможно в K8s, если бы вы могли видеть, что именно происходит при развертывании кластера, получении подов, создании учетной записи службы и как различные процессы взаимодействуют друг с другом и т. д.

Чтобы увидеть, что именно происходит при запуске команды kubectl, можно просто использовать флаг verbose, например, kubectl get pods -v=6. Уровень вербализации начинается с 0 и заканчивается на 9, где 0 — это минимум, а 9 — максимум вербализации.

Kubectl с флагом -v позволяет видеть вызовы API L7, но не позволяет отслеживать сетевой трафик. Kubeshark захватывает L3 и L7, фактически у него есть доступ ко всему пакету L2. А еще он включает дашборд для визуализации примерно того же самого, как и в Wireshark.

Статья с описанием kubeshark (❗️статья на medium.com)

Репыч на Гитхабе
👍7🔥51
Облако ITENTIS CLOUD: технологии топов, цена без наценки (и живая поддержка!)

Нашли брендовую вещь в надежном маркете на 30% дешевле? Вот и мы так же. 😉

ITENTIS CLOUD — не "бюджетный" вариант. Это ВСЕ те же технологии, что у Яндекса, Mail или VK (VPC, Kubernetes, S3, снимки, автомасштабирование), но...

🔥 ...ЗНАЧИТЕЛЬНО ДЕШЕВЛЕ! 🔥

Зачем платить за бренд? Получите то же самое (а кое-что лучше) и сэкономьте. Не верите? Сравните тарифы! Надежные дата-центры Tier III, как у всех.

И главное — наша поддержка. Вот где мы их РЕАЛЬНО обходим:

💩 У них: очереди, боты, ответ "в течение 24 часов".
😍 У нас: живой, компетентный специалист 24/7. Не бот! Настоящий человек, который РАЗБЕРЕТСЯ. Ответ за минуты. Сложный Kubernetes? Объясним и поможем. Это наш стандарт.

Что вы получаете за меньшие деньги:

1. Та же "начинка": все ключевые технологии (VPC, Kubernetes, S3 и т.д.) — как у топов.
2. Надежность: Tier III, 2FA, шифрование, брандмауэры.
3. Скорость: запуск кластера быстрее доставки пиццы.
4. Простой контроль: интуитивное управление.
5. ГЛАВНОЕ: цена, от которой улыбнетесь + поддержка, которая реально спасает.

"А подвох?"
Да нигде!

14 дней БЕСПЛАТНО: Протестируйте всё.
БЕСПЛАТНАЯ миграция: Перенесем ваши проекты без простоев.
Гарантия возврата: Риск — ноль.

‼️ Понравится? Расскажите друзьям! Реферальная программа: за каждого клиента — бонус или скидка. Без мишуры.

Итог:
ITENTIS CLOUD = Технологии топов + Честная цена + Человеческая поддержка 24/7.

Хватит переплачивать и ждать ответа! Получите максимум.

👉 Действуйте выгодно:

1. Сравните тарифы: https://itentis.cloud
2. Пишите:
🤖 Telegram-бот: @itentis_bot (Фраза: "Хочу облако дешевле Яндекса!")
✉️ Почта: [email protected]
3. Скажите: "Читал пост про ЭКОНОМИЮ в облаке!" 🚀 (Получите бонус!)
4. Следите за обновлениями в @itentis

Мощное облако. Честная цена. Люди на связи.

Реклама. ООО «АВАНГАРД», ИНН 7729648547, erid: 2VtzquyfDAf
👎2
От хаоса к ясности с дашбордами Grafana: как компания EA, выпускающая видеоигры, отслеживает более 200 показателей

В своем выступлении на GrafanaCON 2025 инженер-программист EA Кенн Чен рассказал, как он использовал Grafana для создания того, что он называет системой «функционального дашборда», который позволяет разработчикам эффективно отслеживать статус приложения. Раньше полный обзор мог быть завершен за несколько часов — «или, может быть, никогда, я буду честен», — пошутил он, — а теперь работа может быть выполнена за малую часть этого времени. «Наши разработчики после надлежащего обучения могут просмотреть 200 показателей примерно за 10 минут», — сказал он, — «и это позволяет всегда следить за всем, что важно». Читать дальше в блоге Grafana.
🔥3👍1
Как мы написали поверх Sentry кастомную систему профилирования приложения на проде

В этой статье автор рассказывает что можно сделать, если пользователи постоянно жалуются, что приложение тормозит, а вы не знаете, почему. Читать на Хабре.
🔥6👍3👎1
Как виртуальная машина в облаке пишет данные на диск?

Рассказываем в новом выпуске реалити Building the Cloud на примере MWS Cloud Platform — нового облака от MWS.

Разберём:
как работает связка "ВМ-диск" под капотом
как это реализовано в MWS Cloud Platform
наш опыт использования SPDK и v-host user
как планируем развивать системы хранения данных в новом облаке

Эфир будет интересен бэкенд-инженерам, системным инженерам и DevOps-специалистам и всем, кто интересуется облаками.

За лучший вопрос — фирменный мерч.

📆 16 июля в 14:00 (мск)
Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
What's new in ClickStack?

Примерно месяц назад был анонсирован ClickStack — стек наблюдения с открытым исходным кодом, созданный на основе ClickHouse, который упрощает объединение журналов, метрик, трассировок и воспроизведения сеансов — и все это на базе одного и того же о движка.

Одно из самых больших преимуществ ClickStack заключается в том, как он объединяет быстрый поиск и быстрые агрегации по данным с высокой кардинальностью и широкими событиями в открытом исходном коде. Используя OpenTelemetry для сбора данных и HyperDX в качестве уровня пользовательского интерфейса, ClickStack обеспечивает полный готовый опыт наблюдения, от приема до мощного визуального исследования.

Месяц — это долгий срок в ClickHouse. С момента первого релиза вендор активно работал над добавлением новых функций и улучшений, чтобы сделать ClickStack ещё мощнее и проще в использовании. Начиная с этого месяца, они будут регулярно публиковать новости о новых возможностях, чтобы пользователи могли быстро воспользоваться последними улучшениями в ClickStack.

Подробнее в блоге Clickhouse
👍5🔥3
Автоматизация мониторинга: как заставить скрипты работать вместо вас

Ручной мониторинг серверов и логов - это как разжигать костёр вместо использования микроволновки. Если вы вручную проверяете логи, доступность сервисов или реагируете на алерты посредством почты - попробуйте перейти на автоматизацию.

Статья наполнена набором скриптов, которые можно использовать в случаях, когда разворачивание системы мониторинга кажется избыточным.
👍32🔥2
Приглашаем на дополнительный тренинг ZCS 📅 4-8 августа!

Почему стоит пройти официальный тренинг от создателей Zabbix?

Если вы хотите, чтобы ваша система мониторинга Zabbix работала не просто "как-то", а стабильно, надёжно и по максимуму эффективно — обучение от разработчиков Zabbix просто must-have. Вот почему:

💡 1. Быстрый старт без граблей
Сотрудники разберутся в Zabbix с нуля или систематизируют уже имеющиеся знания. Без боли, экспериментов и потери времени — только проверенные практики и рабочие кейсы.

📚 2. Только актуальные знания
Все материалы составлены самим Zabbix. Никаких устаревших гайдов с форумов — только то, что действительно работает в последних версиях.

🎓 3. Официальный сертификат
После тренинга можно сдать экзамен и получить международный сертификат, который подтверждает уровень знаний. Это не просто бумажка — это реальное подтверждение экспертизы.

🚀 4. Рост внутри команды
Обученные сотрудники — уверенные сотрудники. Они смогут быстрее находить и решать проблемы, а не тратить часы на разбор логов и эксперименты с триггерами.

💬 5. Возможность задать вопросы экспертам
На тренинге можно напрямую обсудить рабочие задачи и нюансы, с которыми сталкиваются именно ваши специалисты. Это не просто теория — это практическая польза.

🧰 6. Больше, чем документация
Даже если кто-то "и так всё умеет" — после тренинга появится масса новых идей, лайфхаков и инструментов, которые раньше просто не приходили в голову.

💸 7. Экономия времени и денег
Сотрудники не будут тратить дни на поиск решений. Они будут знать, где и как искать, и как правильно настраивать систему с первого раза.

🌍 8. Международный стандарт
Zabbix используют тысячи компаний по всему миру. Официальные знания — это способ выйти на один уровень с лидерами рынка и крупными игроками.

👥 9. Командная синергия
Когда вся команда говорит на одном языке и понимает логику системы, работать становится проще. Меньше недопонимания — больше эффективности.

🔐 10. Безопасность и надёжность
Zabbix — это не просто метрики. Это и безопасность, и отказоустойчивость. А грамотная настройка начинается с грамотных специалистов.

🎓 Тренинг Zabbix Сертифицированный Специалист 7.0 (ZCS 7.0) 📅 4-8 августа 2025

❗️ Полное расписание тренингов

Запрос дополнительной информации можно отправить @galssoftware или на [email protected].

erid: 2Vtzqv9kf9k
👍32👎2🔥1🤔1
Introducing ClickStack: The Future of Observability on ClickHouse

В этом видео представители Clickhouse рассказывают о возможностях и преимуществах ClickStack — observability-инструмента.

Напомню, они скрестили HyperDX c ClickHouse и получили франкенштейна ClickStack.
🔥5👍1
Как работать с инцидентами, когда на кону большие деньги

В этой статье тимлид группы мониторинга в Купере Дарья Попова рассказывает как они выстраивали процессы и инструменты мониторинга и автоматизации — и как это все упростило им жизнь.
🔥8👍1
🔒 Производительные VPS от WAICORE

🛍 -25% на все услуги! Но не надолго.

В жару нам перегрело головы, и мы решили порадовать всех скидками.

Что входит в этот безумный праздник:

- Все VPS на AMD Ryzen 9 — дешевле на четверть
- Все локации (Германия, Москва) — везде скидка
- Скидка действует даже на выделенные серверы

Действует ДО 25.07.
Всем теплого лета!

👉Жми сюда и забирай скидку
Вопросы? Пиши @waicore_help

P.S. Следите за новостями, летом будет много анонсов.

Реклама. ИП Ушаков Е.А., ИНН 631705529337, erid: 2Vtzqv8jph6
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3👎2🔥2
Scaling Observability: Why TiDB Moved from Prometheus to VictoriaMetrics

С самого начала Prometheus служил основным инструментом для сбора, хранения, выполнения запросов и наблюдения за метриками производительности в режиме реального времени в компании TiDB. По мере масштабирования развёртываний росли и сложности использования Prometheus. В этой статье рассмотрены эти трудности и причины, по которым TiDB в конечном итоге перешли на VictoriaMetrics — высокопроизводительную базу данных временных рядов и решение для мониторинга с открытым исходным кодом. Читать дальше.
5👎2👍1🔥1
Проблемы с производительностью веб-сервисов: как находить и устранять

Производительность — это базовое требование в разработке. Однако не всегда о базово высокой производительности говорят на этапе обсуждения проекта. Заказчик вряд ли скажет: «Сделайте так, чтобы сайт отвечал за Х мс», но он точно удивится и расстроится, если все будет грузиться медленно. В команде тоже мало кто рад: проект сдан, а теперь приходится выяснять, что тормозит и почему.

Эта статья — для тех, кто хочет понять, где обычно прячутся проблемы с производительностью, как их не пропустить и устранить.
👍5👎32
Использование метрик для мониторинга облачных баз данных на примере PostgreSQL

Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики от DBaaS в сочетании с Grafana. Они позволяют строить кастомные графики, которые могут быть полезны в той или иной ситуации.

В этой статье DevOps-инженер Selectel Рамиль Адильбеков показывает, как можно настроить базовый стек Prometheus/Grafana, подключить метрики от кластера облачных баз данных и загрузить дашборд.
3👍1👎1🔥1
Three Mighty Alerts Supporting Hugging Face’s Production Infrastructure

В этой статье техническая команда компании Hugging Face по инфраструктуре делится закулисным взглядом на внутреннюю работу боевой инфраструктуры Hugging Face. В этой статье подробно рассматривают три важных оповещения, которые играют уникальную роль в поддержке инфраструктуры, и выясняют, как они помогли поддерживать высокий уровень производительности и бесперебойной работы.
1
Все, что вы хотели знать про резервное копирование в S3
5 августа | 12:00


Эксперты из Selectel и Хайтекс Акура проведут вебинар, где расскажут:
 
🛠как настроить резервное копирование виртуальных машин и облаков,
🛠зачем нужна интеграция S3-хранилища с другими сервисами и как это сделать,
🛠как автоматизировать создание бэкапов.

Вебинар бесплатный. Подробности и регистрация по ссылке: https://slc.tl/kovgm
 
Чтобы не пропустить вебинар и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxY4eye
Setting Up OpenTelemetry on the Frontend Because I Hate Myself

Представьте себе: у вас прекрасный день, вы приготовили вкусный ужин, прогулялись по окрестностям и чувствуете себя превосходно. Ну, так просто не получится. Прекрасно? У автора этой статьи есть идеальное решение — настройка OpenTelemetry в фронтенд-проекте на ReactJS. Это идеальное решение, когда вы в хорошем настроении и нужно вернуть себе хмурое выражение лица в понедельник утром. В статье разбираются тонкости настройки OpenTelemetry.
👍3🔥2