Мониторим ИТ

Использование метрик для мониторинга облачных баз данных на примере PostgreSQL

Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики от DBaaS в сочетании с Grafana. Они позволяют строить кастомные графики, которые могут быть полезны в той или иной ситуации.

В этой статье DevOps-инженер Selectel Рамиль Адильбеков показывает, как можно настроить базовый стек Prometheus/Grafana, подключить метрики от кластера облачных баз данных и загрузить дашборд.

❤3👍1👎1🔥1

2.83K views12:04

Мониторим ИТ

Three Mighty Alerts Supporting Hugging Face’s Production Infrastructure

В этой статье техническая команда компании Hugging Face по инфраструктуре делится закулисным взглядом на внутреннюю работу боевой инфраструктуры Hugging Face. В этой статье подробно рассматривают три важных оповещения, которые играют уникальную роль в поддержке инфраструктуры, и выясняют, как они помогли поддерживать высокий уровень производительности и бесперебойной работы.

❤1

2.48K views06:06

Мониторим ИТ

Все, что вы хотели знать про резервное копирование в S3
5 августа | 12:00

Эксперты из Selectel и Хайтекс Акура проведут вебинар, где расскажут:

🛠как настроить резервное копирование виртуальных машин и облаков,
🛠зачем нужна интеграция S3-хранилища с другими сервисами и как это сделать,
🛠как автоматизировать создание бэкапов.

Вебинар бесплатный. Подробности и регистрация по ссылке: https://slc.tl/kovgm

Чтобы не пропустить вебинар и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxY4eye

2.29K views10:04

Мониторим ИТ

Setting Up OpenTelemetry on the Frontend Because I Hate Myself

Представьте себе: у вас прекрасный день, вы приготовили вкусный ужин, прогулялись по окрестностям и чувствуете себя превосходно. Ну, так просто не получится. Прекрасно? У автора этой статьи есть идеальное решение — настройка OpenTelemetry в фронтенд-проекте на ReactJS. Это идеальное решение, когда вы в хорошем настроении и нужно вернуть себе хмурое выражение лица в понедельник утром. В статье разбираются тонкости настройки OpenTelemetry.

👍4🔥2

2.08K views12:01

Мониторим ИТ

Как мы сократили потребление памяти мониторингом на 75%, мигрируя с Prometheus на VictoriaMetrics Agent в OKD-кластерах

В этой статье автор рассказывает про то, как устроен мониторинг в OKD-кластерах, какие у него есть минусы и как они их побороли, мигрируя основную функциональность на VictoriaMetrics Agent.

👍6👎1🔥1

2.26K views05:59

Мониторим ИТ

Как Dropbox восстановил свой стек журналов с помощью Grafana Loki после отключения центра обработки данных

Два года назад из-за отключения электроэнергии центр обработки данных Dropbox был выведен из строя.

Это был не просто центр обработки данных. Это был единственный центр, где Dropbox размещал Grafana Loki , а это означало, что инженеры не могли получить доступ к данным журналов.

«Мы учитывали возможность сбоя в работе центра обработки данных, когда развёртывали Loki, но приоритет этой задачи так и не был достаточно высоким, чтобы внедрить её в несколько центров обработки данных», — сказал Крис Ходжес, инженер по инфраструктурному программному обеспечению в компании, занимающейся облачным хранением данных. «И теперь нам пришлось за это расплачиваться».

Этот инцидент стал переломным моментом для Dropbox, которая превратила единый распределённый кластер Loki в надёжную платформу логирования петабайтного масштаба, одновременно совмещая потребности разработчиков и операционные реалии. В результате Dropbox теперь может обрабатывать до 6 ГБ логов в секунду, имея в хранилище до 5 ПБ данных в любой момент времени в рамках своей расширенной 30-дневной политики хранения. Читать дальше в блоге Grafana.

👍4❤2🔥1

2.28K views12:03

Мониторим ИТ

Кто бы мог подумать несколько лет назад, что Grafana когда-то попадет в квадрант Гартнер по Observability-платформам.

Кстати, кто искал Appdynamics, они теперь выступают от лица Splunk.

Прочитать отчет полностью

👍4🔥2

2.5K views06:17

Мониторим ИТ

15 лучших библиотек для визуализации данных, о которых должен знать каждый разработчик

Когда одной Grafana уже недостаточно. Читать перевод статьи на Хабре

🔥4👍1

3.15K views12:06

Мониторим ИТ

Опыт эксплуатации Service Mesh в Авито

В этой статье рассказывают про Service Mesh, и показывают, что это, скорее, не конечная точка, где можно найти «серебряную пулю» от всех проблем, а путь, который, возможно, никогда не закончится: придется постоянно куда-то бежать и что-то дорабатывать. В статье также разбирается, как работает Service Mesh в Авито. Читать дальше.

👍2

2.48K views13:23

Мониторим ИТ

📌SysAdmin 2025 — большая конференция для системных администраторов.

17 октября в Москве пройдет конференция SysAdmin 2025 для системных администраторов, ИТ-менеджеров, инженеров и специалистов поддержки.

Доклады будут посвящены практическим задачам по разным направлениям:
🔹 Управление рабочими местами на Windows, Linux, macOS;
🔹 Решения MDM, UEM, EMM;
🔹 Администрирование Apple;
🔹 Управление ИТ-инфраструктурой и мониторинг;
🔹 Информационная безопасность для системных администраторов;
🔹 Миграция на Linux;
🔹 Организация работы ИТ-отделов и поддержки;
и другое.

Ожидается порядка 700 участников, ИТ-выставка, насыщенная программа, неформальное общение и квиз с призами.

📍 Место: Москва, кластер «Ломоносов»
📅 Дата: 17 октября 2025
⏱️ Формат: офлайн, 1 день
🎟 Участие: бесплатное, по предварительной регистрации на sysadminconf.ru

Если вы хотите выступить с докладом — заявки принимаются на сайте или по почте [email protected].

#реклама
О рекламодателе

👍3❤2🤔2

3.08K views10:31

Мониторим ИТ

Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser

В этой статье автор рассказывает о собственной разработке Statuser — платформе для мониторинга доступности сайтов, приложений и серверов, о том как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса. Читать дальше.

👍8🔥1

2.02K views08:53

Мониторим ИТ

Production Kubernetes Logging-VictoriaLogs

В этой статье разбирают сбор логов Kubernetes (EKS) в VictoriaLogs.

❗️статья на medium.com

👍4🔥3

1.78K views05:25

Мониторим ИТ

Как выбрать сервер для 1С — и не сломаться?

Какие требования к процессору нужно учесть? Стоит ли использовать сервер с двумя процессорами? Разворачивать сервер в облаке или на земле? Какие частые ошибки бывают?

Забирайте годное исследование на 16 пунктов с кейсами, таблицами и примерами!

Забрать исследование

Реклама. ООО "ИТЕЛОН". ИНН 7701527528. erid: 2W5zFFzGCHn

👍3👎3❤2

1.58K views14:34

Мониторим ИТ

Why I recommend native Prometheus instrumentation over OpenTelemetry

Учитывая хайп вокруг OpenTelemetry, у желающих замониторить свои приложения может возникнуть соблазн использовать OpenTelemetry и его SDK для всех задач инструментирования. Однако, когда дело доходит до генерации метрик в Prometheus, стоит дважды подумать, прежде чем полностью довериться OTel. Вы рискуете не только отказаться от некоторых основных функций, которые делают Prometheus системой мониторинга, но и столкнуться с неудобными проблемами преобразования метрик и обхода их, а также с другими недостатками и сложностями. Именно поэтому автор этой статьи рекомендует использовать собственные клиентские библиотеки инструментирования Prometheus вместо SDK OTel, если нужно получить наилучший опыт мониторинга Prometheus. В этой статье рассмотрены причины такого подхода.

🔥3👍1

1.45K views11:40

Мониторим ИТ

Планируете ввести SLI, SLO или SLA?

Сначала посмотрите это видео! В новом выпуске AviСast, подкаста Авито о насущных вопросах разработки, ребята обсудили опыт внедрения этих показателей и инциденты из практики:

📺

Youtube

🔵

VK Видео

💻

Rutube

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3👎2

1.24K views14:36

About

Blog

Apps

Platform