Автоматизация мониторинга: как заставить скрипты работать вместо вас
Ручной мониторинг серверов и логов - это как разжигать костёр вместо использования микроволновки. Если вы вручную проверяете логи, доступность сервисов или реагируете на алерты посредством почты - попробуйте перейти на автоматизацию.
Статья наполнена набором скриптов, которые можно использовать в случаях, когда разворачивание системы мониторинга кажется избыточным.
Ручной мониторинг серверов и логов - это как разжигать костёр вместо использования микроволновки. Если вы вручную проверяете логи, доступность сервисов или реагируете на алерты посредством почты - попробуйте перейти на автоматизацию.
Статья наполнена набором скриптов, которые можно использовать в случаях, когда разворачивание системы мониторинга кажется избыточным.
👍3❤2🔥2
Приглашаем на дополнительный тренинг ZCS 📅 4-8 августа!
Почему стоит пройти официальный тренинг от создателей Zabbix?
Если вы хотите, чтобы ваша система мониторинга Zabbix работала не просто "как-то", а стабильно, надёжно и по максимуму эффективно — обучение от разработчиков Zabbix просто must-have. Вот почему:
💡 1. Быстрый старт без граблей
Сотрудники разберутся в Zabbix с нуля или систематизируют уже имеющиеся знания. Без боли, экспериментов и потери времени — только проверенные практики и рабочие кейсы.
📚 2. Только актуальные знания
Все материалы составлены самим Zabbix. Никаких устаревших гайдов с форумов — только то, что действительно работает в последних версиях.
🎓 3. Официальный сертификат
После тренинга можно сдать экзамен и получить международный сертификат, который подтверждает уровень знаний. Это не просто бумажка — это реальное подтверждение экспертизы.
🚀 4. Рост внутри команды
Обученные сотрудники — уверенные сотрудники. Они смогут быстрее находить и решать проблемы, а не тратить часы на разбор логов и эксперименты с триггерами.
💬 5. Возможность задать вопросы экспертам
На тренинге можно напрямую обсудить рабочие задачи и нюансы, с которыми сталкиваются именно ваши специалисты. Это не просто теория — это практическая польза.
🧰 6. Больше, чем документация
Даже если кто-то "и так всё умеет" — после тренинга появится масса новых идей, лайфхаков и инструментов, которые раньше просто не приходили в голову.
💸 7. Экономия времени и денег
Сотрудники не будут тратить дни на поиск решений. Они будут знать, где и как искать, и как правильно настраивать систему с первого раза.
🌍 8. Международный стандарт
Zabbix используют тысячи компаний по всему миру. Официальные знания — это способ выйти на один уровень с лидерами рынка и крупными игроками.
👥 9. Командная синергия
Когда вся команда говорит на одном языке и понимает логику системы, работать становится проще. Меньше недопонимания — больше эффективности.
🔐 10. Безопасность и надёжность
Zabbix — это не просто метрики. Это и безопасность, и отказоустойчивость. А грамотная настройка начинается с грамотных специалистов.
🎓 Тренинг Zabbix Сертифицированный Специалист 7.0 (ZCS 7.0) 📅 4-8 августа 2025
❗️ Полное расписание тренингов
Запрос дополнительной информации можно отправить @galssoftware или на [email protected].
erid: 2Vtzqv9kf9k
Почему стоит пройти официальный тренинг от создателей Zabbix?
Если вы хотите, чтобы ваша система мониторинга Zabbix работала не просто "как-то", а стабильно, надёжно и по максимуму эффективно — обучение от разработчиков Zabbix просто must-have. Вот почему:
💡 1. Быстрый старт без граблей
Сотрудники разберутся в Zabbix с нуля или систематизируют уже имеющиеся знания. Без боли, экспериментов и потери времени — только проверенные практики и рабочие кейсы.
📚 2. Только актуальные знания
Все материалы составлены самим Zabbix. Никаких устаревших гайдов с форумов — только то, что действительно работает в последних версиях.
🎓 3. Официальный сертификат
После тренинга можно сдать экзамен и получить международный сертификат, который подтверждает уровень знаний. Это не просто бумажка — это реальное подтверждение экспертизы.
🚀 4. Рост внутри команды
Обученные сотрудники — уверенные сотрудники. Они смогут быстрее находить и решать проблемы, а не тратить часы на разбор логов и эксперименты с триггерами.
💬 5. Возможность задать вопросы экспертам
На тренинге можно напрямую обсудить рабочие задачи и нюансы, с которыми сталкиваются именно ваши специалисты. Это не просто теория — это практическая польза.
🧰 6. Больше, чем документация
Даже если кто-то "и так всё умеет" — после тренинга появится масса новых идей, лайфхаков и инструментов, которые раньше просто не приходили в голову.
💸 7. Экономия времени и денег
Сотрудники не будут тратить дни на поиск решений. Они будут знать, где и как искать, и как правильно настраивать систему с первого раза.
🌍 8. Международный стандарт
Zabbix используют тысячи компаний по всему миру. Официальные знания — это способ выйти на один уровень с лидерами рынка и крупными игроками.
👥 9. Командная синергия
Когда вся команда говорит на одном языке и понимает логику системы, работать становится проще. Меньше недопонимания — больше эффективности.
🔐 10. Безопасность и надёжность
Zabbix — это не просто метрики. Это и безопасность, и отказоустойчивость. А грамотная настройка начинается с грамотных специалистов.
🎓 Тренинг Zabbix Сертифицированный Специалист 7.0 (ZCS 7.0) 📅 4-8 августа 2025
❗️ Полное расписание тренингов
Запрос дополнительной информации можно отправить @galssoftware или на [email protected].
erid: 2Vtzqv9kf9k
👍3❤2👎2🔥1🤔1
Introducing ClickStack: The Future of Observability on ClickHouse
В этом видео представители Clickhouse рассказывают о возможностях и преимуществах ClickStack — observability-инструмента.
Напомню, они скрестили HyperDX c ClickHouse и получилифранкенштейна ClickStack.
В этом видео представители Clickhouse рассказывают о возможностях и преимуществах ClickStack — observability-инструмента.
Напомню, они скрестили HyperDX c ClickHouse и получили
🔥5👍1
Как работать с инцидентами, когда на кону большие деньги
В этой статье тимлид группы мониторинга в Купере Дарья Попова рассказывает как они выстраивали процессы и инструменты мониторинга и автоматизации — и как это все упростило им жизнь.
В этой статье тимлид группы мониторинга в Купере Дарья Попова рассказывает как они выстраивали процессы и инструменты мониторинга и автоматизации — и как это все упростило им жизнь.
🔥8👍1
В жару нам перегрело головы, и мы решили порадовать всех скидками.
- Все VPS на AMD Ryzen 9 — дешевле на четверть
- Все локации (Германия, Москва) — везде скидка
- Скидка действует даже на выделенные серверы
Всем теплого лета!
P.S. Следите за новостями, летом будет много анонсов.
Реклама. ИП Ушаков Е.А., ИНН 631705529337, erid: 2Vtzqv8jph6
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍3👎2🔥2
Scaling Observability: Why TiDB Moved from Prometheus to VictoriaMetrics
С самого начала Prometheus служил основным инструментом для сбора, хранения, выполнения запросов и наблюдения за метриками производительности в режиме реального времени в компании TiDB. По мере масштабирования развёртываний росли и сложности использования Prometheus. В этой статье рассмотрены эти трудности и причины, по которым TiDB в конечном итоге перешли на VictoriaMetrics — высокопроизводительную базу данных временных рядов и решение для мониторинга с открытым исходным кодом. Читать дальше.
С самого начала Prometheus служил основным инструментом для сбора, хранения, выполнения запросов и наблюдения за метриками производительности в режиме реального времени в компании TiDB. По мере масштабирования развёртываний росли и сложности использования Prometheus. В этой статье рассмотрены эти трудности и причины, по которым TiDB в конечном итоге перешли на VictoriaMetrics — высокопроизводительную базу данных временных рядов и решение для мониторинга с открытым исходным кодом. Читать дальше.
❤5👎2👍1🔥1
Проблемы с производительностью веб-сервисов: как находить и устранять
Производительность — это базовое требование в разработке. Однако не всегда о базово высокой производительности говорят на этапе обсуждения проекта. Заказчик вряд ли скажет: «Сделайте так, чтобы сайт отвечал за Х мс», но он точно удивится и расстроится, если все будет грузиться медленно. В команде тоже мало кто рад: проект сдан, а теперь приходится выяснять, что тормозит и почему.
Эта статья — для тех, кто хочет понять, где обычно прячутся проблемы с производительностью, как их не пропустить и устранить.
Производительность — это базовое требование в разработке. Однако не всегда о базово высокой производительности говорят на этапе обсуждения проекта. Заказчик вряд ли скажет: «Сделайте так, чтобы сайт отвечал за Х мс», но он точно удивится и расстроится, если все будет грузиться медленно. В команде тоже мало кто рад: проект сдан, а теперь приходится выяснять, что тормозит и почему.
Эта статья — для тех, кто хочет понять, где обычно прячутся проблемы с производительностью, как их не пропустить и устранить.
👍5👎3❤2
Использование метрик для мониторинга облачных баз данных на примере PostgreSQL
Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики от DBaaS в сочетании с Grafana. Они позволяют строить кастомные графики, которые могут быть полезны в той или иной ситуации.
В этой статье DevOps-инженер Selectel Рамиль Адильбеков показывает, как можно настроить базовый стек Prometheus/Grafana, подключить метрики от кластера облачных баз данных и загрузить дашборд.
Если вы работаете с базами данных, то вам определенно стоит иметь понимание о производительности кластера СУБД. Для этого можно использовать базовые метрики. А можно — метрики от DBaaS в сочетании с Grafana. Они позволяют строить кастомные графики, которые могут быть полезны в той или иной ситуации.
В этой статье DevOps-инженер Selectel Рамиль Адильбеков показывает, как можно настроить базовый стек Prometheus/Grafana, подключить метрики от кластера облачных баз данных и загрузить дашборд.
❤3👍1👎1🔥1
Three Mighty Alerts Supporting Hugging Face’s Production Infrastructure
В этой статье техническая команда компании Hugging Face по инфраструктуре делится закулисным взглядом на внутреннюю работу боевой инфраструктуры Hugging Face. В этой статье подробно рассматривают три важных оповещения, которые играют уникальную роль в поддержке инфраструктуры, и выясняют, как они помогли поддерживать высокий уровень производительности и бесперебойной работы.
В этой статье техническая команда компании Hugging Face по инфраструктуре делится закулисным взглядом на внутреннюю работу боевой инфраструктуры Hugging Face. В этой статье подробно рассматривают три важных оповещения, которые играют уникальную роль в поддержке инфраструктуры, и выясняют, как они помогли поддерживать высокий уровень производительности и бесперебойной работы.
❤1
Все, что вы хотели знать про резервное копирование в S3
5 августа | 12:00
Эксперты из Selectel и Хайтекс Акура проведут вебинар, где расскажут:
🛠как настроить резервное копирование виртуальных машин и облаков,
🛠зачем нужна интеграция S3-хранилища с другими сервисами и как это сделать,
🛠как автоматизировать создание бэкапов.
Вебинар бесплатный. Подробности и регистрация по ссылке: https://slc.tl/kovgm
Чтобы не пропустить вебинар и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxY4eye
5 августа | 12:00
Эксперты из Selectel и Хайтекс Акура проведут вебинар, где расскажут:
🛠как настроить резервное копирование виртуальных машин и облаков,
🛠зачем нужна интеграция S3-хранилища с другими сервисами и как это сделать,
🛠как автоматизировать создание бэкапов.
Вебинар бесплатный. Подробности и регистрация по ссылке: https://slc.tl/kovgm
Чтобы не пропустить вебинар и узнавать о других мероприятиях, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqxY4eye
Setting Up OpenTelemetry on the Frontend Because I Hate Myself
Представьте себе: у вас прекрасный день, вы приготовили вкусный ужин, прогулялись по окрестностям и чувствуете себя превосходно. Ну, так просто не получится. Прекрасно? У автора этой статьи есть идеальное решение — настройка OpenTelemetry в фронтенд-проекте на ReactJS. Это идеальное решение, когда вы в хорошем настроении и нужно вернуть себе хмурое выражение лица в понедельник утром. В статье разбираются тонкости настройки OpenTelemetry.
Представьте себе: у вас прекрасный день, вы приготовили вкусный ужин, прогулялись по окрестностям и чувствуете себя превосходно. Ну, так просто не получится. Прекрасно? У автора этой статьи есть идеальное решение — настройка OpenTelemetry в фронтенд-проекте на ReactJS. Это идеальное решение, когда вы в хорошем настроении и нужно вернуть себе хмурое выражение лица в понедельник утром. В статье разбираются тонкости настройки OpenTelemetry.
👍3🔥2
Как мы сократили потребление памяти мониторингом на 75%, мигрируя с Prometheus на VictoriaMetrics Agent в OKD-кластерах
В этой статье автор рассказывает про то, как устроен мониторинг в OKD-кластерах, какие у него есть минусы и как они их побороли, мигрируя основную функциональность на VictoriaMetrics Agent.
В этой статье автор рассказывает про то, как устроен мониторинг в OKD-кластерах, какие у него есть минусы и как они их побороли, мигрируя основную функциональность на VictoriaMetrics Agent.
👍5👎1🔥1
Как Dropbox восстановил свой стек журналов с помощью Grafana Loki после отключения центра обработки данных
Два года назад из-за отключения электроэнергии центр обработки данных Dropbox был выведен из строя.
Это был не просто центр обработки данных. Это был единственный центр, где Dropbox размещал Grafana Loki , а это означало, что инженеры не могли получить доступ к данным журналов.
«Мы учитывали возможность сбоя в работе центра обработки данных, когда развёртывали Loki, но приоритет этой задачи так и не был достаточно высоким, чтобы внедрить её в несколько центров обработки данных», — сказал Крис Ходжес, инженер по инфраструктурному программному обеспечению в компании, занимающейся облачным хранением данных. «И теперь нам пришлось за это расплачиваться».
Этот инцидент стал переломным моментом для Dropbox, которая превратила единый распределённый кластер Loki в надёжную платформу логирования петабайтного масштаба, одновременно совмещая потребности разработчиков и операционные реалии. В результате Dropbox теперь может обрабатывать до 6 ГБ логов в секунду, имея в хранилище до 5 ПБ данных в любой момент времени в рамках своей расширенной 30-дневной политики хранения. Читать дальше в блоге Grafana.
Два года назад из-за отключения электроэнергии центр обработки данных Dropbox был выведен из строя.
Это был не просто центр обработки данных. Это был единственный центр, где Dropbox размещал Grafana Loki , а это означало, что инженеры не могли получить доступ к данным журналов.
«Мы учитывали возможность сбоя в работе центра обработки данных, когда развёртывали Loki, но приоритет этой задачи так и не был достаточно высоким, чтобы внедрить её в несколько центров обработки данных», — сказал Крис Ходжес, инженер по инфраструктурному программному обеспечению в компании, занимающейся облачным хранением данных. «И теперь нам пришлось за это расплачиваться».
Этот инцидент стал переломным моментом для Dropbox, которая превратила единый распределённый кластер Loki в надёжную платформу логирования петабайтного масштаба, одновременно совмещая потребности разработчиков и операционные реалии. В результате Dropbox теперь может обрабатывать до 6 ГБ логов в секунду, имея в хранилище до 5 ПБ данных в любой момент времени в рамках своей расширенной 30-дневной политики хранения. Читать дальше в блоге Grafana.
👍3❤2🔥1
Кто бы мог подумать несколько лет назад, что Grafana когда-то попадет в квадрант Гартнер по Observability-платформам.
Кстати, кто искал Appdynamics, они теперь выступают от лица Splunk.
Прочитать отчет полностью
Кстати, кто искал Appdynamics, они теперь выступают от лица Splunk.
Прочитать отчет полностью
👍3🔥2
15 лучших библиотек для визуализации данных, о которых должен знать каждый разработчик
Когда одной Grafana уже недостаточно. Читать перевод статьи на Хабре
Когда одной Grafana уже недостаточно. Читать перевод статьи на Хабре
🔥4👍1
Опыт эксплуатации Service Mesh в Авито
В этой статье рассказывают про Service Mesh, и показывают, что это, скорее, не конечная точка, где можно найти «серебряную пулю» от всех проблем, а путь, который, возможно, никогда не закончится: придется постоянно куда-то бежать и что-то дорабатывать. В статье также разбирается, как работает Service Mesh в Авито. Читать дальше.
В этой статье рассказывают про Service Mesh, и показывают, что это, скорее, не конечная точка, где можно найти «серебряную пулю» от всех проблем, а путь, который, возможно, никогда не закончится: придется постоянно куда-то бежать и что-то дорабатывать. В статье также разбирается, как работает Service Mesh в Авито. Читать дальше.
👍2
📌SysAdmin 2025 — большая конференция для системных администраторов.
17 октября в Москве пройдет конференция SysAdmin 2025 для системных администраторов, ИТ-менеджеров, инженеров и специалистов поддержки.
Доклады будут посвящены практическим задачам по разным направлениям:
🔹 Управление рабочими местами на Windows, Linux, macOS;
🔹 Решения MDM, UEM, EMM;
🔹 Администрирование Apple;
🔹 Управление ИТ-инфраструктурой и мониторинг;
🔹 Информационная безопасность для системных администраторов;
🔹 Миграция на Linux;
🔹 Организация работы ИТ-отделов и поддержки;
и другое.
Ожидается порядка 700 участников, ИТ-выставка, насыщенная программа, неформальное общение и квиз с призами.
📍 Место: Москва, кластер «Ломоносов»
📅 Дата: 17 октября 2025
⏱️ Формат: офлайн, 1 день
🎟 Участие: бесплатное, по предварительной регистрации на sysadminconf.ru
Если вы хотите выступить с докладом — заявки принимаются на сайте или по почте [email protected].
#реклама
О рекламодателе
17 октября в Москве пройдет конференция SysAdmin 2025 для системных администраторов, ИТ-менеджеров, инженеров и специалистов поддержки.
Доклады будут посвящены практическим задачам по разным направлениям:
🔹 Управление рабочими местами на Windows, Linux, macOS;
🔹 Решения MDM, UEM, EMM;
🔹 Администрирование Apple;
🔹 Управление ИТ-инфраструктурой и мониторинг;
🔹 Информационная безопасность для системных администраторов;
🔹 Миграция на Linux;
🔹 Организация работы ИТ-отделов и поддержки;
и другое.
Ожидается порядка 700 участников, ИТ-выставка, насыщенная программа, неформальное общение и квиз с призами.
📍 Место: Москва, кластер «Ломоносов»
📅 Дата: 17 октября 2025
⏱️ Формат: офлайн, 1 день
🎟 Участие: бесплатное, по предварительной регистрации на sysadminconf.ru
Если вы хотите выступить с докладом — заявки принимаются на сайте или по почте [email protected].
#реклама
О рекламодателе
👍3❤2🤔1
Почему мониторинг — это ещё не всё. История появления статус пейджей в Statuser
В этой статье автор рассказывает о собственной разработке Statuser — платформе для мониторинга доступности сайтов, приложений и серверов, о том как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса. Читать дальше.
В этой статье автор рассказывает о собственной разработке Statuser — платформе для мониторинга доступности сайтов, приложений и серверов, о том как появилась функциональность, которая была в планах с самого начала — публичные страницы статуса. Читать дальше.
👍8🔥1
Production Kubernetes Logging-VictoriaLogs
В этой статье разбирают сбор логов Kubernetes (EKS) в VictoriaLogs.
❗️статья на medium.com
В этой статье разбирают сбор логов Kubernetes (EKS) в VictoriaLogs.
❗️статья на medium.com
👍4🔥3
Как выбрать сервер для 1С — и не сломаться?
Какие требования к процессору нужно учесть? Стоит ли использовать сервер с двумя процессорами? Разворачивать сервер в облаке или на земле? Какие частые ошибки бывают?
Забирайте годное исследование на 16 пунктов с кейсами, таблицами и примерами!
Забрать исследование
Реклама. ООО "ИТЕЛОН". ИНН 7701527528. erid: 2W5zFFzGCHn
Какие требования к процессору нужно учесть? Стоит ли использовать сервер с двумя процессорами? Разворачивать сервер в облаке или на земле? Какие частые ошибки бывают?
Забирайте годное исследование на 16 пунктов с кейсами, таблицами и примерами!
Забрать исследование
Реклама. ООО "ИТЕЛОН". ИНН 7701527528. erid: 2W5zFFzGCHn
❤2👍2👎2