🤔🤔 Как добавить системности в мониторинг продакшна: параметры и тулинг для инцидент-менеджмента
На проде что‑то сломалось — такова суровая реальность, случается с лучшими из нас, увы. Что обычно происходит в подобных случаях? Ловим алерты, бежим смотреть графики и логи, вызваниваем из отпуска разработчика, который занимался этой функциональностью, выкатываем фикс, рвем на себе бороду, проводим пост‑мортем. Это реакция на уровне здравого смысла, классика.
Но когда речь заходит о недозаработанных из‑за инцидента деньгах, расстроенных пользователях — любое улучшение, даже небольшое, на доли процента — может принести ощутимый результат.
Автор расскажет, как подойти к вопросу мониторинга методологически — задействовать инструментарий инцидент‑менеджмента. Обсудит, как оценивать критичность сервисов и какие системы могут быть полезны для отслеживания проблем.
Статья ориентирована в первую очередь на тех, кто прямо сейчас занимается мониторингом на уровне общей инженерной грамотности, но пока не использует в явном виде инцидент‑менеджмент как подход.
Читать статью
#почитать
На проде что‑то сломалось — такова суровая реальность, случается с лучшими из нас, увы. Что обычно происходит в подобных случаях? Ловим алерты, бежим смотреть графики и логи, вызваниваем из отпуска разработчика, который занимался этой функциональностью, выкатываем фикс, рвем на себе бороду, проводим пост‑мортем. Это реакция на уровне здравого смысла, классика.
Но когда речь заходит о недозаработанных из‑за инцидента деньгах, расстроенных пользователях — любое улучшение, даже небольшое, на доли процента — может принести ощутимый результат.
Автор расскажет, как подойти к вопросу мониторинга методологически — задействовать инструментарий инцидент‑менеджмента. Обсудит, как оценивать критичность сервисов и какие системы могут быть полезны для отслеживания проблем.
Статья ориентирована в первую очередь на тех, кто прямо сейчас занимается мониторингом на уровне общей инженерной грамотности, но пока не использует в явном виде инцидент‑менеджмент как подход.
Читать статью
#почитать
❤14🔥11❤🔥1👍1🥰1
Очередной #дайджест для DevOps-ов
❎ Запуск крупных симуляций с помощью AWS Batch multi-container jobs — как применять AWS Batch в рамках беспилотной техники и роботов
❎ Учите матчасть — почему стоит изучать туториалы перед работой с облаками и кому это особенно важно
❎ Распределенная ФС на Go — полезный и подробный 10ти часовой курс
❎ PostgreSQL High Availability и repmgr — как настроить кластер PostgreSQL high-availability с помощью контейнеров Docker и инструмента repmgr
❎ ClickHouse как бэкенд для Prometheus — рекомендации по использованию инструмента и описание альтернативных решений, таких как Thanos, Grafana Mimir и Victoria Metrics
❎ Запуск крупных симуляций с помощью AWS Batch multi-container jobs — как применять AWS Batch в рамках беспилотной техники и роботов
❎ Учите матчасть — почему стоит изучать туториалы перед работой с облаками и кому это особенно важно
❎ Распределенная ФС на Go — полезный и подробный 10ти часовой курс
❎ PostgreSQL High Availability и repmgr — как настроить кластер PostgreSQL high-availability с помощью контейнеров Docker и инструмента repmgr
❎ ClickHouse как бэкенд для Prometheus — рекомендации по использованию инструмента и описание альтернативных решений, таких как Thanos, Grafana Mimir и Victoria Metrics
👍19🎉14❤1❤🔥1🥰1
Forwarded from Библиотека собеса по DevOps | вопросы с собеседований
Расскажите о средствах оркестрации и случаях их использования
Оркестрация позволяет управлять работой контейнеров, запущенных в больших и динамических окружениях. С ее помощью можно автоматизировать и управлять следующими задачами:
✍🏻 Создание и развертывание контейнеров;
✍🏻 Балансировка нагрузки;
✍🏻 Разделение ресурсов между контейнерами;
✍🏻 Мониторинг контейнеров и серверов;
✍🏻 Масштабирование контейнеров;
✍🏻 Перенос контейнеров с одного сервера на другой, если на первом возникает недостаток ресурсов.
Оркестрация позволяет управлять работой контейнеров, запущенных в больших и динамических окружениях. С ее помощью можно автоматизировать и управлять следующими задачами:
✍🏻 Создание и развертывание контейнеров;
✍🏻 Балансировка нагрузки;
✍🏻 Разделение ресурсов между контейнерами;
✍🏻 Мониторинг контейнеров и серверов;
✍🏻 Масштабирование контейнеров;
✍🏻 Перенос контейнеров с одного сервера на другой, если на первом возникает недостаток ресурсов.
❤🔥4👍1🥰1
🧑💻 Статьи для IT: как объяснять и распространять значимые идеи
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.
Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.
Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.
👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
❤🔥3
FlyOS — занятный подход к запуску полноценной системы Linux, которая всегда будет по рукой, в кармане, прямо в смартфоне.
Это не замена Android на Linux на смартфоне, это отдельная подсистема, которая устанавливается на устройство. Для установки потребуются root права. После установки, запущенная Linux система (и возможность управления самой подсистемой) оказывается доступна в отдельной веб-панели.
Официальный сайт
#новости
Это не замена Android на Linux на смартфоне, это отдельная подсистема, которая устанавливается на устройство. Для установки потребуются root права. После установки, запущенная Linux система (и возможность управления самой подсистемой) оказывается доступна в отдельной веб-панели.
Официальный сайт
#новости
❤🔥6🥰1
Forwarded from Библиотека собеса по DevOps | вопросы с собеседований
Расскажите о Docker Trusted Registry
Это хранилище образов для безопасного хранения и управления образами Docker. Его можно установить на своих мощностях, либо в частном облаке. DTR применятся в процессах CI/CD для сборки, поставки и запуска приложений. Его также можно развернуть в отказоустойчивом варианте, есть встроенная система управления доступом.
Это хранилище образов для безопасного хранения и управления образами Docker. Его можно установить на своих мощностях, либо в частном облаке. DTR применятся в процессах CI/CD для сборки, поставки и запуска приложений. Его также можно развернуть в отказоустойчивом варианте, есть встроенная система управления доступом.
❤3🔥1
💪💪 Эволюция Terraform: как мы безопасно отделили кучу сервисов от монолита
Если вы используете terraform для управления облачной инфраструктурой, возможно, вы столкнулись с некоторыми проблемами по мере роста вашего проекта. Возможно, ваш код становится слишком сложным и запутанным. Возможно, развертывание занимает слишком много времени и приводит к ошибкам. Возможно, ваша команда боится вносить изменения, потому что не знает, что может привести к поломке. Если что-то из этого звучит знакомо, то пришло время провести рефакторинг.
Читать статью
#туториал
Если вы используете terraform для управления облачной инфраструктурой, возможно, вы столкнулись с некоторыми проблемами по мере роста вашего проекта. Возможно, ваш код становится слишком сложным и запутанным. Возможно, развертывание занимает слишком много времени и приводит к ошибкам. Возможно, ваша команда боится вносить изменения, потому что не знает, что может привести к поломке. Если что-то из этого звучит знакомо, то пришло время провести рефакторинг.
Читать статью
#туториал
❤🔥18❤3🥰1
Forwarded from Библиотека задач по DevOps | тесты, код, задания
👍6👏1
Forwarded from Библиотека задач по DevOps | тесты, код, задания
Ваш клиент хочет развернуть корпоративное приложение на AWS, которое будет состоять из нескольких веб-серверов, нескольких серверов приложений и небольшой (50 ГБ) базы данных Oracle. Информация будет храниться как в базе данных, так и в файловых системах различных серверов. Система резервного копирования должна поддерживать восстановление базы данных, восстановление всего сервера и всего диска, а также восстановление отдельных файлов со временем восстановления не более двух часов. В качестве базы данных они решили использовать RDS Oracle. Какая архитектура резервного копирования будет соответствовать этим требованиям?
1. Резервное копирование RDS с использованием автоматического ежедневного резервного копирования БД. Резервное копирование экземпляров EC2 с использованием AMI и дополнение к резервному копированию на уровне файлов в S3 с использованием традиционного корпоративного программного обеспечения для резервного копирования для обеспечения восстановления на уровне файлов.
2. Резервное копирование RDS с использованием развертывания в нескольких зонах доступности. Резервное копирование экземпляров EC2 с использованием Amis, и дополнить копированием данных файловой системы на S3 для обеспечения восстановления на уровне файлов.
3. Резервное копирование RDS с использованием автоматического ежедневного резервного копирования БД. Резервное копирование экземпляров EC2 с использованием моментальных снимков EBS и дополнение резервными копиями на уровне файлов в Amazon Glacier с использованием традиционного корпоративного программного обеспечения для резервного копирования для обеспечения восстановления на уровне файлов.
4. Резервное копирование базы данных RDS на S3 с использованием Oracle RMAN. Резервное копирование экземпляров EC2 с помощью Amis. И дополнить моментальными снимками EBS для восстановления отдельных томов.
1. Резервное копирование RDS с использованием автоматического ежедневного резервного копирования БД. Резервное копирование экземпляров EC2 с использованием AMI и дополнение к резервному копированию на уровне файлов в S3 с использованием традиционного корпоративного программного обеспечения для резервного копирования для обеспечения восстановления на уровне файлов.
2. Резервное копирование RDS с использованием развертывания в нескольких зонах доступности. Резервное копирование экземпляров EC2 с использованием Amis, и дополнить копированием данных файловой системы на S3 для обеспечения восстановления на уровне файлов.
3. Резервное копирование RDS с использованием автоматического ежедневного резервного копирования БД. Резервное копирование экземпляров EC2 с использованием моментальных снимков EBS и дополнение резервными копиями на уровне файлов в Amazon Glacier с использованием традиционного корпоративного программного обеспечения для резервного копирования для обеспечения восстановления на уровне файлов.
4. Резервное копирование базы данных RDS на S3 с использованием Oracle RMAN. Резервное копирование экземпляров EC2 с помощью Amis. И дополнить моментальными снимками EBS для восстановления отдельных томов.
😁7❤2🥰1
🐰 Как решить проблему высокой связанности сервисов с помощью событийно-ориентированной архитектуры и RabbitMQ
В этой статье я расскажу, как оптимизировать сложную систему микросервисов через брокер сообщений, в данном случае RabbitMQ. Мы рассмотрим вариант решения проблемы высокой связанности между сервисами через переход на событийно-ориентированную архитектуру (EDA).
Читать статью
В этой статье я расскажу, как оптимизировать сложную систему микросервисов через брокер сообщений, в данном случае RabbitMQ. Мы рассмотрим вариант решения проблемы высокой связанности между сервисами через переход на событийно-ориентированную архитектуру (EDA).
Читать статью
😁5❤2👍1🥰1
Очередной #дайджест перед выходными
🔴 containerd vs. Docker — понимание их взаимосвязи и того, как они работают вместе
🔴 Jira, Compass и Bitbucket — расширяем возможности инженеров с помощью новых ништяков DevEx
🔴 Настраиваем CI/CD с GitHub Actions и werf — как настроить пайплайн CI/CD в GitHub, подготовка репозитория, заливка приложения и файлы конфига GitHub Actions
🔴 Создание чат-бота для анализа и расшифровки видео — использование GenAI и бесшовной интеграции, предоставляемую Docker, для упрощения обработки и понимания видеоконтента
🔴 Как работает etcd с Kubernetes и без него — материал познакомит вас с принципами работы etcd, чтобы вы могли глубже понять внутреннюю работу Kubernetes и получить дополнительные инструменты для устранения неполадок в вашем кластере
🔴 containerd vs. Docker — понимание их взаимосвязи и того, как они работают вместе
🔴 Jira, Compass и Bitbucket — расширяем возможности инженеров с помощью новых ништяков DevEx
🔴 Настраиваем CI/CD с GitHub Actions и werf — как настроить пайплайн CI/CD в GitHub, подготовка репозитория, заливка приложения и файлы конфига GitHub Actions
🔴 Создание чат-бота для анализа и расшифровки видео — использование GenAI и бесшовной интеграции, предоставляемую Docker, для упрощения обработки и понимания видеоконтента
🔴 Как работает etcd с Kubernetes и без него — материал познакомит вас с принципами работы etcd, чтобы вы могли глубже понять внутреннюю работу Kubernetes и получить дополнительные инструменты для устранения неполадок в вашем кластере
👍14🎉13🥰11❤6👏6
Secret Docker Commands
В видосе, автор расскажет о полезных и продвинутых командах Docker, которые обычно не встречаются в документации.
Он покажет системные (docker system df, docker system prune и другие) и контекстные команды (docker context create, docker contex use), продемонстрирует использование Grab и контейнера Net Shoot в работе по устранению неполадок, а также даст парочку советов по устранению неполадок в Docker Desktop.
Смотреть
#видео
В видосе, автор расскажет о полезных и продвинутых командах Docker, которые обычно не встречаются в документации.
Он покажет системные (docker system df, docker system prune и другие) и контекстные команды (docker context create, docker contex use), продемонстрирует использование Grab и контейнера Net Shoot в работе по устранению неполадок, а также даст парочку советов по устранению неполадок в Docker Desktop.
Смотреть
#видео
🥰5❤🔥3👏3😁3🎉2
🦾🧠🏋Качаем мозги к лету!
Все качают пресс, а мы — мозги, чтобы получить крутой оффер, уехать на Балии больше не быть онлайн 😎
⚡️ Распродажа Proglib.Academy: с 24 апреля до 5 мая — скидка 40% на все наши курсы!
➡️ Математика для Data Science 29 990 ₽ 17 994 ₽
➡️ Алгоритмы и структуры данных 35 990 ₽ 21 594 ₽
➡️ Основы программирования на Python 19 990 ₽ 11 994 ₽
Почему мы?
⭐️ Курсы разрабатывались при поддержке топовых преподавателей из Яндекса, Сбера, МГУ
⭐️ У нас есть менторы, которые поддерживают студентов на каждом этапе
⭐️ Мы разбираем задачи с реальных собеседований в крупнейшие компании и готовим к поступлению в ШАД
⭐️ Вход с любого уровня: например, на курсе математики сначала освежаем знания из школьной программы
Save the dates!
Все качают пресс, а мы — мозги, чтобы получить крутой оффер, уехать на Бали
Почему мы?
Save the dates!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🤔2🥰1
Forwarded from Библиотека C/C++ разработчика | cpp, boost, qt
🙀 Опросик
Хотим узнать, на какие на какие ссылки/статьй вы переходили в последнее время из Telegram? Речь идёт не только о наших статьях и ссылках, а о любых)
👇 Пишите ответы в комментариях в стиле «был пост со статьёй такой-то, я её открыл и почитал»
Хотим узнать, на какие на какие ссылки/статьй вы переходили в последнее время из Telegram? Речь идёт не только о наших статьях и ссылках, а о любых)
👇 Пишите ответы в комментариях в стиле «был пост со статьёй такой-то, я её открыл и почитал»
🥰3👏2😁2❤1
Media is too big
VIEW IN TELEGRAM
👍16👏2❤1🤔1🎉1
💁💁 Развертывание защищенного dev кластера bitnami/kafka в k8s с помощью helm
В ходе развертывания у автора возникло очень много сложностей, встречено множество подводных камней, и в большинстве случаев рецепта в интернете найдено не было, поэтому ему приходилось искать решения самостоятельно методом проб и ошибок. Все, что здесь будет описано это сугубо его личный опыт на одном из проектов. Рассказ о том, как с нуля раскатить dev контур bitnami/kafka кластера с помощью helm чартов, как обезопасить ваш кластер kafka и какие сложности могут вам встретиться.
Читать статью
#туториал
В ходе развертывания у автора возникло очень много сложностей, встречено множество подводных камней, и в большинстве случаев рецепта в интернете найдено не было, поэтому ему приходилось искать решения самостоятельно методом проб и ошибок. Все, что здесь будет описано это сугубо его личный опыт на одном из проектов. Рассказ о том, как с нуля раскатить dev контур bitnami/kafka кластера с помощью helm чартов, как обезопасить ваш кластер kafka и какие сложности могут вам встретиться.
Читать статью
#туториал
❤51👍4🥰1
Очередной #дайджест для DevOps-ов
🔅 Мониторинг Amazon GuardDuty EC2 Runtime теперь доступен для всех — расширяет охват обнаружения угроз для инстансов EC2 во время выполнения и дополняет функции обнаружения аномалий
🔅 Как донести секреты до dev-тачки и не пролить? — статье разбор вариантов и рассказ о плюсах и минусах разных подходов
🔅 StereoDB — сверхбыстрая и легкая in-process БД, написанная на F#, которая поддерживает транзакции, вторичные индексы, персистентность и размер данных, превышающий объем оперативной памяти
🔅 BuildKit in depth — подробный разбор механизма сборки Docker
🔅 OpenTelemetry в Prometheus — платформа для создания трассировок, метрик, журналов, и управления ими
🔅 Мониторинг Amazon GuardDuty EC2 Runtime теперь доступен для всех — расширяет охват обнаружения угроз для инстансов EC2 во время выполнения и дополняет функции обнаружения аномалий
🔅 Как донести секреты до dev-тачки и не пролить? — статье разбор вариантов и рассказ о плюсах и минусах разных подходов
🔅 StereoDB — сверхбыстрая и легкая in-process БД, написанная на F#, которая поддерживает транзакции, вторичные индексы, персистентность и размер данных, превышающий объем оперативной памяти
🔅 BuildKit in depth — подробный разбор механизма сборки Docker
🔅 OpenTelemetry в Prometheus — платформа для создания трассировок, метрик, журналов, и управления ими
❤🔥26👍2🎉2🥰1