👩💻 Kubernetes стал стандартом индустрии. Но базового знания мало: компании ищут специалистов, которые могут строить полноценные инфраструктурные платформы.
🔥 Курс «Инфраструктурная платформа на основе Kubernetes» от OTUS — это живая практика от опытных инженеров. На занятиях вы пройдёте весь путь от развёртывания кластера и настройки мониторинга до управления безопасностью и логированием.
🦾 После обучения вы сможете претендовать на позицию платформенного инженера, уверенно работать с экосистемой Kubernetes и подготовиться к международным сертификациям CKA и CKAD. А диплом OTUS станет аргументом для работодателей: курс создан по актуальным требованиям рынка.
➡️Пройдите короткое вступительное тестирование и присоединяйтесь к группе: https://otus.pw/Brj0K/?erid=2W5zFGrjrKA
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🔥 Курс «Инфраструктурная платформа на основе Kubernetes» от OTUS — это живая практика от опытных инженеров. На занятиях вы пройдёте весь путь от развёртывания кластера и настройки мониторинга до управления безопасностью и логированием.
🦾 После обучения вы сможете претендовать на позицию платформенного инженера, уверенно работать с экосистемой Kubernetes и подготовиться к международным сертификациям CKA и CKAD. А диплом OTUS станет аргументом для работодателей: курс создан по актуальным требованиям рынка.
➡️Пройдите короткое вступительное тестирование и присоединяйтесь к группе: https://otus.pw/Brj0K/?erid=2W5zFGrjrKA
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
❤2
Падение интернета: Cloudflare восстановила работу
Вчера на несколько часов глобально «упал» интернет - сервисы на базе Cloudflare были недоступны по всему миру.
Cloudflare объяснила сбой «необычным всплеском трафика», который вызвал деградацию DNS и CDN-сервисов.
⏺ Инженеры оперативно перераспределили нагрузку, очистили кеши и восстановили маршрутизацию.
Вчера на несколько часов глобально «упал» интернет - сервисы на базе Cloudflare были недоступны по всему миру.
Пользователи не могли зайти на X, Spotify, ChatGPT, а терминалы McDonald’s перестали принимать заказы.
Cloudflare объяснила сбой «необычным всплеском трафика», который вызвал деградацию DNS и CDN-сервисов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5👍5
Кто идёт на Kuber Conf by AOT 4 декабря?
Устраиваю розыгрыш 2 билетов на Kuber Conf by АОТ — первую коммьюнити конференцию по K8s в России, которая пройдет 4 декабря в Москве.
В программе — только хардкор и реальные кейсы от команд Авито,Т-Банка, Vitastor, Beget, VK Cloud, Yandex Cloud, Selectel и других.
🟣 Изменения в Cluster API без пересоздания машин
🟣 Как строили платформу деплоя в Т-Банке
🟣 Практический deep-dive в CNI chaining
🟣 Безопасный Gatekeeper в архитектуре k8s-in-k8s
🟣 Поддержка Kubernetes в Vitastor
🟣 Karpenter-провайдер своими руками — что внутри
📅 20 ноября в 12:00 выберем 2 счастливчиков.
Чтобы участвовать: Необходимо ответить на вопрос: Как можно обновить конфигурацию узлов в Cluster API без полного пересоздания машин и какие основные методы для этого существуют?
- Ответы надо присылать в чат канала
- В ответах не важен правильный ответ, ответить нужно максимально креативно и с юмором
- Победителей выберет админ, результаты конкурса будут 20 ноября в 12:00
Kuber Conf by AOT пройдет под эгидой будущей Ассоциации облачно-ориентированных технологий (АОТ), ее создают VK Cloud, Флант и Yandex Cloud.
Присоединяйся!
Программа и билеты
Реклама. Садовская Е.О, ИНН 9710066394, erid:2Vtzqv2anF3
Устраиваю розыгрыш 2 билетов на Kuber Conf by АОТ — первую коммьюнити конференцию по K8s в России, которая пройдет 4 декабря в Москве.
В программе — только хардкор и реальные кейсы от команд Авито,Т-Банка, Vitastor, Beget, VK Cloud, Yandex Cloud, Selectel и других.
🟣 Изменения в Cluster API без пересоздания машин
🟣 Как строили платформу деплоя в Т-Банке
🟣 Практический deep-dive в CNI chaining
🟣 Безопасный Gatekeeper в архитектуре k8s-in-k8s
🟣 Поддержка Kubernetes в Vitastor
🟣 Karpenter-провайдер своими руками — что внутри
📅 20 ноября в 12:00 выберем 2 счастливчиков.
Чтобы участвовать: Необходимо ответить на вопрос: Как можно обновить конфигурацию узлов в Cluster API без полного пересоздания машин и какие основные методы для этого существуют?
- Ответы надо присылать в чат канала
- В ответах не важен правильный ответ, ответить нужно максимально креативно и с юмором
- Победителей выберет админ, результаты конкурса будут 20 ноября в 12:00
Kuber Conf by AOT пройдет под эгидой будущей Ассоциации облачно-ориентированных технологий (АОТ), ее создают VK Cloud, Флант и Yandex Cloud.
Присоединяйся!
Программа и билеты
Реклама. Садовская Е.О, ИНН 9710066394, erid:2Vtzqv2anF3
❤1
Почему SSH-сессии обрываются через 2–3 минуты
Пинги живые, сеть вроде в порядке, но сессия падает.
Ну и иногда виноваты неправильные настройки keepalive или MTU, а также энергосберегающие режимы сетевой карты. TCPKeepAlive на клиенте ≠ ServerAliveInterval, и SSH-сервер может закрывать «тихие» соединения.
⏺ Подключение с максимальным выводом:
И проверка конфигурации сервера:
Смотрим, какие значения ClientAliveInterval, ClientAliveCountMax установлены.
⏺ Исправляем:
На сервере включаем keepalive и увеличиваем интервалы:
На клиенте можно настроить:
Если обрывы связаны с MTU или power-save сетевухи, проверяем:
И при необходимости корректируем MTU или отключаем энергосбережение.
Иногда вы подключаетесь по SSH, а через пару минут соединение внезапно обрывается.
Пинги живые, сеть вроде в порядке, но сессия падает.
Ну и иногда виноваты неправильные настройки keepalive или MTU, а также энергосберегающие режимы сетевой карты. TCPKeepAlive на клиенте ≠ ServerAliveInterval, и SSH-сервер может закрывать «тихие» соединения.
ssh -vvv user@server
И проверка конфигурации сервера:
grep Alive /etc/ssh/sshd_config
Смотрим, какие значения ClientAliveInterval, ClientAliveCountMax установлены.
На сервере включаем keepalive и увеличиваем интервалы:
ClientAliveInterval 60
ClientAliveCountMax 10
На клиенте можно настроить:
ServerAliveInterval 60
ServerAliveCountMax 10
Если обрывы связаны с MTU или power-save сетевухи, проверяем:
ip link show dev eth0
ethtool eth0
И при необходимости корректируем MTU или отключаем энергосбережение.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤10👍5
Forwarded from Хирон
Идеология преимущества
Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?
Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:
🧠 «Хирон. ИИ. Архитектура математического преимущества»
P.S.Будущее - это алгоритм, который можно написать
Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?
Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:
🧠 «Хирон. ИИ. Архитектура математического преимущества»
P.S.
🤡5👍4❤1🔥1
Какое свойство VXLAN делает его особенно подходящим для дата-центров?
Anonymous Quiz
3%
Управление только через CLI
24%
Использование L2-мультикаста по умолчанию
68%
Масштабируемость сегментов за счёт 24-битного VNI
5%
Работа исключительно поверх IPv6
❤7👍3
Microsoft признала ошибку в обновлении ESU для Windows 10
Microsoft подтвердила баг в расширенном обновлении безопасности Windows 10 KB5068781, выпущенном 11 ноября.
Проблема затрагивает только активацию через Центр администрирования Microsoft 365. Не все устройства с лицензией ESU корректно отображаются как требующие обновления.
Microsoft пока не объявила дату исправления и обходных путей нет.
Microsoft подтвердила баг в расширенном обновлении безопасности Windows 10 KB5068781, выпущенном 11 ноября.
На устройствах с корпоративной лицензией обновление вроде устанавливается, но после перезапуска откатывается с ошибкой 0x800f0922.
Проблема затрагивает только активацию через Центр администрирования Microsoft 365. Не все устройства с лицензией ESU корректно отображаются как требующие обновления.
Microsoft пока не объявила дату исправления и обходных путей нет.
❤6
Как безопасно проверять доступность внешних сервисов
Ping показывает только, что хост жив на уровне ICMP. Но веб-сервис может быть недоступен из-за проблем с DNS, маршрутизацией или самим приложением.
Health check позволяет проверить три уровня:
1. DNS — можно ли резолвить доменное имя.
2. Сеть / маршруты — пакет доходит до сервера.
3. Сервис / приложение — сервер реально отвечает на запросы.
Проверяем прямо на практике:
⏺ HTTP/HTTPS — проверка ответа сервиса и времени:
⏺ DNS — быстрый резолв имени:
⏺ Маршрут до сервера - видим промежуточные hop’ы:
Ping показывает только, что хост жив на уровне ICMP. Но веб-сервис может быть недоступен из-за проблем с DNS, маршрутизацией или самим приложением.
Чтобы понять, реально ли сервис работает, нужен полноценный health check.
Health check позволяет проверить три уровня:
1. DNS — можно ли резолвить доменное имя.
2. Сеть / маршруты — пакет доходит до сервера.
3. Сервис / приложение — сервер реально отвечает на запросы.
Проверяем прямо на практике:
curl -w "@format.txt" -o /dev/null -s https://example.com
dig +short example.com
traceroute example.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤2
📌 Эти и другие интересные темы мы разбираем на канале Docker Ninja.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏5👍3❤1
Если VDI хочется, а документацию читать нет...
Подключайтесь 27 ноября в 11:00 и смотрите в прямом эфире, как системный инженер Orion soft Дмитрий Руссу проведет ручное и автоматизированное развертывание платформы виртуализации рабочих столов (VDI) и приложений — Termit.
✅ Покажем пошаговый «рецепт» развертывания и настройки Termit за 30 мин.
✅ Поделимся техническими лайфхаками
✅ Ответим на вопросы о начале работы с Termit
Только у участников вебинара будет возможность получить специальный CookBook с подробной инструкцией по развертыванию Termit, а также шаблоны для автоматического развертывания.
📌Регистрация
#реклама
О рекламодателе
Подключайтесь 27 ноября в 11:00 и смотрите в прямом эфире, как системный инженер Orion soft Дмитрий Руссу проведет ручное и автоматизированное развертывание платформы виртуализации рабочих столов (VDI) и приложений — Termit.
✅ Покажем пошаговый «рецепт» развертывания и настройки Termit за 30 мин.
✅ Поделимся техническими лайфхаками
✅ Ответим на вопросы о начале работы с Termit
Только у участников вебинара будет возможность получить специальный CookBook с подробной инструкцией по развертыванию Termit, а также шаблоны для автоматического развертывания.
📌Регистрация
#реклама
О рекламодателе
❤1🐳1
Неверно настроенный Split DNS может привести к…
Anonymous Quiz
14%
Периодическому сбою DHCP‑лизинга для внутренних клиентов
35%
Утечке внутренних FQDN наружу через публичные резолверы
25%
Полной остановке Zone Transfer между мастер‑сервером и слейвом
25%
Потере PTR‑записей в частной зоне и сбою обратного резолвинга
👍7❤3👎1
Митап для системных администраторов и девопсов
Встречаемся, чтобы обсудить насущные вопросы про:
- контейнеры,
- инструменты тестирования инфраструктурного кода,
- автоматизацию без боли.
🗓27 ноября, 18:30
📍В офисе Selectel в Санкт-Петербурге или онлайн
Смотрите программу и регистрируйтесь: https://slc.tl/khudq
Чтобы не пропустить митап и узнавать о вебинарах, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО "Селектел". erid:2W5zFJ5qEDN
Встречаемся, чтобы обсудить насущные вопросы про:
- контейнеры,
- инструменты тестирования инфраструктурного кода,
- автоматизацию без боли.
🗓27 ноября, 18:30
📍В офисе Selectel в Санкт-Петербурге или онлайн
Смотрите программу и регистрируйтесь: https://slc.tl/khudq
Чтобы не пропустить митап и узнавать о вебинарах, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events
Реклама. АО "Селектел". erid:2W5zFJ5qEDN
❤1👍1
Как отследить неожиданное потребление CPU на Linux
Иногда процесс вроде «спит», но сервер внезапно начинает «прыгать» по CPU.
Чаще всего виноват один поток, застрявшая функция или скрытая задача внутри демона.
Как проверять:
1️⃣ Проверка потоков конкретного процесса
-H показывает каждый поток отдельно. Легко увидеть, какой именно поток гоняет CPU.
2️⃣ Подробная статистика по потокам
Отображает использование CPU каждым потоком каждую секунду.
3️⃣ Профилирование функций
Позволяет увидеть, какие функции внутри процесса используют процессор больше всего. Особенно полезно для сложных демонов и сервисов, где нагрузка распределена по потокам.
⭐️ Как использовать на практике
⏺ Для оперативной диагностики на продакшн-сервере - top -H и pidstat чаще всего хватает.
⏺ Для поиска узких мест или багов в демонах - подключать perf top, анализировать горячие функции.
⏺ После выявления «жирного» потока можно перезапустить или убить его, а затем проверить логи демона. Часто такие пики происходят из-за зацикливания или debug-режима.
Иногда процесс вроде «спит», но сервер внезапно начинает «прыгать» по CPU.
Чаще всего виноват один поток, застрявшая функция или скрытая задача внутри демона.
Как проверять:
top -H -p <PID>
-H показывает каждый поток отдельно. Легко увидеть, какой именно поток гоняет CPU.
pidstat 1 -p <PID>
Отображает использование CPU каждым потоком каждую секунду.
perf top -p <PID>
Позволяет увидеть, какие функции внутри процесса используют процессор больше всего. Особенно полезно для сложных демонов и сервисов, где нагрузка распределена по потокам.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤5
«Хочу разобраться в LLM, но всё нет времени»
Наверняка у многих из вас есть идеи собственного AI-проекта, варианты интеграции LLM в продукты компании или желание работать поближе с ИИ.
Но когда дело доходит до изучения материалов, становится непонятно, с чего начать и как потратить минимум времени на обучение.
Если узнаёте в этом себя, то для вас команда DL-инженеров из DeepSchool создала курс «LLM Start» — обучение для сисадминов, DevOps-инженеров, разработчиков и других IT-специалистов без опыта работы с LLM. Курс короткий, состоит из 6 тем и финального проекта. Лекции ведут опытные инженеры. А чтобы попрактиковаться без дополнительных усилий, задания выполняются в no-code платформе n8n.
На курсе вы:
— разберётесь в теории работы нейросетей и LLM в частности
— освоите основные трюки промпт-инжениринга
— научитесь собирать RAG
— узнаете как создавать агентов и мультиагентные системы
— разберётесь в многообразии моделей и провайдеров
Всё это вы изучите за 2 месяца и сможете собирать простые пайплайны на платформе n8n, которая отлично подходит для низконагруженных систем, внутреннего использования и проверки гипотез. Но поняв основные принципы работы с LLM, потом вы без проблем сможете собрать боевые версии цепочек на своём стэке.
🔥 До 23 ноября вы можете присоединиться со скидкой 25%!
Изучайте подробности на сайте и оставляйте заявку!
Наверняка у многих из вас есть идеи собственного AI-проекта, варианты интеграции LLM в продукты компании или желание работать поближе с ИИ.
Но когда дело доходит до изучения материалов, становится непонятно, с чего начать и как потратить минимум времени на обучение.
Если узнаёте в этом себя, то для вас команда DL-инженеров из DeepSchool создала курс «LLM Start» — обучение для сисадминов, DevOps-инженеров, разработчиков и других IT-специалистов без опыта работы с LLM. Курс короткий, состоит из 6 тем и финального проекта. Лекции ведут опытные инженеры. А чтобы попрактиковаться без дополнительных усилий, задания выполняются в no-code платформе n8n.
На курсе вы:
— разберётесь в теории работы нейросетей и LLM в частности
— освоите основные трюки промпт-инжениринга
— научитесь собирать RAG
— узнаете как создавать агентов и мультиагентные системы
— разберётесь в многообразии моделей и провайдеров
Всё это вы изучите за 2 месяца и сможете собирать простые пайплайны на платформе n8n, которая отлично подходит для низконагруженных систем, внутреннего использования и проверки гипотез. Но поняв основные принципы работы с LLM, потом вы без проблем сможете собрать боевые версии цепочек на своём стэке.
🔥 До 23 ноября вы можете присоединиться со скидкой 25%!
Изучайте подробности на сайте и оставляйте заявку!
deepschool.ru
Курс по LLM для IT-специалистов
Научитесь использовать LLM для решения бизнес-задач: чат-боты, ответы по базе, ИИ-сотрудники
❤4🔥2
Давайте разберем один из частых вопросов, который может быть задан на собеседовании и как на него отвечать.Buddy allocator, напротив, управляет страницами памяти переменного размера. Он эффективно выделяет большие блоки памяти, но плохо подходит для частого создания мелких структур, так как приводит к фрагментации и затратам на обработку.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🤔2👍1
Присоединяйтесь к митапу «СУБД глазами инфраструктурщиков», чтобы обсудить всё, что волнует сообщество DBA сегодня
Участников ждут практические доклады, живое общение и обмен опытом с экспертами, а ещё актуальные инсайты о том, куда движется рынок СУБД.
В программе:
🔷 PostgreSQL без валидола: сборка кластера вручную
🔷 Автоматизация кластеров Postgre
🔷 Как мы перевезли Oracle с Solaris SPARC на x86
🔷 Масштабирование и отказоустойчивость YDB — 9 нод, банковская нагрузка, падение дата-центра, перезапуск кластера под нагрузкой без простоя.
🔷 Круглый стол «Масштабирование СУБД: реальные проблемы и перспективы»
Участвуют эксперты из: «Инфосистемы Джет», Яндекс (YDB), Arenadata, СберТех, Postgres Professional, Газинформсервис
Для кого: CIO, CTO, ИТ-директоров, архитекторов, DevOps, DBA
Когда: 25 ноября, 16:00–19:00 (МСК)
Где: офлайн и онлайн
ДЕТАЛИ И РЕГИСТРАЦИЯ
Участников ждут практические доклады, живое общение и обмен опытом с экспертами, а ещё актуальные инсайты о том, куда движется рынок СУБД.
В программе:
🔷 PostgreSQL без валидола: сборка кластера вручную
🔷 Автоматизация кластеров Postgre
🔷 Как мы перевезли Oracle с Solaris SPARC на x86
🔷 Масштабирование и отказоустойчивость YDB — 9 нод, банковская нагрузка, падение дата-центра, перезапуск кластера под нагрузкой без простоя.
🔷 Круглый стол «Масштабирование СУБД: реальные проблемы и перспективы»
Участвуют эксперты из: «Инфосистемы Джет», Яндекс (YDB), Arenadata, СберТех, Postgres Professional, Газинформсервис
Для кого: CIO, CTO, ИТ-директоров, архитекторов, DevOps, DBA
Когда: 25 ноября, 16:00–19:00 (МСК)
Где: офлайн и онлайн
ДЕТАЛИ И РЕГИСТРАЦИЯ
❤1
Почему nginx начинает отдавать 502, хотя backend жив
Это один из самых частых «фантомных» багов в проде: backend работает, процессы на месте, порты слушают - а nginx упорно шлёт 502.
Секрет почти всегда в том, как backend отвечает, а не в том, что он «лежит».
Что происходит на самом деле:
nginx пытается подключиться к upstream, но соединение не укладывается в его ожидания - по времени, по количеству воркеров или по лимитам системы.
Как проверить:
Типичные причины:
⏺ Backend отвечает слишком медленно.
nginx режет по таймауту, даже если backend в итоге что-то вернул.
⏺ У backend мало воркеров.
Например, Gunicorn запущен с 1 worker — он занят обработкой одного запроса, остальные получают 502.
⏺ Нехватка файловых дескрипторов (open files).
nginx или backend не могут открыть новое соединение → 502.
⏺ Backend закрывает соединения «грязно».
nginx ждёт корректный FIN/ACK, а получает RST → ошибка upstream.
⏺ TCP или firewall дропает локальные соединения.
Да, даже на 127.0.0.1 такое случается при агрессивных правилах.
💡 Как временно «подлечить»:
В nginx.conf поднять таймауты:
Проверить лимиты:
и увеличить:
➖ Для Gunicorn, uvicorn, uWSGI — увеличить число воркеров.
➖ Для Docker/K8s — проверить readiness/liveness probes, чтобы нагрузка не шла на умирающие поды.
Это один из самых частых «фантомных» багов в проде: backend работает, процессы на месте, порты слушают - а nginx упорно шлёт 502.
Секрет почти всегда в том, как backend отвечает, а не в том, что он «лежит».
Что происходит на самом деле:
nginx пытается подключиться к upstream, но соединение не укладывается в его ожидания - по времени, по количеству воркеров или по лимитам системы.
Как проверить:
# Проверяем, отвечает ли backend напрямую
curl -I https://127.0.0.1:8000
# Смотрим ошибки nginx в момент проблемы
journalctl -u nginx -f
# Проверяем, не упёрся ли backend в лимиты соединений
netstat -plant | grep :8000
Типичные причины:
nginx режет по таймауту, даже если backend в итоге что-то вернул.
Например, Gunicorn запущен с 1 worker — он занят обработкой одного запроса, остальные получают 502.
nginx или backend не могут открыть новое соединение → 502.
nginx ждёт корректный FIN/ACK, а получает RST → ошибка upstream.
Да, даже на 127.0.0.1 такое случается при агрессивных правилах.
В nginx.conf поднять таймауты:
proxy_connect_timeout 10s;
proxy_read_timeout 60s;
proxy_send_timeout 60s;
Проверить лимиты:
ulimit -n
и увеличить:
ulimit -n 65535
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12❤9👍3