Admin Guides | Сисадмин
11.5K subscribers
1.34K photos
20 videos
34 files
569 links
Обучающий канал по ОС Linux & Windows для начинающих и действующих администраторов.

Админ, реклама: @Ak_Mihail
Биржа: https://telega.in/c/admguides

РКН: https://kurl.ru/nQejS
Download Telegram
12😁8🔥6🫡3👎1
👩‍💻 Kubernetes стал стандартом индустрии. Но базового знания мало: компании ищут специалистов, которые могут строить полноценные инфраструктурные платформы.

🔥 Курс «Инфраструктурная платформа на основе Kubernetes» от OTUS — это живая практика от опытных инженеров. На занятиях вы пройдёте весь путь от развёртывания кластера и настройки мониторинга до управления безопасностью и логированием.

🦾 После обучения вы сможете претендовать на позицию платформенного инженера, уверенно работать с экосистемой Kubernetes и подготовиться к международным сертификациям CKA и CKAD. А диплом OTUS станет аргументом для работодателей: курс создан по актуальным требованиям рынка.

➡️Пройдите короткое вступительное тестирование и присоединяйтесь к группе: https://otus.pw/Brj0K/?erid=2W5zFGrjrKA

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
2
Падение интернета: Cloudflare восстановила работу

Вчера на несколько часов глобально «упал» интернет - сервисы на базе Cloudflare были недоступны по всему миру.

Пользователи не могли зайти на X, Spotify, ChatGPT, а терминалы McDonald’s перестали принимать заказы.


Cloudflare объяснила сбой «необычным всплеском трафика», который вызвал деградацию DNS и CDN-сервисов.

Инженеры оперативно перераспределили нагрузку, очистили кеши и восстановили маршрутизацию.
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5
Кто идёт на Kuber Conf by AOT 4 декабря?

Устраиваю розыгрыш 2 билетов на Kuber Conf by АОТ — первую коммьюнити конференцию по K8s в России, которая пройдет 4 декабря в Москве.

В программе — только хардкор и реальные кейсы от команд Авито,Т-Банка, Vitastor, Beget, VK Cloud, Yandex Cloud, Selectel и других.

🟣 Изменения в Cluster API без пересоздания машин
🟣 Как строили платформу деплоя в Т-Банке
🟣 Практический deep-dive в CNI chaining
🟣 Безопасный Gatekeeper в архитектуре k8s-in-k8s
🟣 Поддержка Kubernetes в Vitastor
🟣 Karpenter-провайдер своими руками — что внутри

📅 20 ноября в 12:00 выберем 2 счастливчиков.

Чтобы участвовать: Необходимо ответить на вопрос: Как можно обновить конфигурацию узлов в Cluster API без полного пересоздания машин и какие основные методы для этого существуют?

- Ответы надо присылать в чат канала
- В ответах не важен правильный ответ, ответить нужно максимально креативно и с юмором
- Победителей выберет админ, результаты конкурса будут 20 ноября в 12:00

Kuber Conf by AOT пройдет под эгидой будущей Ассоциации облачно-ориентированных технологий (АОТ), ее создают VK Cloud, Флант и Yandex Cloud.
Присоединяйся!

Программа и билеты

Реклама. Садовская Е.О, ИНН 9710066394, erid:2Vtzqv2anF3
1
Почему SSH-сессии обрываются через 2–3 минуты

Иногда вы подключаетесь по SSH, а через пару минут соединение внезапно обрывается. 


Пинги живые, сеть вроде в порядке, но сессия падает.

Ну и иногда виноваты неправильные настройки keepalive или MTU, а также энергосберегающие режимы сетевой карты. TCPKeepAlive на клиенте ≠ ServerAliveInterval, и SSH-сервер может закрывать «тихие» соединения.

Подключение с максимальным выводом:

ssh -vvv user@server


И проверка конфигурации сервера:

grep Alive /etc/ssh/sshd_config


Смотрим, какие значения ClientAliveInterval, ClientAliveCountMax установлены.

Исправляем:

На сервере включаем keepalive и увеличиваем интервалы:

ClientAliveInterval 60
ClientAliveCountMax 10


На клиенте можно настроить:

ServerAliveInterval 60
ServerAliveCountMax 10


Если обрывы связаны с MTU или power-save сетевухи, проверяем:

ip link show dev eth0
ethtool eth0


И при необходимости корректируем MTU или отключаем энергосбережение.
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍5
Forwarded from Хирон
Идеология преимущества

Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?

Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:

🧠 «Хирон. ИИ. Архитектура математического преимущества»

P.S. Будущее - это алгоритм, который можно написать
🤡5👍41🔥1
Microsoft признала ошибку в обновлении ESU для Windows 10

Microsoft подтвердила баг в расширенном обновлении безопасности Windows 10 KB5068781, выпущенном 11 ноября.

На устройствах с корпоративной лицензией обновление вроде устанавливается, но после перезапуска откатывается с ошибкой 0x800f0922.


Проблема затрагивает только активацию через Центр администрирования Microsoft 365. Не все устройства с лицензией ESU корректно отображаются как требующие обновления.

Microsoft пока не объявила дату исправления и обходных путей нет.
6
Как безопасно проверять доступность внешних сервисов

Ping показывает только, что хост жив на уровне ICMP. Но веб-сервис может быть недоступен из-за проблем с DNS, маршрутизацией или самим приложением.

Чтобы понять, реально ли сервис работает, нужен полноценный health check.


Health check позволяет проверить три уровня:
1. DNS — можно ли резолвить доменное имя.
2. Сеть / маршруты — пакет доходит до сервера.
3. Сервис / приложение — сервер реально отвечает на запросы.

Проверяем прямо на практике:

HTTP/HTTPS — проверка ответа сервиса и времени:

curl -w "@format.txt" -o /dev/null -s https://example.com


DNS — быстрый резолв имени:

dig +short example.com


Маршрут до сервера - видим промежуточные hop’ы:

traceroute example.com
Please open Telegram to view this post
VIEW IN TELEGRAM
👍102
👩‍💻 Хочешь раскрыть все секреты Docker и стать настоящим мастером контейнеризации?

📝 Подпишись на Docker Ninja — твой надежный гид в мире Docker!

➡️ Как скопировать файл из контейнера на хост
➡️ Почему порты контейнера не конфликтуют с хостом
➡️ Как уменьшить размер образа с multi-stage builds
➡️ История создания первого docker-образа

📌 Эти и другие интересные темы мы разбираем на канале Docker Ninja.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏5👍31
Буквально)
🔥12😁7👍31🤔1
Если VDI хочется, а документацию читать нет...

Подключайтесь 27 ноября в 11:00 и смотрите в прямом эфире, как  системный инженер Orion soft Дмитрий Руссу проведет ручное и автоматизированное развертывание платформы виртуализации рабочих столов (VDI) и приложений — Termit.

Покажем пошаговый «рецепт» развертывания и настройки Termit за 30 мин.

Поделимся техническими лайфхаками

Ответим на вопросы о начале работы с Termit

Только у участников вебинара будет возможность получить специальный CookBook с подробной инструкцией по развертыванию Termit, а также шаблоны для автоматического развертывания.

📌Регистрация

#реклама
О рекламодателе
1🐳1
Митап для системных администраторов и девопсов

Встречаемся, чтобы обсудить насущные вопросы про:
- контейнеры,
- инструменты тестирования инфраструктурного кода,
- автоматизацию без боли.

🗓27 ноября, 18:30
📍В офисе Selectel в Санкт-Петербурге или онлайн

Смотрите программу и регистрируйтесь: https://slc.tl/khudq

Чтобы не пропустить митап и узнавать о вебинарах, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО "Селектел". erid:2W5zFJ5qEDN
1👍1
Как отследить неожиданное потребление CPU на Linux

Иногда процесс вроде «спит», но сервер внезапно начинает «прыгать» по CPU.

Чаще всего виноват один поток, застрявшая функция или скрытая задача внутри демона.

Как проверять:

1️⃣Проверка потоков конкретного процесса

top -H -p <PID>


-H показывает каждый поток отдельно. Легко увидеть, какой именно поток гоняет CPU.

2️⃣Подробная статистика по потокам

pidstat 1 -p <PID>


Отображает использование CPU каждым потоком каждую секунду.

3️⃣Профилирование функций

perf top -p <PID>


Позволяет увидеть, какие функции внутри процесса используют процессор больше всего. Особенно полезно для сложных демонов и сервисов, где нагрузка распределена по потокам.

⭐️Как использовать на практике
Для оперативной диагностики на продакшн-сервере - top -H и pidstat чаще всего хватает.
Для поиска узких мест или багов в демонах - подключать perf top, анализировать горячие функции.
После выявления «жирного» потока можно перезапустить или убить его, а затем проверить логи демона. Часто такие пики происходят из-за зацикливания или debug-режима.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍65
«Хочу разобраться в LLM, но всё нет времени»

Наверняка у многих из вас есть идеи собственного AI-проекта, варианты интеграции LLM в продукты компании или желание работать поближе с ИИ.

Но когда дело доходит до изучения материалов, становится непонятно, с чего начать и как потратить минимум времени на обучение.

Если узнаёте в этом себя, то для вас команда DL-инженеров из DeepSchool создала курс «LLM Start» — обучение для сисадминов, DevOps-инженеров, разработчиков и других IT-специалистов без опыта работы с LLM. Курс короткий, состоит из 6 тем и финального проекта. Лекции ведут опытные инженеры. А чтобы попрактиковаться без дополнительных усилий, задания выполняются в no-code платформе n8n.

На курсе вы:
— разберётесь в теории работы нейросетей и LLM в частности
— освоите основные трюки промпт-инжениринга
— научитесь собирать RAG
— узнаете как создавать агентов и мультиагентные системы
— разберётесь в многообразии моделей и провайдеров

Всё это вы изучите за 2 месяца и сможете собирать простые пайплайны на платформе n8n, которая отлично подходит для низконагруженных систем, внутреннего использования и проверки гипотез. Но поняв основные принципы работы с LLM, потом вы без проблем сможете собрать боевые версии цепочек на своём стэке.

🔥 До 23 ноября вы можете присоединиться со скидкой 25%!

Изучайте подробности на сайте и оставляйте заявку!
4🔥2
💬 Вопрос на собеседовании для сисадмина

Давайте разберем один из частых вопросов, который может быть задан на собеседовании и как на него отвечать.


Вопрос: Что такое Linux slab allocator и как он отличается от buddy allocator?

Ответ: Slab allocator — это механизм управления памятью ядра Linux, оптимизированный для частого выделения и освобождения объектов фиксированного размера, таких как дескрипторы файлов, структуры процессов и сетевые буферы. Он использует предварительно выделенные кэши (slabs) с объектами, что снижает фрагментацию и ускоряет работу ядра.

Buddy allocator, напротив, управляет страницами памяти переменного размера. Он эффективно выделяет большие блоки памяти, но плохо подходит для частого создания мелких структур, так как приводит к фрагментации и затратам на обработку.
Please open Telegram to view this post
VIEW IN TELEGRAM
5🤔2👍1
Присоединяйтесь к митапу «СУБД глазами инфраструктурщиков», чтобы обсудить всё, что волнует сообщество DBA сегодня

Участников ждут практические доклады, живое общение и обмен опытом с экспертами, а ещё актуальные инсайты о том, куда движется рынок СУБД.

В программе:
🔷 PostgreSQL без валидола: сборка кластера вручную
🔷 Автоматизация кластеров Postgre
🔷 Как мы перевезли Oracle с Solaris SPARC на x86
🔷 Масштабирование и отказоустойчивость YDB — 9 нод, банковская нагрузка, падение дата-центра, перезапуск кластера под нагрузкой без простоя.
🔷 Круглый стол «Масштабирование СУБД: реальные проблемы и перспективы»

Участвуют эксперты из: «Инфосистемы Джет», Яндекс (YDB), Arenadata, СберТех, Postgres Professional, Газинформсервис

Для кого: CIO, CTO, ИТ-директоров, архитекторов, DevOps, DBA

Когда: 25 ноября, 16:00–19:00 (МСК)
Где: офлайн и онлайн

ДЕТАЛИ И РЕГИСТРАЦИЯ
1
Почему nginx начинает отдавать 502, хотя backend жив

Это один из самых частых «фантомных» багов в проде: backend работает, процессы на месте, порты слушают - а nginx упорно шлёт 502.

Секрет почти всегда в том, как backend отвечает, а не в том, что он «лежит».

Что происходит на самом деле:

nginx пытается подключиться к upstream, но соединение не укладывается в его ожидания - по времени, по количеству воркеров или по лимитам системы.

Как проверить:

# Проверяем, отвечает ли backend напрямую
curl -I https://127.0.0.1:8000

# Смотрим ошибки nginx в момент проблемы
journalctl -u nginx -f

# Проверяем, не упёрся ли backend в лимиты соединений
netstat -plant | grep :8000


Типичные причины:

Backend отвечает слишком медленно.
nginx режет по таймауту, даже если backend в итоге что-то вернул.

У backend мало воркеров.
Например, Gunicorn запущен с 1 worker — он занят обработкой одного запроса, остальные получают 502.

Нехватка файловых дескрипторов (open files).
nginx или backend не могут открыть новое соединение → 502.

Backend закрывает соединения «грязно».
nginx ждёт корректный FIN/ACK, а получает RST → ошибка upstream.

TCP или firewall дропает локальные соединения.
Да, даже на 127.0.0.1 такое случается при агрессивных правилах.

💡Как временно «подлечить»:

В nginx.conf поднять таймауты:

proxy_connect_timeout 10s;
proxy_read_timeout 60s;
proxy_send_timeout 60s;


Проверить лимиты:

ulimit -n


и увеличить:

ulimit -n 65535


Для Gunicorn, uvicorn, uWSGI — увеличить число воркеров.

Для Docker/K8s — проверить readiness/liveness probes, чтобы нагрузка не шла на умирающие поды.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥129👍3
Please open Telegram to view this post
VIEW IN TELEGRAM
👎71👍1