Admin Guides | Сисадмин
11.5K subscribers
1.34K photos
20 videos
34 files
568 links
Обучающий канал по ОС Linux & Windows для начинающих и действующих администраторов.

Админ, реклама: @Ak_Mihail
Биржа: https://telega.in/c/admguides

РКН: https://kurl.ru/nQejS
Download Telegram
Как отследить утечки памяти у демонов?

Иногда сервисы начинают «распухать» по памяти, особенно те, что работают месяцами без рестартов.

В Linux это можно заметить и даже ограничить — без внешних мониторингов.

🔍 Проверяем использование памяти

Посмотреть, кто сколько ест:

smem -p | sort -k 4 -h


или подробнее по процессу:

pmap -x <PID>


Если сервис запущен через systemd — можно сразу смотреть в разрезе cgroup:

systemd-cgtop


или точечно:

systemctl status myservice


⚙️ Автоматическое ограничение памяти

В unit-файле можно задать предел, после которого systemd перезапустит сервис:

[Service]
MemoryMax=500M
Restart=on-failure


После изменения — не забыть:

sudo systemctl daemon-reload
sudo systemctl restart myservice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥51
💬 Вопрос на собеседовании для DevOps-инженера

Давайте разберем один из частых вопросов, который может быть задан на собеседовании и как на него отвечать.


Вопрос: Что такое Linux PSI (Pressure Stall Information) и как его использовать для мониторинга?

Ответ: PSI — это механизм ядра Linux, позволяющий отслеживать давление на ресурсы: CPU, память и I/O. Он показывает, сколько времени процессы провели в ожидании этих ресурсов, что помогает выявить узкие места до того, как ситуация станет критичной (например, до вмешательства oom-killer).

PSI не измеряет загрузку напрямую — он измеряет «stall time» — сколько процессов одновременно не могли продолжить работу из-за нехватки ресурса. Это дает более реалистичную картину деградации системы.

Проверка PSI осуществляется через:

cat /proc/pressure/cpu
cat /proc/pressure/memory
cat /proc/pressure/io
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍4
😁19👍5🤔1
Как сделать аварийный SSH-вход при падении сети

Бывает, обновил firewall или NetworkManager — и основной SSH отвалился.

Чтобы не остаться без доступа, можно поднять резервный sshd — на другом порту и интерфейсе.

⚙️ Создаём копию конфигурации

sudo cp /etc/ssh/sshd_config /etc/ssh/sshd_config.backup
sudo cp /etc/ssh/sshd_config /etc/ssh/sshd_config_alt


В файле sshd_config_alt укажи, например:

Port 2222
ListenAddress 192.168.100.10
PidFile /run/sshd-alt.pid


(адрес — интерфейс, который не трогают твои основные правила).

🚀 Запускаем второй sshd вручную

sudo /usr/sbin/sshd -f /etc/ssh/sshd_config_alt


или через systemd:

sudo systemctl start [email protected]


(в некоторых дистрибутивах можно создать отдельный unit-файл).

🧭 Проверяем доступ

С другой машины:

ssh -p 2222 [email protected]


Если всё работает — можно спать спокойнее: при сбое сети или блокировке основного порта резервный SSH всё ещё жив.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍144👎1🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣20😁103
💬 Вопрос на собеседовании для сисадмина

Давайте разберем один из частых вопросов, который может быть задан на собеседовании и как на него отвечать.


Вопрос: Чем отличается fork() от exec() в Linux и когда использовать каждый из них?

Ответ: fork() — это системный вызов, создающий новый процесс путём копирования текущего. Получившийся дочерний процесс будет точной копией родительского: он унаследует дескрипторы файлов, переменные окружения и текущее состояние. Основное отличие — у него будет свой PID. Это полезно, если вы хотите создать процесс, который продолжит выполнять ту же программу, но, например, с другими параметрами.

exec() — это семейство функций (execl, execp, execve и др.), которое заменяет текущий процесс на новый, загружая в его адресное пространство другую программу. После вызова exec() оригинальный код процесса больше не выполняется — он полностью замещается. Это удобно, если вы после fork() хотите в дочернем процессе запустить другую программу (что и делает большинство шеллов при запуске команд).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103🔥1
Как замерить время DNS, TCP и TLS при подключении?

Порой сайт вроде открывается, но медленно, и непонятно, где затык: DNS, сеть или сервер.
curl умеет показать время на каждом этапе.

curl -o /dev/null -s -w \
"DNS: %{time_namelookup}s\nTCP: %{time_connect}s\nTLS: %{time_appconnect}s\nStartTransfer: %{time_starttransfer}s\nTotal: %{time_total}s\n" \
https://example.com


🤚Что показывает:
DNS — сколько ушло на резолв домена
TCP — время установки соединения
TLS — рукопожатие HTTPS
StartTransfer — когда сервер начал отдавать ответ
Total — общее время запроса

Если DNS кеш мешает, можно сбросить его:

systemd-resolve --flush-caches


или указать IP напрямую:

curl --resolve example.com:443:1.2.3.4 https://example.com
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥8👍7
Microsoft заблокировала KMS38 в Windows 11

В последних обновлениях Windows 11 (Patch Tuesday, ноябрь 2025) удалили функционал, позволяющий продлевать активацию ОС до 2038 года через KMS38 и скрипты MAS.

Метод работал через обход GatherOSstate, теперь он полностью отключён. 


Разработчики MASSGRAVE советуют использовать другие способы активации, например HWID или TSforge.

Интересно, что Microsoft официально почти не против подобных обходов: ключи для KMS и проекты GitHub остаются доступными, пока они не мешают обновлениям и телеметрии.
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥5
Как Windows ломает старые драйверы после крупных апдейтов

После больших апдейтов Windows 11 часто «падает» старый драйверный зоопарк:
отключаются устаревшие цифровые подписи,
выносятся WDM-драйверы,
перестают грузиться модули KMDF < 1.11.

Как быстро понять, что именно сломалось

1️⃣Проверить, грузится ли драйвер

driverquery /v /fo list | more


Ищем свой .sys. Если State: Stopped и Start Mode: Manual, хотя раньше был Loaded — подозрительно.

2️⃣ Посмотреть логи установки драйверов

notepad C:\Windows\inf\SetupAPI.dev.log


Красные флаги:

!!!  sig: Error 0x800b0109
!!! sto: Failed to install driver...
!!! dvi: Device failed to start


Это почти всегда подпись или несовместимость.

3️⃣ Проверить ошибки Kernel-PnP

Get-WinEvent -LogName System | where {$_.Id -in 219,411} | select TimeCreated,Id,Message


Что попробовать сделать

Установить старый драйвер вручную

pnputil /add-driver "C:\old_driver\*.inf" /install


Включить тестовую подпись (только временно!)

bcdedit /set testsigning on
shutdown /r /t 0


Отключение:

bcdedit /set testsigning off


Проверить версию KMDF драйвера

Get-Item "C:\Windows\System32\drivers\имя.sys" | Format-List -Property *


Если видишь KMDF Version < 1.11, то Windows может его «убивать» после обновлений.

Вытянуть предыдущую версию драйвера из DriverStore

pnputil /export-driver oemXX.inf C:\backup_driver\
Please open Telegram to view this post
VIEW IN TELEGRAM
👍145
💬 Вопрос на собеседовании для DevOps-инженера

Давайте разберем один из частых вопросов, который может быть задан на собеседовании и как на него отвечать.


Вопрос: Что такое Kernel Same-page Merging (KSM) и в каких сценариях он полезен?

Ответ: KSM — это механизм deduplication памяти в ядре Linux. Он сканирует оперативную память на предмет одинаковых страниц, используемых разными процессами, и объединяет их в одну общую страницу с использованием Copy-On-Write. Это позволяет существенно экономить память в средах с множеством похожих процессов, например, виртуальных машин или контейнеров.

Как это работает на практике:
• Процессы продолжают читать данные как обычно, пока не попытаются изменить их.
• При записи в общую страницу ядро создаёт отдельную копию для изменяющего процесс, сохраняя целостность данных остальных.
• KSM активно применяется в системах с большим количеством VM, таких как KVM-гипервизоры, а также для оптимизации контейнеров на хостах с ограниченной памятью.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3👎2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ЧЕРНАЯ ПЯТНИЦА УЖЕ ЗДЕСЬ!🔥 Скидка-10 % на серверное оборудование!

УЖЕ СЕГОДНЯ в честь Чёрной пятницы надежная компания по поставке серверного оборудования “Сервер Гейт” даёт скидку -10 % на все refurbished серверное оборудование!
Ребята сотрудничают с крупнейшими вендорами и держат высокие позиции на рынке уже 7 лет благодаря профессиональному подходу. 

Почему нельзя упустить момент?
- экономия на оборудовании, необходимом для вашего бизнеса,
- расширенная гарантия до 3 лет,
- доставка по всей России,
- много подтвержденных отзывов клиентов,
- есть консультации по подбору оборудования,
- проведено стресс тестирование каждого сервера,
- все оборудование в наличии на собственном большом складе в Москве.

Акция действует только до конца недели! Скидка фиксирует стоимость на 2 дня.
Звоните ребятам - помогут подобрать железо под любой запрос 
☎️ 8-800-222-86-42
💻 СМОТРЕТЬ ЦЕНЫ

Реклама.
О рекламодателе.
1
Как понять, что на сервере проблема с DNS, а не сетью

Иногда сервер выглядит «мертвым»: SSH висит, curl зависает, сервисы долго стартуют. 


Но пинги по IP проходят без проблем. Сеть вроде работает, а приложения «тормозят».

Частая причина - проблемы с DNS. Когда lookup занимает слишком много времени, TCP соединения кажутся зависшими.

Простая диагностика

Посмотреть, где тормозит резолв:

dig +trace example.com


Если запрос виснет уже на корневых серверах или NS - проблема может быть с внешним DNS.

Быстрый тест через конкретный резолвер:

dig @1.1.1.1 example.com


Если здесь всё летает, значит проблема локальная - systemd-resolved или другой кеширующий DNSd.

Проверяем systemd-resolved:

resolvectl query example.com
resolvectl status
systemd-resolve --statistics


Обратите внимание на «Transactions in progress» и размер кеша. Если число запросов растёт, а ответы не приходят — локальный DNSd завис.

Временное решение для теста:

sudo systemctl stop systemd-resolved
echo "nameserver 1.1.1.1" | sudo tee /etc/resolv.conf


Если после этого lookup улетает мгновенно - виноват локальный кеш.
👍12🔥51
— Ты уволен
— Почему?
— Мы оплатили GPT-5, ты больше не нужен.


Вы тоже в ах@е с такого расклада? Учился лет 5, потом столько же батрачил за копейки ради опыта — чтобы тебя заменила еб@чая железяка.

А теперь задумайтес
ь: нейронки развиваются с бешеной скоростью. Поэтому сейчас как никогда нужны спецы для их обучения.

Чтобы в кратчайшие сроки выйти на уровень элиты и стать топом в сфере — подпишитесь на канал @devsp. Его автор раскрывает неочевидные секреты: как в 3 месяца уместить 6 лет обучения, достойно пройти любое собеседование и что делать, чтобы лучшие компании дрались за вас.

А временами подкидывает крутые вакансии и лайфхаки, после которых вас с руками оторвут даже без опыта.

Это всё равно что встретить Нео и войти в 10% тех, кто сломал систему. Подписывайтесь: @devsp
🤡15🌭21🔥1
12😁8🔥6🫡3👎1
👩‍💻 Kubernetes стал стандартом индустрии. Но базового знания мало: компании ищут специалистов, которые могут строить полноценные инфраструктурные платформы.

🔥 Курс «Инфраструктурная платформа на основе Kubernetes» от OTUS — это живая практика от опытных инженеров. На занятиях вы пройдёте весь путь от развёртывания кластера и настройки мониторинга до управления безопасностью и логированием.

🦾 После обучения вы сможете претендовать на позицию платформенного инженера, уверенно работать с экосистемой Kubernetes и подготовиться к международным сертификациям CKA и CKAD. А диплом OTUS станет аргументом для работодателей: курс создан по актуальным требованиям рынка.

➡️Пройдите короткое вступительное тестирование и присоединяйтесь к группе: https://otus.pw/Brj0K/?erid=2W5zFGrjrKA

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
2
Падение интернета: Cloudflare восстановила работу

Вчера на несколько часов глобально «упал» интернет - сервисы на базе Cloudflare были недоступны по всему миру.

Пользователи не могли зайти на X, Spotify, ChatGPT, а терминалы McDonald’s перестали принимать заказы.


Cloudflare объяснила сбой «необычным всплеском трафика», который вызвал деградацию DNS и CDN-сервисов.

Инженеры оперативно перераспределили нагрузку, очистили кеши и восстановили маршрутизацию.
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍5
Кто идёт на Kuber Conf by AOT 4 декабря?

Устраиваю розыгрыш 2 билетов на Kuber Conf by АОТ — первую коммьюнити конференцию по K8s в России, которая пройдет 4 декабря в Москве.

В программе — только хардкор и реальные кейсы от команд Авито,Т-Банка, Vitastor, Beget, VK Cloud, Yandex Cloud, Selectel и других.

🟣 Изменения в Cluster API без пересоздания машин
🟣 Как строили платформу деплоя в Т-Банке
🟣 Практический deep-dive в CNI chaining
🟣 Безопасный Gatekeeper в архитектуре k8s-in-k8s
🟣 Поддержка Kubernetes в Vitastor
🟣 Karpenter-провайдер своими руками — что внутри

📅 20 ноября в 12:00 выберем 2 счастливчиков.

Чтобы участвовать: Необходимо ответить на вопрос: Как можно обновить конфигурацию узлов в Cluster API без полного пересоздания машин и какие основные методы для этого существуют?

- Ответы надо присылать в чат канала
- В ответах не важен правильный ответ, ответить нужно максимально креативно и с юмором
- Победителей выберет админ, результаты конкурса будут 20 ноября в 12:00

Kuber Conf by AOT пройдет под эгидой будущей Ассоциации облачно-ориентированных технологий (АОТ), ее создают VK Cloud, Флант и Yandex Cloud.
Присоединяйся!

Программа и билеты

Реклама. Садовская Е.О, ИНН 9710066394, erid:2Vtzqv2anF3
1
Почему SSH-сессии обрываются через 2–3 минуты

Иногда вы подключаетесь по SSH, а через пару минут соединение внезапно обрывается. 


Пинги живые, сеть вроде в порядке, но сессия падает.

Ну и иногда виноваты неправильные настройки keepalive или MTU, а также энергосберегающие режимы сетевой карты. TCPKeepAlive на клиенте ≠ ServerAliveInterval, и SSH-сервер может закрывать «тихие» соединения.

Подключение с максимальным выводом:

ssh -vvv user@server


И проверка конфигурации сервера:

grep Alive /etc/ssh/sshd_config


Смотрим, какие значения ClientAliveInterval, ClientAliveCountMax установлены.

Исправляем:

На сервере включаем keepalive и увеличиваем интервалы:

ClientAliveInterval 60
ClientAliveCountMax 10


На клиенте можно настроить:

ServerAliveInterval 60
ServerAliveCountMax 10


Если обрывы связаны с MTU или power-save сетевухи, проверяем:

ip link show dev eth0
ethtool eth0


И при необходимости корректируем MTU или отключаем энергосбережение.
Please open Telegram to view this post
VIEW IN TELEGRAM
10👍5
Forwarded from Хирон
Идеология преимущества

Как применить самые эффективные модели человеческого мышления и сконструировать свой лучший сценарий будущего?

Изучите статью-откровение, которая перевернет ваше представление о природе взаимодействия с ИИ:

🧠 «Хирон. ИИ. Архитектура математического преимущества»

P.S. Будущее - это алгоритм, который можно написать
🤡5👍41🔥1