Библиотека собеса по DevOps | вопросы с собеседований
3.11K subscribers
138 photos
6 videos
2 files
299 links
Вопросы с собеседований по DevOps и ответы на них.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/d7e18893

Для обратной связи: @proglibrary_feeedback_bot
Download Telegram
🔥 Последняя неделя, чтобы забрать курс по AI-агентам по старой цене!

Пока вы тестируете Copilot, другие уже учатся строить AI-агентов, которые реально работают на бизнес. Хватит отставать!

Наш курс — это концентрат практики по LangChain и RAG. Улучшенная версия, доработанная по отзывам первого потока.

📆 Старт — 15 сентября.

💸 Цена 49 000 ₽ — только до 24 августа.

👉 Зафиксировать цену
😢1
В Kubernetes у вас есть микросервис, который периодически уходит в CrashLoopBackOff после деплоя. При этом kubectl logs показывает только стандартный вывод без ошибок. Какие шаги вы предпримете для диагностики и устранения причины?

Проверить kubectl describe pod для анализа событий (liveness/readiness probes, OOMKilled, ImagePullBackOff и т.п.), затем изучить kubectl get events в namespace, проверить лимиты ресурсов и настройки health-check’ов. Если всё ок — включить более подробный логгинг, подключиться через kubectl exec, проверить зависимости (config, secrets, network).

Библиотека собеса по DevOps
2
Вы заметили, что контейнеры в продакшене начинают работать медленнее со временем. Мониторинг показывает рост использования диска внутри контейнера, хотя приложение не пишет данные в тома. Как вы будете искать и устранять проблему?

Проверить, не накапливаются ли временные файлы или логи внутри контейнера (слои copy-on-write). Использовать docker system df, docker inspect и docker logs для анализа. При необходимости — подключить тома/лог-агрегатор вместо записи в контейнерную ФС. Пересобрать образ так, чтобы данные не сохранялись в контейнере.

Библиотека собеса по DevOps
This media is not supported in your browser
VIEW IN TELEGRAM
☝️ Один мудрый тимлид дал двум своим разработчикам по «таланту» — мощной, но своенравной LLM.

Первый разработчик испугался её «галлюцинаций». Он запер модель в песочнице, не давая ей доступа к свежим данным. На вопросы модель отвечала красиво, но часто придумывала факты, то есть врала. Он просто «закопал» свой талант, боясь им пользоваться.

Второй же разработчик не побоялся. Он построил для своей LLM систему RAG — дал ей «лопату и карту», чтобы находить сокровища в базе знаний компании. Его AI-агент отвечал точно по делу, ссылаясь на реальные документы. Он заставил свой «талант» работать и приносить пользу.

Мощь LLM раскрывается не в ней самой, а в системах, которые вы строите вокруг неё.


Именно такие системы мы и будем строить на втором потоке нашего курса «AI-агенты для DS-специалистов». Мы не просто поговорим о RAG, а соберём полный пайплайн с оценкой качества, чтобы ваш агент не врал.

Представьте, что вы сможете начать изучать эту сложную и востребованную тему уже 15 сентября, а не ждать официального старта в октябре. У вас будет фора в 3 недели, чтобы спокойно разобраться в векторных базах и подходе «LLM as a Judge».

💸 Цена 49.000 ₽ действует последние 4 дня — до 24 августа.

👉 Начать строить RAG раньше других
🥱1
Почему в Kubernetes Pod может оказаться в статусе Pending?

Потому что кластер не может назначить Pod на ноду — обычно из-за нехватки ресурсов или ограничений в nodeSelector/taints/tolerations.

Библиотека собеса по DevOps
В Kubernetes-кластере у некоторых Pod’ов часто происходят рестарты с причиной OOMKilled, хотя лимиты памяти выставлены. Как вы будете искать и решать проблему?

Проверить метрики памяти Pod’а и контейнера (Prometheus, kubectl top), убедиться, что лимиты выставлены корректно. Проанализировать логи и профилирование приложения на предмет утечек памяти. При необходимости — оптимизировать код, использовать requests/limits более сбалансированно, а для критичных сервисов — вынести часть нагрузки в sidecar или вынести тяжёлые вычисления за пределы Pod’а.

Библиотека собеса по DevOps
👍1
В CI/CD пайплайне деплой иногда “подвисает” на шаге применения манифестов Kubernetes через kubectl apply. Как будете диагностировать и исправлять ситуацию?

Проверю состояние кластера (kubectl get events, kubectl describe), возможные блокировки в admission webhooks или CRD, а также конфликты при обновлении ресурсов. Для исправления — внедрить контроль версий манифестов через GitOps (ArgoCD/Flux), добавить health-check шаги и таймауты, а также настроить откат или retry при зависаниях.

Библиотека собеса по DevOps
👍1
Вы получили задание подготовить Docker-образ для продакшена. Как минимизировать потенциальные риски безопасности при его использовании?

Использовать минимальные базовые образы (например, alpine), фиксировать версии пакетов, регулярно обновлять образы, запускать контейнеры с непривилегированным пользователем, ограничивать доступ к ресурсам через capabilities и seccomp, проверять образы на уязвимости (Trivy, Clair).

Библиотека собеса по DevOps
👍1
В Kubernetes-кластере разработчики жалуются, что новые версии сервисов иногда начинают обслуживать трафик до полной готовности и вызывают ошибки у клиентов. Как вы будете решать эту проблему?

Настроить readinessProbe, чтобы Pod начинал принимать трафик только после готовности приложения, и при необходимости использовать lifecycle hooks (например, postStart) или стратегию деплоя RollingUpdate для плавного обновления.

Библиотека собеса по DevOps
🏃‍♀️ Новый поток курса — собери своих AI-агентов

7 октября стартует второй поток курса «AI-агенты для DS-специалистов».
За 5 недель вы научитесь собирать агентов, которые уже сейчас будут помогать бизнесу.

В кружке выше Максим Шаланкин, наш преподаватель, рассказывает подробнее — включай, чтобы не пропустить.

👉 Записаться на курс
Please open Telegram to view this post
VIEW IN TELEGRAM
В Kubernetes-кластере поды периодически "падают" с ошибкой ImagePullBackOff. Как вы будете искать и устранять проблему?

Проверить правильность имени образа и тега, доступность registry, наличие и корректность imagePullSecrets для приватных репозиториев. Убедиться, что политика imagePullPolicy настроена верно. Для устранения — поправить креды/теги/сеть, настроить retry и при необходимости кэширование образов на нодах.

Библиотека собеса по DevOps
This media is not supported in your browser
VIEW IN TELEGRAM
Так, владелец макбука. Хватит позировать в кофейне.

Настоящее портфолио — это не стикеры на крышке, а проект с чистым кодом, README и рабочей демкой.

Не знаешь, как такой собрать? Научим. Наш курс «ML для старта в Data Science» — это пошаговый гайд к проекту, за который не стыдно.

ОСТАЛАСЬ НЕДЕЛЯ, чтобы забрать его по старой цене в 44.000 ₽. С 1 сентября — всё.

🎁 И да, при покупке курса ML до 1 сентябрякурс по Python получаешь бесплатно.

👉 Апгрейд от «вайба» до «оффера» тут
В Kubernetes-продакшене пользователи жалуются на нестабильность: часть запросов “теряется” при деплое новой версии сервиса. Как вы будете диагностировать и устранять проблему?

Проверить стратегию деплоя (RollingUpdate, Recreate, blue-green/canary), убедиться, что настроены readinessProbe и livenessProbe, а также корректные maxUnavailable и maxSurge. Посмотреть события кластера (kubectl describe pod, kubectl get events) и метрики ingress/load balancer. Решение — правильно настроить пробы, стратегию деплоя и добавить graceful shutdown (preStop hook).

Библиотека собеса по DevOps