Kubernetes и кот Лихачева
4.19K subscribers
989 photos
27 videos
4 files
1.05K links
Все про Kubernetes и немного про кота Маркуса

Чат для конструктивного общения: https://t.iss.one/+Q4z_2ckAkBxhNWNi

Задать вопрос: https://t.iss.one/K8sSlurm_bot?start=question
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Всем привет!

Вебинар по observability уже совсем скоро — завтра в 19:00. Ведущих будет трое: я, кот и Кирилл Борисов.

Ставьте лайки и огонечки, если хотите, чтобы Маркус тоже был на вебе❤️🔥

Занять место — через бота ⬅️
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥246👍4😁1🤓1
Маркус выглянул из укрытия, чтобы напомнить:

👉 Вебинар по Observability сегодня в 19:00

Поговорим о том, какие проблемы решает Observability:
▶️Выявление аномалий в работе кластера
▶️Мониторинг сетевой активности и предотвращение сбоев
▶️Обеспечение соответствия политик безопасности
▶️Снижение времени простоя за счет быстрого устранения инцидентов
▶️Упрощение эксплуатации сложных систем с минимальными затратами

А ещё:
Рассмотрим внутренние инструменты k8s, связанные с безопасностью и отладкой работы кластера
Посмотрим на инструменты, полезные для понимания работы больших систем без необходимости внедрения большого количества изменений в сервисы, написанные на разных языках и фреймворках.

Ссылки на трансляцию будут в боте. Подключайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥32👍2
🔥 Мы начинаем 🔥

Ссылки уже в боте. Всех жду!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Привет! На связи Маркус.

Я тут питон решил изучать. По мне видно, насколько он мне заходит, но я не сдаюсь!

А пока я продираюсь сквозь синтаксис, ловите документацию, про которую мой человек говорил вчера на вебинаре:

👉 Kubernetes auditing

👉 How to use Kubernetes events for effective alerting and monitoring

👉 OpenTelemetry

Впереди выходные, отличный повод, чтобы изучить. До понедельника!
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍3🔥1😁1
Привет!

Мы с вами успели уже довольно много поговорить о кубах — потрогали паттерны, разобрались с сайдкарами, вникли в работу реквестов и лимитов. Думаю, у некоторых из вас в процессе возникли вопросы, которые хотелось бы обсудить.

Предлагаю встретиться в прямом эфире и поговорить о том, что больше всего болит — по темам, которые уже были в канале, или просто в контексте кубов и инфраструктуры.

➡️ Когда: 23 января в 18:30 мск

Вопросы собираем в комментариях к этому посту 👇 (спросить голосом тоже можно будет, так что если планируете прийти и спросить, но писать комментарий лень — ставьте 🔥)

Маркус ждет ваших вопросов!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥21
Привет! Сегодня поговорим про деньги.

Но не про те деньги, про которые вы могли бы подумать. Не про зарплаты.

Сегодня про деньги, которые вы сливаете в облако, не подозревая об этом. Вроде бы мелочь: пропустил одну строку конфигурации — а потом обнаружил, что финдир поставил тебе встречу после ежегодного анализа бюджета компании.

❗️Disclaimer: важно понимать, что у облаков много плюсов, но подходить к их использованию стоит аккуратно. Пост не ставит целью призвать кого-то бежать из облаков на собственные сервера, а лишь служит напоминанием про масштабы ответственности, которую на себя берут инженеры в компаниях.

При чем тут k8s? Вы же не запускаете кластер просто так, чтобы был? Он решает конкретные задачи бизнеса, но не сам по себе, а путем взаимодействия запущенных в кластере сервисов с базами данных, файловыми хранилищами, внешними API и так далее. И даже отдельный кластер k8s, без этих ваших облаков, может потребовать оптимизации с точки зрения костов на поддержку, обслуживание и обновление.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2🤩1
Посмотрим типичные примеры, озаглавленные общей идеей «Играл с облаками и проиграл»

1️⃣ Overprovisioning

Вы решили прикинуть размер виртуальных машин для нового сервиса и выбрали X4 на основе ожидаемой нагрузки. Но по факту оказалось, что сервис потребляет от силы 10% выделенных ресурсов, а в графики потребления ресурсов мало кто заглядывает, пока все идет хорошо. Вы только что переплатили облаку в 5 раз, но узнаете про это немного позже.

2️⃣ Стоимость трафика

Поставили тестовый сервис, который через NAT Gateway ходит в S3. Да, в проде. А что, работает же. Потом пришли счета за трафик — просто космос. А всего-то нужно было использовать S3 VPC Gateway Endpoint, и было бы счастье. Но опять же, никто это не мониторил и не задумывался об оптимизации.

3️⃣ Автоскейлинг (нет)

Вы ведь не тестируете в проде, правда? Для таких случаев у вас наверняка есть dev инфраструктура. Надеюсь, полностью в отдельном аккаунте облака, чтобы случайно не сломать прод. Но вот нюанс: dev простаивает ночами. Его можно было бы тушить с 18:00 до 9:00, а заодно отключить лишние реплики, бэкапы, CDN и прочее, что в проде критично, а тут — нет. Но вы об этом могли забыть, и облако снова забирает себе деньги, чтобы подогревать воздух в датацентрах.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54
4️⃣ Платим за мусор

Представьте, в коде настройки одного ресурса terraform пропущена важная опция. Но это вы уже потом узнаете, когда начнете счета анализировать.
Конкретно речь про incomplete multi-part uploads S3 (почитать подробнее — тут).

S3 bucket конечно же создан новый, под новый сервис. Плановая стоимость его использования рассчитана очень приблизительно, поэтому еще предстоит узнать его реальную стоимость.

Проходит месяц, второй — а мусор в S3 bucket копится, потому что часть загрузок по разным причинам не завершаются успешно. Вы этого не замечаете, ведь инфра огромная. Новый S3 bucket капля в этом океане. И только может быть через полгода-год, при анализе затрат в рамках отдельных команд кто-то заметит, что на этот мусор ушел солидный кусок бюджета команды.

5️⃣ Но как же мониторинг и алерты?

Спросят дотошные читатели. А вот так. Большие инфраструктуры — это сложно: сегодня ты настраиваешь Kubernetes, завтра разбираешься с S3, послезавтра — с репликацией базы данных. Команда, которая управляет бюджетами, вообще может сидеть в другой стране. Пока вы укладываетесь в их планы, никто не проверяет, на что именно идут деньги.

6️⃣ FinOps — спаситель или костыль?

В современном мире появилась даже специальная должность — FinOps. Но если у вас нет отдельного человека, то будьте добры: садитесь и разберитесь, как оптимизировать свои расходы самостоятельно. И помимо стандартного мониторинга подумайте и настройте еще и мониторинг костов.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥1
➡️ Почему это важно?

Системы становятся сложнее, количество слоев абстракции растет. Даже с кучей инструментов, которые должны бить вас по рукам за глупые ошибки в конфигурации, вы не сможете предусмотреть все. И линтеры не спасут, если их не подключить, не настроить и не объяснить всем, почему их предупреждения — это не просто запись в логе пайплайна. А если ваш пайплайн не падает, а только ругается в логах, то будьте уверены, что никто и не подумает это исправлять.

➡️ Мораль
Никогда не рассчитывайте, что облако всё сделает за вас. Настройки по умолчанию — это компромисс, который подходит на старте. Что применяет компания X, может частично или полностью не работать для компании Y. Хотите надежную, оптимальную и недорогую инфраструктуру? Изучите возможности и ограничения каждого сервиса, который используете. И не поленитесь почитать документацию сервиса перед выполнением terraform apply).

И да, прежде чем запускать что-то новое, проверьте дважды. А лучше — трижды. Помните, что облако с удовольствием монетизирует ваши ошибки. Но в этой игре можно и выигрывать, если не идти по самому простому пути.

Остались вопросы? Напоминаю, что о наболевшем можно спросить в комментариях к этому посту — на лайве разберем 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4🔥2
Что лежит в основе работы service mesh, и как нам в этом поможет Linux?
#полезный_материал

Сегодня решил поделиться с вами видео, в котором мы немного прикоснемся к магии 🔮

Тема сама по себе объемная, но, как мне кажется, понимание механизмов, на которых работает service mesh (да и любой другой инструмент), позволяет в случае инцидентов в любой программной системе чуть более уверенно находить root cause и быстрее чинить проблему.

В видео разбираю проект 👉 https://to.slurm.io/27PWaA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
44👍3🔥1
Кстати, кое-что осталось за кадром!

Например, зачем нам вообще нужны capabilities? И что происходит, когда на этапе сборки proxy-init вызывается вот это:

setcap cap_net_raw,cap_net_admin=+eip /$APP_NAME


Если коротко: эти capabilities открывают приложению в контейнере возможность использовать "сырые" сокеты и доступ к управлению iptables.

👉 Про CAP_NET_RAW и CAP_NET_ADMIN можно почитать тут.
Но если вы, как и я, предпочитаете более практические описания — смотрите здесь.

А теперь вопрос на засыпку: почему команда ping работает без прав root?

А потому что на её бинарнике стоит CAP_NET_RAW. И тут в игру вступают «сырые» сокеты.

👉 Подробнее про них — по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍73🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Лайв-стрим сегодня вечером 🔥

Обсудим:

🔸как строить отказоустойчивые системы;
🔸как правильно готовить kubernetes в дикой природе, для больших и для маленьких систем;
🔸как правильно гладить котиков;
🔸как выстраивать процессы observability;

и всё-всё-всё, что вы придумаете и принесёте на лайв в качестве своих вопросов.

Приносите свои боли с инфраструктурой, будем прикладывать подорожник ☘️

➡️ Начало сегодня в 18:30. Включайте уведомления и подключайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥6🤩1
Live stream finished (1 hour)
Helm в Kubernetes: открытый вебинар

👉 Когда: 29 января в 19:00 мск

Приглашаю всех, кто хочет потрогать руками продвинутую шаблонизацию манифестов и разобраться, как это работает:

🔸 Рассмотрим создание ресурсов в Kubernetes с помощью YAML-файлов
🔸 Обсудим шаблонизаторы ресурсов: Kustomize, Helm, CUE и Jsonnet
🔸 Разберемся с терминологией Helm и основными командами
🔸 Изучим внутреннее устройство одного helm-чарта
🔸 Научимся искать и работать с готовыми helm-чартами с Artifact HUB

Ведущие:
я и Маркус (куда без него?)

Приглашенный эксперт: Руслан Гайнанов, Тимлид DevOps-команды проекта «Осмакс» в ИТ-Холдинге Т1

Занять место на вебинаре — через бота ⬅️

Фото Маркуса для привлечения внимания и поднятия настроения 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
14👍31
Привет! На связи Маркус.

Я здесь, чтобы показать вам свои новые книжки и поделиться записью вебинара по Observability. Как видите, книжки я уже показал 😼

Вебинар мы с моим человеком провели 16 января (да, я там был, просто не афишировался) и обсудили на нем:

▶️Выявление аномалий в работе кластера
▶️Мониторинг сетевой активности и предотвращение сбоев
▶️Обеспечение соответствия политик безопасности
▶️Снижение времени простоя за счет быстрого устранения инцидентов
▶️Упрощение эксплуатации сложных систем с минимальными затратами

Посмотреть можно тут:

📺  YouTube
📺  VK Video
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍3
А в этом посте предлагаю выбрать тему для следующего вебинара:

1️⃣ Что нового появилось в k8s за последние пару лет
2️⃣ Использование и настройка service mesh
3️⃣ Инструменты вокруг k8s, которые позволяют добавлять конкретные функции в кластер: для CI/CD, для мониторинга, для дебага, для анализа трафика и так далее.

Напишите в комментариях, какая из тем вам интересна (третью можно и нужно сократить до конкретной группы проблем) или напишите свой вариант 😻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
Kubernetes Мега: старт уже сегодня!

Ну что, котятки, углубимся в практику работы с k8s? 😸

Сегодня стартует первый в этом году поток курса «Kubernetes Мега». В течение следующих семи недель мы будем учиться:

👉 сопровождать и деплоить приложения в k8s
👉 переносить продукт на платформу kubernetes
👉 внедрять service mesh, настраивать внешний доступ, применять сертификаты
👉 использовать возможности k8s при проектировании платформенных решений
👉 повышать осознанность при внедрении решений

и много чего еще (полная программа есть на странице курса).

Курс мы обновили совсем недавно: актуализировали версию kubernetes и сертификацию, добавили новые практические задания и теоретические материалы — можно смело применять в самых современных проектах 😎

❗️Вкатиться в текущий поток можно еще неделю, пока идут установочные встречи и знакомство с курсом. Так что если не успели или пропустили — велкам, всех жду!

Занять место — по ссылке ⬅️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
👍51