CatOps – Telegram

CatOps

5.08K subscribers

94 photos

5 videos

19 files

2.57K links

DevOps and other issues by Yurii Rochniak (@grem1in) - SRE @ Preply && Maksym Vlasov (@MaxymVlasov) - Engineer @ Star. Opinions on our own.

We do not post ads including event announcements. Please, do not bother us with such requests!

Download Telegram

About

Blog

Apps

Platform

5.08K subscribers

Ian Lewis объясняет, что такое container runtime, какие они бывают и почему это словосочетание вызывает путанницу

Если тезисно:
- у самого понятия "runtime" тоже несколько определений.
- в статье опираются на то, что рантайм — это некая сущность, которая поддерживает исполнение. Пример: HotSpot Runtime в Java
- таким образом есть low level и high level рантаймы
- первые позволяют вам лишь запускать контейнеры (lxc, runc)
- вторые уже содержат какие-то API, фичи вокруг менеджмента имаджей и проч

to be continued

Часть I:
https://www.ianlewis.org/en/container-runtimes-part-1-introduction-container-r

#containers

Container Runtimes Part 1: An Introduction to Container Runtimes

One of the terms you hear a lot when dealing with containers is “container runtime”. “Container runtime” can have different meanings to different people so it’s no wonder that it’s such a confusing and vaguely understood term, even within the container community.

1.01K views14:00

Окей, вы настроили мониторинг. У вас есть куча метрик, которые даже собраны в красивые дашборды

Куда смотреть? Надо ли будить половину команды, если вырос cpu_wio на 7% бэкэндов? А на 20%? Или мы просто будем сомтреть на valid_response_p95_rate и алерить по данной метрике?

Конечно, это всё очень индивидуально, и у разных людей разные мнения по поводу "золотых сигналов". Т.е индикаторов, что у нас сейчас всё overall good или overall bad. Почитать о разных мнениях можно тут:

https://medium.com/devopslinks/how-to-monitor-the-sre-golden-signals-1391cadc7524

В кратце о методах:

Google: Latency, Traffic, Errors, and Saturation
Brendan Gregg: Utilization, Saturation, and Errors
Tom Wilkie: Rate, Errors, and Duration

Ну а дальше уже в статье всё разжёвано детальней

#monitoring #observability

1.18K views11:29

Amazon теперь предупреждает, если у вас есть шанс выйти за пределы бесплатного лимита (free tier)

Удобно для ведения pet-проектов и просто знакомства с платформой

#aws

AWS Free Tier usage alerts automatically notify you when you are forecasted to exceed your AWS service usage limits

1.11K views08:48

Forwarded from devdigest // azure (Azure News Bot)

Hackernoon опубликовал интересное сраванение Azure Container Instances и AWS Fargate

https://hackernoon.com/azure-container-instances-vs-aws-fargate-3216607f63f4

Azure Container Instances vs. AWS Fargate | Hacker Noon

8 views15:03

Чёт я как-то заэтсамое и получился перерыв. Нехорошо.

Я на днях в Титтвере наткнулся на интересную дискуссию о том, стоит ли теперь всем париться OPS задачами. Но перед тем как сюда её загонять, надо как-то собрать всё воедино. А надо же ещё и работу работать.

Так что почитайте пока про SRE с точки зрения NewRelic, а я сегодня-завтра твиттерскую дискуссию в постик оформлю

https://blog.newrelic.com/2017/10/30/site-reliability-engineer-sre/

New Relic: The Rise of Site Reliability Engineers

As the Site Reliability Engineer (SRE) role continues to evolve and expand, we examine the history, proliferation, and particular iteration of Site Reliability Engineering inside New Relic.

1.09K views11:19

Я знаю, что многие тут используют Slack. Так что ловите тёмную тему для него :)

https://github.com/widget-/slack-black-theme

По идее должно рабоать под Mac, Linux и Windows

GitHub - widget-/slack-black-theme: A darker, more contrasty, Slack theme.

A darker, more contrasty, Slack theme. Contribute to widget-/slack-black-theme development by creating an account on GitHub.

976 views16:36

Итак, как и обещал, сорал воедино мнения о том, кто должен заниматься OPS. Тут как бы нет одного мнения, скорее всё оч сильно зависит от контекста (в котором вы работаете)

Аргументы за то, что OPS — это теперь общая задача:
- все пишут код
- системы стали сложными и распределенными, поэтому знать всё целиком почти невозможно, но вот знать ту часть, над которой работаешь лучше до конца
- всем должно быть не наплевать

Звучит, конечно, красиво, но есть и аргументы против. Они куда более приземлённые:
- системы стали более сложными и распределенными, соответственно есть куча штук, которые надо знать. Если вы свалите это всё на девелоперов, они охренеют
- правильное распределение задач и knowledge sharing ведёт к успеху, но всё равно останутся какие-то чисто Dev и чисто Ops штуки. И это нормально, что кадый не зватается за всё

По итогам, спор, вроде есть, но в то же время основные тезисы одинаковы. Тогда зачем об этом писать? Да потому что в реальной жизни очень часто встают вопросы, кому куда можно ходить, кто может SSH, кто нет и так далее. От ответа на вопрос: кто исполняет OPS задачи будет зависить очень много решений в вашей конторе, как по доступу, так и иногда по инфраструктуре.

И если раньше стоял вопрос: почему вы не даёте своим разрабам доступ по SSH на прод, разве вы им не доверяете? Сейчас же Kelsey Hightower на Кубконе напряму заявляет, что разработчикам kubectl ни к чему

C'est la vie

920 views18:38

И вдогонку твитт, который мне нравится)

https://twitter.com/lizrice/status/938788726926397440

kubectl is the new ssh" - @kelseyhightower (He says "kube-see-tee-ell" btw so that's probably canonical pronunciation...) #KubeConِ #CloudNativeCon

950 views18:39

Я так подумал, что надо соответствовать никнейму, потому решил немного копнуть в сторону chaos engineering. А тут как раз Gremlin Inc зарелизили свою Resilience as a Service платформу. В двух словах, это SaaS Chaos Monkey с возможностью роллбека. Вы платите деньги за то, что вашу инфраструктуру кто-то ломает. Шикарно, я считаю!

https://blog.gremlin.com/introducing-gremlin-orchestrating-chaos-b137b74f2371

Алсо, я только начал копать, так что, если вы знаете что-то интересное по теме, пишите сразу мне (@grem1in)
Ну и вообще, любой фидбэк приветствуется!

#chaos

Introducing Gremlin: Orchestrating Chaos

Today is an exciting day for our team at Gremlin. After nearly two years in the making, we’re proud to share that Gremlin’s “Resilience as…

890 views11:53

Немного новостей от AWS (дайджеста ради):

- Amazon ECS теперь поддерживает Windows контейнеры. Поддержка до этого была в бета-версии

- io1 волумы можно розганять до 32,000 IOPS и 500 MB/s per volume

- Aurora теперь HIPAA Compliant

- Резилнулся Route 53 Naming API, который упрощает управление DNS для микросервисов, когда те скейлятся (вверх или вниз)

- Релизнулся AWS SSO - Single Sign In. Ну об этом уже многие писали

- Managed ElasticSearch обновили до версии 6.0

- Теперь можно кастомизировать верфикацию email в SES. Ну чтобы вы кастомерам вскую недописанную фигню не слали

- AWS нотифает, когда вы подходите к лимиту Free Tier. Ну об этом я уже тоже писал

- Можно делать кластерные проверки в CloudWatch

Пока писал, задумался, что Безос долетит до Марса раньше Маска...

#aws

2.45K views15:15

В Docker Enterprise Edition и Docker для Mac и Windows добавили нативно Kubernetes. В том смысле, что вам уже не потребуется minikube

Пока что в закрытой бете, попросить доступ можно тут:

https://beta.docker.com

Но судя по реакции людей, они пока не особо доступ раздают.

#docker #kubernetes

894 views07:45

https://twitter.com/jpetazzo/status/941064854806376451

Jérôme Petazzoni

I have come here to chew bubble gum and run @kubernetesio on my Mac! And I'm all out of bubble gum. (Register on https://t.co/81RmaV0uRn; if you got the email telling you that you're in, make sure that you're signed in with the Docker ID you used when registering!)

1.14K views07:45

Как-то месяц назад (кстати ровно месяц назад) Turbine Labs написали статью о том, как переехали с Nginx на Envoy. Тогда об этом все очень много писали.

Ну и народ такой: ну Ок, какая-то контора переехала на новый модный прокси. Однако, если вам интересно копнуть, что ж такое этот зверь — Envoy, вот тут неплохой дилннопост на Medium:

https://medium.com/@copyconstruct/envoy-953c340c2dca

Оригинальная статья TurbineLabs:
https://blog.turbinelabs.io/our-move-to-envoy-bfeb08aa822d

It was November 1st, 2016. I’d spent the better part of the day at a training on Go + Distributed Computing. O’Reilly had offered me a free…

1.14K views17:00

Pinterest рассказывает, как и зачем они используют монорепу для своего Python кода. В принципе, мотивация такая же как у других людей, использующих монорепы, но тут присутствуют специфические примеры для Python. Так что, если у вас проект на нём, может быть интересно

Building a Python monorepo for fast, reliable development

Suman Karumuri | Pinterest technical lead, Visibility & Ruth Grace Wong | Pinterest engineer, Core Site Reliability

1.22K views10:23

1.15K views18:08

https://twitter.com/grafana/status/941704982604271616

Super Duper Exciting News! Grafana v5.0 feature branch has been merged to master and is available in nightly builds featuring new Grid Layout Engine, Dashboard Folders and Foundational UX improvements. Here is a demo video https://t.co/nHm7lVP8RD

915 views08:41

Кроме новостей от Grafana, есть новости и у Kubernetes:

Вышла версия 1.9

Из нового:

- Workloads API
- Поддержка Windows контейнеров (beta)
- И другие фичи и улучшения

Чейнджлог (чёт пока не поставили релизу статус current)

https://github.com/kubernetes/kubernetes/blob/master/CHANGELOG-1.9.md

#kubernetes

blog.kubernetes.io

Kubernetes 1.9: Apps Workloads GA and Expanded Ecosystem

The official Kubernetes blog.

1.08K views10:23

Forwarded from DevOps Deflope News

Стали доступны видео с KubeCon + CloudNativeCon 2017.

https://www.youtube.com/watch?v=Z3aBWkNXnhw&list=PLj6h78yzYM2P-3-xqvmWaZbbI1sW-ulZb

Keynote: A Community of Builders: CloudNativeCon Opening Keynote - Dan Kohn

Keynote: A Community of Builders: CloudNativeCon Opening Keynote - Dan Kohn, Executive Director, Cloud Native Computing Foundation

About Dan Kohn
Dan is Executive Director of the Cloud Native Computing Foundation, which sustains and integrates open source…

6 views10:18

"Проснувшись однажды утром после беспокойного сна, Грегор Замза обнаружил, что он у себя в постели превратился в страшное насекомое".

Предлагаю вам хорошую обзорную статью по Кафке (Apache, а не Францу):

https://hackernoon.com/thorough-introduction-to-apache-kafka-6fbf2989bbc1

#kafka

Thorough Introduction to Apache Kafka™

Kafka is a word that gets heard a lot nowadays… A lot of leading digital companies seem to use it as well. But what is it actually?

1.08K views10:02

Из интересного за сегодня. Узнал, что Catops по-шведски — это род жуков или более умно — жесткокрылых. Я не знаю, зачем мне это знание, но оно довольно иронично.

Ссылка на википедию (на шведском):

https://sv.wikipedia.org/wiki/Catops

Catops är ett släkte av skalbaggar som beskrevs av Gustaf von Paykull 1798. Catops ingår i familjen mycelbaggar.

939 views09:23

Ну а вернувшись к нашей тематике.

Сегодня очень уютное утро и очень не хочется разгребать какие-то глобальные вопросы. Так что ловите заметку-туториал о том, как построить Jenkins pipeline, который будет собирать и пушить Docker-имейдж по коммиту

https://liatrio.com/building-docker-jenkins-pipelines/

#jenkins #cicd

1.08K views09:26