The path to production: how and where to segregate test environments
Отличный пост в блоге CircleCI про то, как можно разделять свои тестовые среды
https://circleci.com/blog/path-to-production-how-and-where-to-segregate-test-environments
Отличный пост в блоге CircleCI про то, как можно разделять свои тестовые среды
https://circleci.com/blog/path-to-production-how-and-where-to-segregate-test-environments
Chick-Fil-A: Milking the Most out of 1000's of K8s Clusters
Интересная презентация от Chick-Fill-A - это те самые ребята, которые в каждый свой фастфуд ресторан (специализируются на сендвичах с курицей) запихали небольшой Kubernetes кластер на Intel NUC.
https://youtu.be/8edDcy3oeUo
Еще по теме:
https://medium.com/@cfatechblog/edge-computing-at-chick-fil-a-7d67242675e2
https://medium.com/@cfatechblog/bare-metal-k8s-clustering-at-chick-fil-a-scale-7b0607bd3541
Интересная презентация от Chick-Fill-A - это те самые ребята, которые в каждый свой фастфуд ресторан (специализируются на сендвичах с курицей) запихали небольшой Kubernetes кластер на Intel NUC.
https://youtu.be/8edDcy3oeUo
Еще по теме:
https://medium.com/@cfatechblog/edge-computing-at-chick-fil-a-7d67242675e2
https://medium.com/@cfatechblog/bare-metal-k8s-clustering-at-chick-fil-a-scale-7b0607bd3541
Краткое описание как работает RabbitMQ и его ключевые метрики, которые стоит замониторить.
Part 1: Key metrics for RabbitMQ monitoring
https://www.datadoghq.com/blog/rabbitmq-monitoring
Part 2: Collecting metrics with RabbitMQ monitoring tools
https://www.datadoghq.com/blog/rabbitmq-monitoring-tools
Part 3: Monitoring RabbitMQ performance with Datadog
https://www.datadoghq.com/blog/monitoring-rabbitmq-performance-with-datadog
Part 1: Key metrics for RabbitMQ monitoring
https://www.datadoghq.com/blog/rabbitmq-monitoring
Part 2: Collecting metrics with RabbitMQ monitoring tools
https://www.datadoghq.com/blog/rabbitmq-monitoring-tools
Part 3: Monitoring RabbitMQ performance with Datadog
https://www.datadoghq.com/blog/monitoring-rabbitmq-performance-with-datadog
15 Useful Helm Charts Tools
15 полезных утилит для работы с Helm.
https://caylent.com/15-useful-helm-charts-tools
15 полезных утилит для работы с Helm.
https://caylent.com/15-useful-helm-charts-tools
Terraform CLI Cheat Sheet
Шпаргалка по работе с cli терраформа
https://dzone.com/articles/terraform-cli-cheat-sheet
Шпаргалка по работе с cli терраформа
https://dzone.com/articles/terraform-cli-cheat-sheet
Linux ip Command Examples
Полезные примеры использования команды
https://www.cyberciti.biz/faq/linux-ip-command-examples-usage-syntax
Полезные примеры использования команды
ip
https://www.cyberciti.biz/faq/linux-ip-command-examples-usage-syntax
Интересная альтернатива всем известного gitflow - trunk based development.
Сайт по теме:
https://trunkbaseddevelopment.com
Краткое описание:
https://www.toptal.com/software/trunk-based-development-git-flow
Сайт по теме:
https://trunkbaseddevelopment.com
Краткое описание:
https://www.toptal.com/software/trunk-based-development-git-flow
Why SRE Documents Matter
Отличная статья про документы, которые необходимы для работы SRE команды.
https://cacm.acm.org/magazines/2018/12/232897-why-sre-documents-matter/fulltext
Отличная статья про документы, которые необходимы для работы SRE команды.
https://cacm.acm.org/magazines/2018/12/232897-why-sre-documents-matter/fulltext
Site Reliability Engineering: Measuring and Managing Reliability
Интересный курс на курсере про основы SRE
https://www.coursera.org/learn/site-reliability-engineering-slos
Интересный курс на курсере про основы SRE
https://www.coursera.org/learn/site-reliability-engineering-slos
Courier: Dropbox migration to gRPC
Как Dropbox применяет gRPC
https://blogs.dropbox.com/tech/2019/01/courier-dropbox-migration-to-grpc
Как Dropbox применяет gRPC
https://blogs.dropbox.com/tech/2019/01/courier-dropbox-migration-to-grpc
SQL is No Excuse to Avoid DevOps
Звучит дико, но некоторые команды до сих пор не используют миграции схемы бд из кода. Отличная статья на эту тему от Томаса Лимочелли.
https://queue.acm.org/detail.cfm?id=3300018
Звучит дико, но некоторые команды до сих пор не используют миграции схемы бд из кода. Отличная статья на эту тему от Томаса Лимочелли.
https://queue.acm.org/detail.cfm?id=3300018
Stack Overflow: How We Do Monitoring - 2018 Edition
Как устроен мониторинг в StackOverflow.
https://nickcraver.com/blog/2018/11/29/stack-overflow-how-we-do-monitoring
Как устроен мониторинг в StackOverflow.
https://nickcraver.com/blog/2018/11/29/stack-overflow-how-we-do-monitoring
Designing resilient systems: Circuit Breakers or Retries?
Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.
https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Серия из 2х постов про важные концепции для построения распределенных отказоустойчивых систем - circuit breakers и retries.
https://engineering.grab.com/designing-resilient-systems-part-1
https://engineering.grab.com/designing-resilient-systems-part-2
Какие метрики и как стоит замониторить в Redis.
How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics
How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics
Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
How to monitor Redis performance metrics:
https://www.datadoghq.com/blog/how-to-monitor-redis-performance-metrics
How to collect Redis metrics:
https://www.datadoghq.com/blog/how-to-collect-redis-metrics
Monitor Redis using Datadog:
https://www.datadoghq.com/blog/monitor-redis-using-datadog
Какие метрики и как стоит замониторить в Nginx.
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
How to monitor NGINX:
https://www.datadoghq.com/blog/how-to-monitor-nginx
How to collect NGINX metrics:
https://www.datadoghq.com/blog/how-to-collect-nginx-metrics
How to monitor NGINX with Datadog:
https://www.datadoghq.com/blog/how-to-monitor-nginx-with-datadog
Automating Datacenter Operations at Dropbox
Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.
https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
Отличный пост в техническом блоге Dropbox про то, как они делают провижен свичей и серверов в своих ДЦ.
https://blogs.dropbox.com/tech/2019/01/automating-datacenter-operations-at-dropbox
PagerDuty Incident Response
PagerDuty выложили в открытый доступ свою внутреннюю документацию по работе с инцидентами.
https://response.pagerduty.com
PagerDuty выложили в открытый доступ свою внутреннюю документацию по работе с инцидентами.
https://response.pagerduty.com
nginx mirroring tips and tricks
Пост в блоге Александра Дзьоба про новую фичу в nginx - mirror module
https://alex.dzyoba.com/blog/nginx-mirror
Пост в блоге Александра Дзьоба про новую фичу в nginx - mirror module
https://alex.dzyoba.com/blog/nginx-mirror
DevOps&SRE Library
Go это отличный язык для автоматизации, на который следует обратить внимание DevOps специалистам и SRE. Since February 2015, the SRE (site reliability engineering) team at Stack Overflow has switched from a mixture of Python and Bash to Go. Even though Go…
В продолжении темы Go для DevOps/SRE специалистов 2 интересных поста в блоге GopherSRE про свитчинг с питона на голанг.
Why I moved from Python to Go (Part I):
https://www.gophersre.com/2017/08/05/why-i-moved-from-python-to-go-part-i
Why I moved from Python to Go(Part II):
https://www.gophersre.com/2017/08/10/why-i-moved-from-python-to-go-part-ii
Why I moved from Python to Go (Part I):
https://www.gophersre.com/2017/08/05/why-i-moved-from-python-to-go-part-i
Why I moved from Python to Go(Part II):
https://www.gophersre.com/2017/08/10/why-i-moved-from-python-to-go-part-ii
Попытался немного консолидировать список полезных материалов для подготовки к интервью на позицию SRE. Список сделал на основе своего небольшого опыта прохождения интервью на такую позицию в разные компании (GitLab, Google, Revolut, etc).
Очень приветствуется обратная связь. Пишите в личку свои замечания и предложения - @mxssl, ставьте звездочки на гитхабе если список показался вам полезным.
https://github.com/mxssl/sre-interview-prep-guide
Очень приветствуется обратная связь. Пишите в личку свои замечания и предложения - @mxssl, ставьте звездочки на гитхабе если список показался вам полезным.
https://github.com/mxssl/sre-interview-prep-guide