Подробное описание недавно обнаруженной (и исправленной) уязвимости в AWS RDS. Общий момент здесь, о расширениях и компромиссе между площадью поверхности и безопасностью, интересен и в более общем плане.
https://proglib.io/w/d0f6a484
https://proglib.io/w/d0f6a484
Хорошо написанные отчеты об инцидентах всегда интересны. Этот бродит по Kubernetes, gRPC, сетям AWS и (конечно) DNS.
https://proglib.io/w/8084d9aa
https://proglib.io/w/8084d9aa
Datadog
It's always DNS . . . except when it's not: A deep dive through gRPC, Kubernetes, and AWS networking | Datadog
The story of a seemingly simple issue that led us into the hidden complexities of gRPC, DNS, and Kubernetes.
👍1
Пошаговое руководство по настройке конвейера Terraform. Наиболее интересно использовать OpenID Connect для устранения необходимости в постоянных учетных данных для AWS.
https://blog.symops.com/2022/04/14/terraform-pipeline-with-github-actions-and-github-oidc-for-aws/
https://blog.symops.com/2022/04/14/terraform-pipeline-with-github-actions-and-github-oidc-for-aws/
Symops
Set up a Terraform Pipeline with GitHub Actions and GitHub OIDC for AWS - Sym Blog
Learn how to quickly bootstrap an S3-backed Terraform pipeline with a few GitHub Actions.
👍4
10 лучших практик для DevOps, которые повысят вашу продуктивность.
https://dev.to/nehachaudhary29/10-best-practices-for-devops-that-will-improve-your-productivity-53fj
https://dev.to/nehachaudhary29/10-best-practices-for-devops-that-will-improve-your-productivity-53fj
DEV Community
10 Best Practices for DevOps That Will Improve Your Productivity
The world of DevOps is ever-changing, and if you want to stay on top of the latest practices and...
Автор делится опытом перехода от профессии системного администратора к инженеру DevOps.
https://proglib.io/w/f78aecd7
https://proglib.io/w/f78aecd7
Opensource.com
The case for making the transition from sysadmin to DevOps engineer
There's a learning curve, but there's no time like the present to get started.
При администрировании любого программного обеспечения полезно иметь интерактивный инструмент, помогающий понять, что происходит. Nats-top (что неудивительно) является лучшим для Nats, и этот пост показывает, почему он полезен для мониторинга в реальном времени.
https://proglib.io/w/cde17b8e
https://proglib.io/w/cde17b8e
DEV Community
Real-time monitoring with nats-top
In this article, we will take a quick look at nats-top and see how we can use it for monitoring ...
Нужно инструментировать приложение JVM? В этом посте рассказывается, как добавить наблюдаемость в широкий спектр различных языков и фреймворков.
https://openvalue.blog/posts/2022/03/17/observability_4_jvm_frameworks_with_grafana_java_kotlin/
https://openvalue.blog/posts/2022/03/17/observability_4_jvm_frameworks_with_grafana_java_kotlin/
Еще один пост из этой интересной серии, посвященный надежности систем и тому, чему мы можем научиться у космических технологий.
https://flyingbarron.medium.com/gyros-and-gimbals-oh-my-the-james-webb-space-telescope-9741480266a
https://flyingbarron.medium.com/gyros-and-gimbals-oh-my-the-james-webb-space-telescope-9741480266a
Medium
Gyros and Gimbals, oh my! — The James Webb Space Telescope
Success through Reliability — Webb Lesson 3
👍1
Наблюдаемость имеет решающее значение для масштабирования все больших и больших систем, которые мы создаем, и специализированные команды все чаще встречаются в крупных компаниях. В этом посте рассказывается, каковы роли в этих специализированных командах.
https://proglib.io/w/2628d058
https://proglib.io/w/2628d058
A Small, Good Thing
Notes on an Observability Team
or, What Would You Say...You Do Here?
Обсуждение управления разрастанием панели мониторинга с помощью GitOps.
https://medium.com/riskified-technology/consistent-monitoring-the-gitops-way-1d481e9965c9
https://medium.com/riskified-technology/consistent-monitoring-the-gitops-way-1d481e9965c9
Medium
The GitOps Way for Consistent Monitoring
Improve monitoring consistency by shifting your Grafana dashboards Into Git
Хороший подробный пост о развивающихся средах разработки, от локальных настроек с Vagrant, затем Docker, затем Kubernetes до создания удаленной среды разработки поверх Kubernetes.
https://medium.com/pipedrive-engineering/say-hello-to-devboxes-fab125cd793a
https://medium.com/pipedrive-engineering/say-hello-to-devboxes-fab125cd793a
Medium
Meet Pipedrive’s devboxes
Read about Pipedrive’s next-generation development platform for microservices in Kubernetes, aka devboxes.
Fleet — это новый инструмент сборки Rust. Прекрасная интеграция нескольких инструментов экосистемы для повышения производительности до 5 раз.
https://proglib.io/w/a8aea6c6
https://proglib.io/w/a8aea6c6
GitHub
GitHub - dimensionhq/fleet: 🚀 The blazing fast build tool for Rust.
🚀 The blazing fast build tool for Rust. Contribute to dimensionhq/fleet development by creating an account on GitHub.
Описанный как «nmap, но для pid», xpid — это удобный инструмент системного администрирования, который может быть полезен для поиска скрытых pid и наблюдения за операциями eBPF.
https://proglib.io/w/f571e194
https://proglib.io/w/f571e194
DEV Community
Hunting hidden PIDs, eBPF and much more using xpid
Today while browsing Twitter I came across a tool which I found pretty amazing and as a system...
Взгляд на мониторинг Kafka, посвященный важности отслеживания потребительского отставания.
https://proglib.io/w/c18b9232
https://proglib.io/w/c18b9232
Sematext
Kafka Consumer Lag: How to Monitor, Check & Reduce - Sematext
Learn how to check, reduce and monitor Kafka Consumer Lag. Complete tutorial on how to calculate and avoid it to ensure cluster performance.
В тот раз мы отключили центр обработки данных, чтобы проверить нашу готовность к стихийным бедствиям.
https://dropbox.tech/infrastructure/disaster-readiness-test-failover-blackhole-sjc
https://dropbox.tech/infrastructure/disaster-readiness-test-failover-blackhole-sjc
dropbox.tech
That time we unplugged a data center to test our disaster readiness
В прошлом месяце в Atlassian произошел крупный глобальный сбой. В этом подробном отчете содержится множество интересных оперативных подробностей о событии и об извлеченных уроках.
https://www.atlassian.com/engineering/post-incident-review-april-2022-outage
https://www.atlassian.com/engineering/post-incident-review-april-2022-outage
Work Life by Atlassian
Post-Incident Review on the Atlassian April 2022 outage - Work Life by Atlassian
This PIR is available in the following languages:日本語 Letter from our co-founders & co-CEOs We want to acknowledge the outage...
👍1
Использование тестирования внедрения ошибок для повышения надежности DoorDash.
https://proglib.io/w/68e5f230
https://proglib.io/w/68e5f230
DoorDash Engineering Blog
Using Fault Injection Testing to Improve DoorDash Reliability
When failure is inevitable, building fault tolerance with fault injection testing ensures that failures do not bring the platform down with them
👍2