Библиотека девопса | DevOps, SRE, Sysadmin

Подробное описание недавно обнаруженной (и исправленной) уязвимости в AWS RDS. Общий момент здесь, о расширениях и компромиссе между площадью поверхности и безопасностью, интересен и в более общем плане.

https://proglib.io/w/d0f6a484

1.65K views18:40

Хорошо написанные отчеты об инцидентах всегда интересны. Этот бродит по Kubernetes, gRPC, сетям AWS и (конечно) DNS.

https://proglib.io/w/8084d9aa

Datadog

It's always DNS . . . except when it's not: A deep dive through gRPC, Kubernetes, and AWS networking | Datadog

The story of a seemingly simple issue that led us into the hidden complexities of gRPC, DNS, and Kubernetes.

👍1

1.64K views18:30

Библиотека девопса | DevOps, SRE, Sysadmin

Пошаговое руководство по настройке конвейера Terraform. Наиболее интересно использовать OpenID Connect для устранения необходимости в постоянных учетных данных для AWS.

https://blog.symops.com/2022/04/14/terraform-pipeline-with-github-actions-and-github-oidc-for-aws/

Symops

Set up a Terraform Pipeline with GitHub Actions and GitHub OIDC for AWS - Sym Blog

Learn how to quickly bootstrap an S3-backed Terraform pipeline with a few GitHub Actions.

👍4

1.72K views19:16

Библиотека девопса | DevOps, SRE, Sysadmin

10 лучших практик для DevOps, которые повысят вашу продуктивность.

https://dev.to/nehachaudhary29/10-best-practices-for-devops-that-will-improve-your-productivity-53fj

DEV Community

10 Best Practices for DevOps That Will Improve Your Productivity

The world of DevOps is ever-changing, and if you want to stay on top of the latest practices and...

1.79K views19:11

Библиотека девопса | DevOps, SRE, Sysadmin

Автор делится опытом перехода от профессии системного администратора к инженеру DevOps.

https://proglib.io/w/f78aecd7

Opensource.com

The case for making the transition from sysadmin to DevOps engineer

There's a learning curve, but there's no time like the present to get started.

1.6K views14:54

Библиотека девопса | DevOps, SRE, Sysadmin

5 основных ценностей в мышлении DevOps.

https://proglib.io/w/086de65a

Opensource

5 essential values for the DevOps mindset

People and process take more time but are more important than any technology "silver bullet" in solving business problems.

1.44K views19:48

Библиотека девопса | DevOps, SRE, Sysadmin

При администрировании любого программного обеспечения полезно иметь интерактивный инструмент, помогающий понять, что происходит. Nats-top (что неудивительно) является лучшим для Nats, и этот пост показывает, почему он полезен для мониторинга в реальном времени.

https://proglib.io/w/cde17b8e

DEV Community

Real-time monitoring with nats-top

In this article, we will take a quick look at nats-top and see how we can use it for monitoring ...

1.91K views18:18

Библиотека девопса | DevOps, SRE, Sysadmin

Нужно инструментировать приложение JVM? В этом посте рассказывается, как добавить наблюдаемость в широкий спектр различных языков и фреймворков.

https://openvalue.blog/posts/2022/03/17/observability_4_jvm_frameworks_with_grafana_java_kotlin/

1.59K views18:02

Библиотека девопса | DevOps, SRE, Sysadmin

Еще один пост из этой интересной серии, посвященный надежности систем и тому, чему мы можем научиться у космических технологий.

https://flyingbarron.medium.com/gyros-and-gimbals-oh-my-the-james-webb-space-telescope-9741480266a

Medium

Gyros and Gimbals, oh my! — The James Webb Space Telescope

Success through Reliability — Webb Lesson 3

👍1

1.54K views19:02

Библиотека девопса | DevOps, SRE, Sysadmin

Наблюдаемость имеет решающее значение для масштабирования все больших и больших систем, которые мы создаем, и специализированные команды все чаще встречаются в крупных компаниях. В этом посте рассказывается, каковы роли в этих специализированных командах.

https://proglib.io/w/2628d058

A Small, Good Thing

Notes on an Observability Team

or, What Would You Say...You Do Here?

1.59K views19:09

Библиотека девопса | DevOps, SRE, Sysadmin

Обсуждение управления разрастанием панели мониторинга с помощью GitOps.

https://medium.com/riskified-technology/consistent-monitoring-the-gitops-way-1d481e9965c9

Medium

The GitOps Way for Consistent Monitoring

Improve monitoring consistency by shifting your Grafana dashboards Into Git

1.65K views19:02

Библиотека девопса | DevOps, SRE, Sysadmin

Хороший подробный пост о развивающихся средах разработки, от локальных настроек с Vagrant, затем Docker, затем Kubernetes до создания удаленной среды разработки поверх Kubernetes.

https://medium.com/pipedrive-engineering/say-hello-to-devboxes-fab125cd793a

Medium

Meet Pipedrive’s devboxes

Read about Pipedrive’s next-generation development platform for microservices in Kubernetes, aka devboxes.

1.89K views16:03

Библиотека девопса | DevOps, SRE, Sysadmin

Fleet — это новый инструмент сборки Rust. Прекрасная интеграция нескольких инструментов экосистемы для повышения производительности до 5 раз.

https://proglib.io/w/a8aea6c6

GitHub

GitHub - dimensionhq/fleet: 🚀 The blazing fast build tool for Rust.

🚀 The blazing fast build tool for Rust. Contribute to dimensionhq/fleet development by creating an account on GitHub.

1.86K views17:04

Библиотека девопса | DevOps, SRE, Sysadmin

Описанный как «nmap, но для pid», xpid — это удобный инструмент системного администрирования, который может быть полезен для поиска скрытых pid и наблюдения за операциями eBPF.

https://proglib.io/w/f571e194

DEV Community

Hunting hidden PIDs, eBPF and much more using xpid

Today while browsing Twitter I came across a tool which I found pretty amazing and as a system...

1.92K views18:46

Библиотека девопса | DevOps, SRE, Sysadmin

Взгляд на мониторинг Kafka, посвященный важности отслеживания потребительского отставания.

https://proglib.io/w/c18b9232

Sematext

Kafka Consumer Lag: How to Monitor, Check & Reduce - Sematext

Learn how to check, reduce and monitor Kafka Consumer Lag. Complete tutorial on how to calculate and avoid it to ensure cluster performance.

1.82K views20:40

Библиотека девопса | DevOps, SRE, Sysadmin

В тот раз мы отключили центр обработки данных, чтобы проверить нашу готовность к стихийным бедствиям.

https://dropbox.tech/infrastructure/disaster-readiness-test-failover-blackhole-sjc

dropbox.tech

That time we unplugged a data center to test our disaster readiness

1.6K views19:54

Библиотека девопса | DevOps, SRE, Sysadmin

Кто такой SRE продакт менеджер?

https://www.detech.ai/blog/what-is-an-sre-product-manager

1.63K views19:01

Библиотека девопса | DevOps, SRE, Sysadmin

В прошлом месяце в Atlassian произошел крупный глобальный сбой. В этом подробном отчете содержится множество интересных оперативных подробностей о событии и об извлеченных уроках.

https://www.atlassian.com/engineering/post-incident-review-april-2022-outage

Work Life by Atlassian

Post-Incident Review on the Atlassian April 2022 outage - Work Life by Atlassian

This PIR is available in the following languages:日本語 Letter from our co-founders & co-CEOs We want to acknowledge the outage...

👍1

1.61K views19:29

Библиотека девопса | DevOps, SRE, Sysadmin

Отчет по инциденту в enom.

https://enomstatus.com/incidents/03q064h6rb7x

Enomstatus

Domain and DNS Management

Enom's Status Page - Domain and DNS Management.

1.48K views18:52

Библиотека девопса | DevOps, SRE, Sysadmin