AWS Notes
5.59K subscribers
452 photos
42 videos
10 files
2.81K links
AWS Notes — Amazon Web Services Educational and Information Channel

Chat: https://t.iss.one/aws_notes_chat

Contacts: @apple_rom, https://www.linkedin.com/in/roman-siewko/
Download Telegram
AWS Health Dashboard — CrowdStrike Falcon Agent Issue

Starting at 9:30 PM PDT on July 18th 2024 some Windows Instances, Windows WorkSpaces and Appstream 2.0 Applications experienced connectivity issues and reboots due to a recent update of the CrowdStrike Falcon agent (csagent.sys). This update caused a stop error (BSOD) within the Windows operating system. Windows instances and WorkSpaces that do not use CrowdStrike, were not affected by this issue. AWS services and network connectivity were also not affected by this event and continued to operate normally.

While the issue was triggered by the CrowdStrike Falcon agent update within the Windows guest operating system, AWS has taken steps to mitigate the issue for as many Windows instances, Windows WorkSpaces and Appstream 2.0 Applications as possible. For the remaining Windows instances and Windows WorkSpaces that are still affected by this issue, customers need to take action to restore connectivity. Customers using Amazon Appstream 2.0 Applications will no longer see the impact.

For EC2 instances, there are currently three paths to recovery.

First, in some cases, a reboot of the instance may allow for the CrowdStrike Falcon agent to be updated to a previously healthy version, resolving the issue. However, this is not successful in all cases, in which case an alternative recovery strategy will be needed.

Second, the following steps can be followed to delete the CrowdStrike Falcon agent file on the affected instance:

(Latest revision: July 19, 7:01 AM PDT)
1. Create a snapshot of the EBS root volume of the affected instance
2. Create a new EBS volume from the snapshot in the same Availability Zone
3. Launch a new instance in that Availability Zone using a different version of Windows
4. Attach the EBS volume from step (2) to the new instance as a data volume
5. Navigate to the \windows\system32\drivers\CrowdStrike\ folder on the attached volume and delete "C-00000291*.sys"
6. Detach the EBS volume from the new instance
7. Create a snapshot of the detached EBS volume
8. Create an AMI from the snapshot by selecting the same volume type as the affected instance
9. Call replace root volume on the original EC2 Instance specifying the AMI just created

Finally, customers can relaunch the EC2 instance from a snapshot or image taken before 9:30 PM PDT. We have been able to confirm that the update that caused the CrowdStrike Falcon agent issue is no longer being automatically updated, so the relaunched instance will no longer be affected by the issue.

For Amazon WorkSpaces, we recommend a reboot of the affected WorkSpaces. As with EC2, this may recover the instance but it does not work in all cases. Alternatively, we would recommend restoring to a recent backup of the workspace.

If you need assistance with any of these actions please contact AWS Support via the AWS Support Center.
Кто сам не ронял прод в результате апдейта
Пусть первый в меня кинет бэкапом.
😁29👍11
Старожилы не припомнят.
😁31💯7
Простите, кто последний в очереди предложений переписать Windows на Rust? Никто?
Тогда просьба за мной не занимать!

https://x.com/Perpetualmaniac/status/1814376668095754753
7🔥4👍1
Forwarded from AWS Weekly (Max Skutin)
☑️ Issue #133 | 21 July 2024

▪️  Application Migration Service FedRAMP High authorization
▪️  Artifact enhanced search capability for reports
▪️  Cloud Control API IPv6
▪️  CloudWatch Logs Infrequent Access log class available in GovCloud Regions
▪️  Connect
       ▫️ search API for agent status
       ▫️ search API for hierarchy groups
▪️  Control Tower customization frameworks are available in opt-in regions
▪️  Elemental MediaConnect individual output stopping capability
▪️  HealthImaging DICOMweb retrievals
▪️  IAM Identity Center independent 90-days session duration for CodeWhisperer
▪️  Lambda SnapStart for ARM64 Java functions
▪️  Marketplace Catalog API (CAPI) Integration with Strongly-Typed API Schemas
▪️  OpenSearch Serverless smart caching
▪️  Private CA ARM architecture in Kubernetes
▪️  QuickSight improves controls performance
▪️  RDS Aurora new open-source Advanced MYSQL ODBC Driver
▪️  RDS for MariaDB LTS version 11.4
▪️  RDS for SQL Server password policies for SQL Server logins
▪️  SageMaker Canvas Productionize Fine-tuned Foundation Models
Please open Telegram to view this post
VIEW IN TELEGRAM
🤪1
​​S3 как container registry вместо ECR — в 5-8 раз быстрее и в 4 раза дешевле!

https://ochagavia.nl/blog/using-s3-as-a-container-registry/

#S3 #ECR
🤔44👍8🤪2
Лидер в области безопасности Wiz отклонил предложение продаться Google и идёт на IPO.

https://www.theverge.com/2024/7/23/24204198/google-wiz-acquisition-called-off-23-billion-cloud-cybersecurity

Очень хорошо, таким гигантам для столь чувствительной ниши правильно оставаться независимыми.
👍9👏1
​​🆕 RDS with DLV (Dedicated Log Volumes) for PostgreSQL, MySQL, and MariaDB:

https://aws.amazon.com/blogs/database/enhance-database-performance-with-amazon-rds-dedicated-log-volumes/

RDS with DLV use cases:

• Large allocated storage (over 5 TiB)
• High IOPS requirements
• Transaction-intensive workloads
• Latency-sensitive workloads
• Using io1 or io2 Provisioned IOPS storage

⚠️ Enabling DLV requires database downtime, but this can be reduced by enabling DLV on a new or existing read replica and then promoting it as the primary.

#RDS
🤔3👍1
А девопса из CrowdStrike таки уволили, ищут нового: 😁

https://crowdstrike.wd5.myworkdayjobs.com/en-US/crowdstrikecareers/job/Principal-Cloud-Software-Engineer-DevOps-Engineer--Remote-_R19529

P.S. Спешите зааплаиться — $135,000 - $225,000 per year + variable/incentive compensation + equity + benefits.
😁25🏆4
😁38🤡10🤩4🔥3👌2💩1
CrowdStrike Postmortem

https://www.crowdstrike.com/falcon-content-update-remediation-and-guidance-hub/

What Happened?

On Friday, July 19, 2024 at 04:09 UTC, as part of regular operations, CrowdStrike released a content configuration update for the Windows sensor to gather telemetry on possible novel threat techniques.

TL;DR

linter
auto tests
canary deployment
rollback

#postmortem
👍11🙈6😭31
⚡️ Mistral Large 2 is here.
Mistral Large 2 is already available on AWS! 💪

#Bedrock
🥱3👍1
Задачи по Backup & Disaster Recovery легче приоретизируются после (не)большой потери данных.
😁46💯6👏1😢1😈1
— Простите, у нас дресс-код.
— Я сисадмин.
— Проходите!

#пятничное
19😁15💯3
Плохо, когда люди на проекте занимаются документацией в основном лишь перед уходом, выполняя таски с предательским названием типа knowledge sharing.

Ещё хуже, когда про документацию вспоминают, когда с проекта ключевые люди уже ушли.

Документация — дорогой для команды и проекта процесс. В хороших проектах 10-20% может постоянно уходить на документирование. Это осознанные затраты, в реальности окупающиеся, особенно в постковидном мире с асинхронными коммуникациями.

Если не инвестировать в (постоянное) документирование, то эффективность работы команды снижается, онбоардинг растягивается, а взаимодействующие команды в результате компенсируют это умножающимися созвонами. Что раздражает каждую из сторон — и тех, кому нужно объяснять, и тем, кому нужно понимать, как это работает, чтобы пилить фичи или исправлять баги.

Документация — это не результат, документация — это процесс.

#pm
🔥29💯16👍4🤔1🤡1
Отличная подборка вопросов Как казаться умным.

Добавлю свои варианты, которые тоже можно задавать практически на любом митинге.

• Учли ли мы все аспекты безопасности? Нужен ли security audit?
• А если попробовать event-driven архитектуру для этого кейса?
• Мы не слишком увлеклись теорией? Может, пора писать код?
• Как это будет работать с нашей текущей инфраструктурой?
• Вписывается ли это в микросервисную архитектуру?
• Как это отразится на времени загрузки страницы?
• Может это аффектит наш технический долг?
• А как это повлияет на наш CI/CD пайплайн?
• Учли ли мы все возможные эдж-кейсы?
• А что на счёт кросс-платформенности?
• А как мы можем применить здесь AI?
• Учитывает ли это принципы SOLID?
• После обсудим на ретроспективе.

#пятничное
😁26🤡91👎1🐳1
Claude 3.5 Sonnet — лучший AI помощник 2024-07

На текущий момент, после выхода Llama 3.1 405B, для повседневной работы, а также для решения задач по AWS, на первом месте по-прежнему стоит Claude 3.5 Sonnet.

Кто до сих пор не попробовал claude.ai — обязательно стоит это сделать. Другой пользовательский опыт, это не ChatGPT. Очень глубокое понимание контекста. Не без проблем, конечно, но они присущи всем текущим моделям.

Клод — это гениальный джун (0 лет "коммерческого опыта"), радикально много знает, но без практики. В процессе общения, в течении сессии, мгновенно учится, делает исправления и выводы. Развивает предположения, предупреждает о проблемах, чего обычно не делают остальные модели.

К сожалению, если вы по любой причине предоставите плохие входящие данные, то может придумать ответ, который вас устроит, а не реальный (хотя случается такое не так часто). Пока напрямую не имеет возможности искать в интернете, но с помощью других сервисов, типа perplexity.ai или myninja.ai, запросто это делает.

Кодит и объясняет код лучше других, быстрее и больше помнит в сессии, (не считая Google, который в этом круче всех на порядок). Короче, если собрать все факторы, то получится, с отрывом от других, лучший AI помощник.

Субъективно это не количественное, но качественное отличие Клода. Разобраться с ним в реально сложных проблемах по AWS для меня стало впервые реально. Другие на каком-то этапе начинают тупить, повторяя одно и то же в разных вариантах.

Итого. Claude 3.5 Sonnet — лучший для желающих научиться. Лучший для новичков в AWS. Лучший для профи. Рекомендую.

#ai
👍221