DevOps Labdon

🔵 عنوان مقاله
kvaps/kubectl-node-shell

🟢 خلاصه مقاله:
این ابزار یک افزونه سبک برای kubectl است که بدون نیاز به SSH، یک شِل روت روی نودهای Kubernetes باز می‌کند. افزونه توسط kvaps ارائه شده و با ساخت یک پاد موقتِ privileged روی نود هدف و استفاده از nsenter وارد فضای نام‌های میزبان می‌شود؛ به این ترتیب شِلی در اختیار دارید که مانند ورود مستقیم به نود عمل می‌کند و پس از خروج، پاد به‌طور خودکار پاک می‌شود.

این رویکرد برای عیب‌یابی سریع در محیط‌های ابری یا شبکه‌های محدود بسیار مفید است: بررسی لاگ‌ها و دایرکتوری‌های نود، وضعیت kubelet، قوانین شبکه و iptables، و داده‌های زمان‌اجرای کانتینرها مانند Docker، containerd یا CRI-O با ابزارهای آشنای Linux.

پیش‌نیازها و ملاحظات امنیتی را در نظر داشته باشید: معمولاً به دسترسی سطح cluster-admin برای ساخت پادهای privileged و ورود به namespaceهای میزبان نیاز است. این ابزار جایگزین سیاست‌های دسترسی و مدیریت امن نودها نیست و برای نودهای Linux طراحی شده است (Windows پشتیبانی نمی‌شود). نصب از طریق kubectl krew یا روش‌های موجود در مخزن انجام می‌شود و اجرای معمول به شکل kubectl node-shell <node-name> است.

#Kubernetes #kubectl #DevOps #SRE #Debugging #Security #Containers #Linux

🟣لینک مقاله:
https://ku.bz/ZXkDtpn5g

➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon

GitHub

GitHub - kvaps/kubectl-node-shell: Exec into node via kubectl

Exec into node via kubectl. Contribute to kvaps/kubectl-node-shell development by creating an account on GitHub.

73 views11:30

DevOps Labdon

🔵 عنوان مقاله
Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

🟢 خلاصه مقاله:
** این مقاله روایت مهاجرت زیرساخت جست‌وجوی Pinterest به Kubernetes است و چگونگی برخورد تیم با یک خطای بسیار نادر را شرح می‌دهد؛ خطایی که در محیط‌های آزمایشی دیده نمی‌شد اما در بار واقعی تولید، به‌صورت افزایش‌های مقطعی در تاخیر و تایم‌اوت‌های پراکنده بروز می‌کرد. تیم با تقویت مشاهده‌پذیری، هم‌بند کردن لاگ‌ها، متریک‌ها و تریس‌ها، و اجرای آزمایش‌های کنترل‌شده و تدریجی روی پیکربندی‌ها، مسئله را مانند یک معمای سیستم‌های توزیع‌شده واکاوی کرد. نتیجه نشان داد مشکل ناشی از برهم‌کنش چند عامل بود: زمان‌بندی ارکستریشن، محدودیت‌های منابع، و سیاست‌های retry/timeout که در شرایط خاص همدیگر را تقویت می‌کردند. راه‌حل شامل مجموعه‌ای از بهبودهای کوچک اما مکمل بود—از تنظیم دقیق درخواست/سقف منابع و آماده‌سازی سرویس تا هموار کردن رفتار autoscaling، بهینه‌سازی زمان‌بندی readiness، و مقاوم‌سازی سیاست‌های backoff و فشار معکوس. درس‌های کلیدی نیز بر مهاجرت‌های مبتنی بر SLO، آینه‌سازی ترافیک تولید، آزمایش خرابی متمرکز بر رخدادهای Kubernetes، و اتوماسیون علائم هشداردهنده برای تشدیدهای نادر تاکید دارند. در نهایت، مهاجرت مزایای مقیاس‌پذیری و یکنواختی استقرار را به‌همراه داشت و نشان داد که در مقیاس بزرگ، رخدادهای «یک در میلیون» باید به‌طور نظام‌مند دیده، سنجیده و مهار شوند.

#Kubernetes #Pinterest #SearchInfrastructure #DistributedSystems #Debugging #ReliabilityEngineering #Migration #ProductionIncidents

🟣لینک مقاله:
https://ku.bz/BS18f9fpM

➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon

Medium

Debugging the One-in-a-Million Failure: Migrating Pinterest’s Search Infrastructure to Kubernetes

Samson Hu, Shashank Tavildar, Eric Kalkanger, Hunter Gatewood

39 views08:30

About

Blog

Apps

Platform