🔵 عنوان مقاله
Troubleshooting packet drops in a Kubernetes-based observability platform
🟢 خلاصه مقاله:
** این مطالعهٔ موردی نشان میدهد تیم SRE در Kapital Bank چگونه افتهای گهگاهی کارایی در یک پلتفرم observability مبتنی بر Kubernetes را که به Memcached متکی بود ریشهیابی کرد. آنها با همبستهسازی سیگنالها در سطح Kubernetes و شواهد کرنل لینوکس، مشکل را به دراپ بستهها در مسیر شبکهٔ کرنل تحت الگوهای بار خاص محدود کردند. جمعبندی این بود که برخی مقادیر پیشفرض کرنل برای الگوهای اتصال پرتراکم و پرتلاطم در محیطهای کانتینری مناسب نیست و باعث فشار روی صفها و بافرهای شبکه میشود. با تنظیم دقیق پارامترهای کرنل و اعتبارسنجی تدریجی تغییرات روی نودهای میزبان Memcached، نرخ دراپ بستهها کاهش یافت و پایداری و پیشبینیپذیری کارایی بهبود پیدا کرد. نتیجهٔ عملی: به مسائل کارایی بهصورت میانلایهای نگاه کنید، قبل و بعد از تغییرات اندازهگیری کنید، و تنظیمات ایمن کرنل را در رانبوکها مستند سازید.
#Kubernetes #SRE #Observability #Memcached #LinuxKernel #Networking #DevOps #PerformanceTuning
🟣لینک مقاله:
https://ku.bz/spNnnpsM-
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Troubleshooting packet drops in a Kubernetes-based observability platform
🟢 خلاصه مقاله:
** این مطالعهٔ موردی نشان میدهد تیم SRE در Kapital Bank چگونه افتهای گهگاهی کارایی در یک پلتفرم observability مبتنی بر Kubernetes را که به Memcached متکی بود ریشهیابی کرد. آنها با همبستهسازی سیگنالها در سطح Kubernetes و شواهد کرنل لینوکس، مشکل را به دراپ بستهها در مسیر شبکهٔ کرنل تحت الگوهای بار خاص محدود کردند. جمعبندی این بود که برخی مقادیر پیشفرض کرنل برای الگوهای اتصال پرتراکم و پرتلاطم در محیطهای کانتینری مناسب نیست و باعث فشار روی صفها و بافرهای شبکه میشود. با تنظیم دقیق پارامترهای کرنل و اعتبارسنجی تدریجی تغییرات روی نودهای میزبان Memcached، نرخ دراپ بستهها کاهش یافت و پایداری و پیشبینیپذیری کارایی بهبود پیدا کرد. نتیجهٔ عملی: به مسائل کارایی بهصورت میانلایهای نگاه کنید، قبل و بعد از تغییرات اندازهگیری کنید، و تنظیمات ایمن کرنل را در رانبوکها مستند سازید.
#Kubernetes #SRE #Observability #Memcached #LinuxKernel #Networking #DevOps #PerformanceTuning
🟣لینک مقاله:
https://ku.bz/spNnnpsM-
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Medium
Troubleshooting Packet Drops in a Kubernetes Cluster
One of the core responsibilities of our SRE team is maintaining a robust observability platform. Our platform is built using open-source…