🔵 عنوان مقاله
GPU sharing with MPS and OKE
🟢 خلاصه مقاله:
این آموزش نشان میدهد چگونه با استفاده از NVIDIA MPS در Oracle Kubernetes Engine (OKE) اشتراکگذاری GPU را فعال کنیم تا چندین پردازه CUDA بهطور همزمان از یک GPU بهره ببرند. مراحل اصلی شامل ایجاد یک GPU node pool اختصاصی، سفارشیسازی cloud-init برای فعالسازی و پایدارسازی MPS روی نودها، استقرار NVIDIA device-plugin با Helm و سپس آزمایش دسترسی اشتراکی با اجرای یک بارکاری نمونه در قالب ۱۰ replica است. در پایان با ابزارهایی مانند nvidia-smi میزان همزمانی و بهرهوری بررسی میشود. نکات مهم: نیاز به سازگاری نسخههای CUDA و درایور، نبود ایزولیشن سخت حافظه در MPS، و مقایسه با گزینههایی مثل MIG برای سناریوهای نیازمند ایزولیشن قویتر.
#NVIDIA #MPS #GPUSharing #Kubernetes #OKE #OracleCloud #CUDA #Helm
🟣لینک مقاله:
https://ku.bz/Hd9QMtTXf
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GPU sharing with MPS and OKE
🟢 خلاصه مقاله:
این آموزش نشان میدهد چگونه با استفاده از NVIDIA MPS در Oracle Kubernetes Engine (OKE) اشتراکگذاری GPU را فعال کنیم تا چندین پردازه CUDA بهطور همزمان از یک GPU بهره ببرند. مراحل اصلی شامل ایجاد یک GPU node pool اختصاصی، سفارشیسازی cloud-init برای فعالسازی و پایدارسازی MPS روی نودها، استقرار NVIDIA device-plugin با Helm و سپس آزمایش دسترسی اشتراکی با اجرای یک بارکاری نمونه در قالب ۱۰ replica است. در پایان با ابزارهایی مانند nvidia-smi میزان همزمانی و بهرهوری بررسی میشود. نکات مهم: نیاز به سازگاری نسخههای CUDA و درایور، نبود ایزولیشن سخت حافظه در MPS، و مقایسه با گزینههایی مثل MIG برای سناریوهای نیازمند ایزولیشن قویتر.
#NVIDIA #MPS #GPUSharing #Kubernetes #OKE #OracleCloud #CUDA #Helm
🟣لینک مقاله:
https://ku.bz/Hd9QMtTXf
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Medium
GPU sharing with MPS and OKE
Though I’ve been working with Kubernetes since 2018, only very recently I had the opportunity to learn a bit more about GPU-based worker…
❤1