DevOps Labdon
455 subscribers
24 photos
3 videos
2 files
677 links
👑 DevOps Labdon

حمایت مالی:
https://www.coffeete.ir/mrbardia72

ادمین:
@mrbardia72
Download Telegram
🔵 عنوان مقاله
GPU sharing with MPS and OKE

🟢 خلاصه مقاله:
این آموزش نشان می‌دهد چگونه با استفاده از NVIDIA MPS در Oracle Kubernetes Engine (OKE) اشتراک‌گذاری GPU را فعال کنیم تا چندین پردازه CUDA به‌طور هم‌زمان از یک GPU بهره ببرند. مراحل اصلی شامل ایجاد یک GPU node pool اختصاصی، سفارشی‌سازی cloud-init برای فعال‌سازی و پایدارسازی MPS روی نودها، استقرار NVIDIA device-plugin با Helm و سپس آزمایش دسترسی اشتراکی با اجرای یک بارکاری نمونه در قالب ۱۰ replica است. در پایان با ابزارهایی مانند nvidia-smi میزان هم‌زمانی و بهره‌وری بررسی می‌شود. نکات مهم: نیاز به سازگاری نسخه‌های CUDA و درایور، نبود ایزولیشن سخت حافظه در MPS، و مقایسه با گزینه‌هایی مثل MIG برای سناریوهای نیازمند ایزولیشن قوی‌تر.

#NVIDIA #MPS #GPUSharing #Kubernetes #OKE #OracleCloud #CUDA #Helm

🟣لینک مقاله:
https://ku.bz/Hd9QMtTXf


👑 @DevOps_Labdon
1