🔵 عنوان مقاله
kclipper: declarative helm management
🟢 خلاصه مقاله:
kclipper روشی سبک برای مدیریت declarative در Helm روی Kubernetes معرفی میکند. بهجای اجرای دستورات پراکنده helm، وضعیت مطلوب شامل نام Chart، نسخه، Namespace و مقادیر در فایلهای نسخهپذیر تعریف میشود تا تغییرات قابل تکرار، بازبینی و حسابرسی باشند. این رویکرد با الگوی GitOps همراستا است و با تکیه بر اعلان وضعیت مطلوب، به کاهش Drift، استانداردسازی سرویسها و تسهیل ارتقا و بازگشت کمک میکند. با حفظ سازگاری با اکوسیستم Helm، تیمهای SRE و DevOps میتوانند سرویسها را در محیطها و کلاسترهای مختلف بهصورت قابل اتکا و یکپارچه مدیریت کنند.
#kclipper #Helm #Kubernetes #GitOps #DevOps #InfrastructureAsCode #CICD #PlatformEngineering
🟣لینک مقاله:
https://ku.bz/qGTw90Kmy
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
kclipper: declarative helm management
🟢 خلاصه مقاله:
kclipper روشی سبک برای مدیریت declarative در Helm روی Kubernetes معرفی میکند. بهجای اجرای دستورات پراکنده helm، وضعیت مطلوب شامل نام Chart، نسخه، Namespace و مقادیر در فایلهای نسخهپذیر تعریف میشود تا تغییرات قابل تکرار، بازبینی و حسابرسی باشند. این رویکرد با الگوی GitOps همراستا است و با تکیه بر اعلان وضعیت مطلوب، به کاهش Drift، استانداردسازی سرویسها و تسهیل ارتقا و بازگشت کمک میکند. با حفظ سازگاری با اکوسیستم Helm، تیمهای SRE و DevOps میتوانند سرویسها را در محیطها و کلاسترهای مختلف بهصورت قابل اتکا و یکپارچه مدیریت کنند.
#kclipper #Helm #Kubernetes #GitOps #DevOps #InfrastructureAsCode #CICD #PlatformEngineering
🟣لینک مقاله:
https://ku.bz/qGTw90Kmy
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - MacroPower/kclipper: KCL + Helm = kclipper
KCL + Helm = kclipper. Contribute to MacroPower/kclipper development by creating an account on GitHub.
🔵 عنوان مقاله
From CI to Kubernetes Catalog: Building a Composable Platform with GitOps and vCluster
🟢 خلاصه مقاله:
** این مقاله مسیر گذار از CI به یک Kubernetes Catalog کامل را توضیح میدهد و نشان میدهد چگونه میتوان با یک معماری سهلایه و ماژولار روی Kubernetes یک Internal Developer Platform ترکیبپذیر ساخت. در لایه زیرین، vCluster محیطهای ایزوله و چندمستاجره ایجاد میکند؛ در لایه میانی، بهترینروشها بهصورت قالبها و Helm chartهای قابلاستفادهمجدد کپسوله میشوند؛ و در لایه بالایی، خروجیهای CI از طریق GitOps بهصورت امن و قابل ردیابی به محیطهای مقصد اعمال میگردند. در نهایت، یک Kubernetes Catalog بهعنوان درگاه سلفسرویس برای مؤلفههای تأییدشده و مسیرهای طلایی فراهم میشود تا تیمها با حفظ استانداردها، سریعتر و مطمئنتر استقرار دهند.
#Kubernetes #GitOps #PlatformEngineering #InternalDeveloperPlatform #Helm #vCluster #DevOps #CICD
🟣لینک مقاله:
https://ku.bz/tr_Py62FF
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
From CI to Kubernetes Catalog: Building a Composable Platform with GitOps and vCluster
🟢 خلاصه مقاله:
** این مقاله مسیر گذار از CI به یک Kubernetes Catalog کامل را توضیح میدهد و نشان میدهد چگونه میتوان با یک معماری سهلایه و ماژولار روی Kubernetes یک Internal Developer Platform ترکیبپذیر ساخت. در لایه زیرین، vCluster محیطهای ایزوله و چندمستاجره ایجاد میکند؛ در لایه میانی، بهترینروشها بهصورت قالبها و Helm chartهای قابلاستفادهمجدد کپسوله میشوند؛ و در لایه بالایی، خروجیهای CI از طریق GitOps بهصورت امن و قابل ردیابی به محیطهای مقصد اعمال میگردند. در نهایت، یک Kubernetes Catalog بهعنوان درگاه سلفسرویس برای مؤلفههای تأییدشده و مسیرهای طلایی فراهم میشود تا تیمها با حفظ استانداردها، سریعتر و مطمئنتر استقرار دهند.
#Kubernetes #GitOps #PlatformEngineering #InternalDeveloperPlatform #Helm #vCluster #DevOps #CICD
🟣لینک مقاله:
https://ku.bz/tr_Py62FF
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Medium
From CI to Kubernetes Catalog: Building a Composable Platform with GitOps and vCluster
A practical guide for Platform Engineers to create reusable, self-service Kubernetes environments using Helm, Score, Kro, and more.
🔵 عنوان مقاله
Winter Soldier: Kubernetes Cleaner
🟢 خلاصه مقاله:
Winter Soldier: Kubernetes Cleaner ابزاری است برای تمیزکاری خودکار و ایمن در Kubernetes که با اسکن وضعیت کلاستر، منابع بلااستفاده و رهاشده (مثل Namespace، PVC/PV، Serviceهای نوع LoadBalancer، ConfigMap و Secretهای بدون مصرف) و موارد ناشی از drift را شناسایی و پاکسازی میکند. این ابزار دارای dry-run، گزارشدهی و audit log، رعایت RBAC، پشتیبانی از annotationهای TTL/keep و گاردریلهای ایمنی برای حذف بدون ریسک است. میتوان آن را بهصورت CLI، بهعنوان controller یا CronJob اجرا کرد و در GitOps با Argo CD یا Flux و همچنین در فرایندهای Helm یکپارچه نمود؛ همچنین هدفگیری Namespace یا چند کلاستر از طریق kubeconfig را پشتیبانی میکند. در بعد امنیت و حاکمیت، موارد مشکوک، Serviceهای بیدلیل در معرض عموم و ذخیرهسازی اشتباه secretها در ConfigMap را پرچمگذاری میکند و با OPA/Gatekeeper قابل ادغام است؛ ضمن اینکه با Prometheus/Grafana قابل مشاهدهسازی است. نصب از طریق Helm ساده بوده و مقاله توصیههای آغاز کار، تنظیمات پیشفرض امن و مسیر مشارکت در پروژه متنباز را ارائه میدهد.
#Kubernetes #DevOps #CloudNative #SRE #Automation #GitOps #Helm #Security
🟣لینک مقاله:
https://ku.bz/WB7nhRqQp
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Winter Soldier: Kubernetes Cleaner
🟢 خلاصه مقاله:
Winter Soldier: Kubernetes Cleaner ابزاری است برای تمیزکاری خودکار و ایمن در Kubernetes که با اسکن وضعیت کلاستر، منابع بلااستفاده و رهاشده (مثل Namespace، PVC/PV، Serviceهای نوع LoadBalancer، ConfigMap و Secretهای بدون مصرف) و موارد ناشی از drift را شناسایی و پاکسازی میکند. این ابزار دارای dry-run، گزارشدهی و audit log، رعایت RBAC، پشتیبانی از annotationهای TTL/keep و گاردریلهای ایمنی برای حذف بدون ریسک است. میتوان آن را بهصورت CLI، بهعنوان controller یا CronJob اجرا کرد و در GitOps با Argo CD یا Flux و همچنین در فرایندهای Helm یکپارچه نمود؛ همچنین هدفگیری Namespace یا چند کلاستر از طریق kubeconfig را پشتیبانی میکند. در بعد امنیت و حاکمیت، موارد مشکوک، Serviceهای بیدلیل در معرض عموم و ذخیرهسازی اشتباه secretها در ConfigMap را پرچمگذاری میکند و با OPA/Gatekeeper قابل ادغام است؛ ضمن اینکه با Prometheus/Grafana قابل مشاهدهسازی است. نصب از طریق Helm ساده بوده و مقاله توصیههای آغاز کار، تنظیمات پیشفرض امن و مسیر مشارکت در پروژه متنباز را ارائه میدهد.
#Kubernetes #DevOps #CloudNative #SRE #Automation #GitOps #Helm #Security
🟣لینک مقاله:
https://ku.bz/WB7nhRqQp
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - devtron-labs/winter-soldier: Scale down or delete unneeded workload after work hours based on conditions
Scale down or delete unneeded workload after work hours based on conditions - devtron-labs/winter-soldier
🔵 عنوان مقاله
Keel: Kubernetes Deployment Automation Engine
🟢 خلاصه مقاله:
** Keel یک Kubernetes Operator است که بهصورت خودکار بهروزرسانیهای Helm، Deployment، DaemonSet و StatefulSet را اجرا میکند. با رصد نسخههای جدید ایمیجها یا تغییرات Helm chart، بهروزرسانیها را به شکل Rolling و مطابق مکانیزمهای بومی Kubernetes انجام میدهد و به سلامت سرویسها و استراتژیهای rollout احترام میگذارد. امکان تعریف سیاستها برای کنترل نوع و نحوه بهروزرسانیها (مثل محدودکردن به نسخههای امن یا نیاز به تأیید) وجود دارد و Keel با گردشکارهای فعلی تیمها سازگار است. نتیجه، کاهش کارهای تکراری، جلوگیری از ناهمخوانی پیکربندی و بهروزرسانی ایمن و یکنواخت سرویسها در مقیاس است.
#Kubernetes #Keel #Helm #DevOps #Automation #ContinuousDelivery #Containers
🟣لینک مقاله:
https://ku.bz/N-jRpJkrH
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Keel: Kubernetes Deployment Automation Engine
🟢 خلاصه مقاله:
** Keel یک Kubernetes Operator است که بهصورت خودکار بهروزرسانیهای Helm، Deployment، DaemonSet و StatefulSet را اجرا میکند. با رصد نسخههای جدید ایمیجها یا تغییرات Helm chart، بهروزرسانیها را به شکل Rolling و مطابق مکانیزمهای بومی Kubernetes انجام میدهد و به سلامت سرویسها و استراتژیهای rollout احترام میگذارد. امکان تعریف سیاستها برای کنترل نوع و نحوه بهروزرسانیها (مثل محدودکردن به نسخههای امن یا نیاز به تأیید) وجود دارد و Keel با گردشکارهای فعلی تیمها سازگار است. نتیجه، کاهش کارهای تکراری، جلوگیری از ناهمخوانی پیکربندی و بهروزرسانی ایمن و یکنواخت سرویسها در مقیاس است.
#Kubernetes #Keel #Helm #DevOps #Automation #ContinuousDelivery #Containers
🟣لینک مقاله:
https://ku.bz/N-jRpJkrH
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
❤1
🔵 عنوان مقاله
Zarf: airgapped installation
🟢 خلاصه مقاله:
Zarf ابزاری برای نصب امن و قابل اتکا در محیطهای بدون اتصال (air-gapped) است که با ساخت یک بسته قابلحمل شامل همه وابستگیها—از جمله تصاویر کانتینری، نمودارهای Helm، مانیفستهای Kubernetes، باینریها و پیکربندی—استقرار را بدون نیاز به اینترنت ممکن میکند. این بستهها نسخهقفل، دارای چکسام و قابل امضا هستند؛ روی سیستم متصل ساخته میشوند، با رسانه قابلحمل منتقل میگردند و در مقصد با چند فرمان نصب میشوند. Zarf میتواند پیشنیازهایی مانند رجیستری محلی و سرویس Git را راهاندازی کند و ارجاع تصاویر را به رجیستری داخلی بازنویسی کند. برای انطباق و شفافیت زنجیره تامین، امکان SBOM، امضا و رهگیری فراهم است و ادغام با CI به انتشارهای تکرارپذیر کمک میکند. این رویکرد برای شبکههای دولتی/دفاعی، صنعتی و سلامت مناسب است و نگهداری بارهای کاری Kubernetes را بدون تضعیف مرزهای امنیتی ساده میسازد.
#Zarf #AirGapped #OfflineDeployment #Kubernetes #DevSecOps #SupplyChainSecurity #Helm #Containers
🟣لینک مقاله:
https://ku.bz/DQTLs_qQ_
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Zarf: airgapped installation
🟢 خلاصه مقاله:
Zarf ابزاری برای نصب امن و قابل اتکا در محیطهای بدون اتصال (air-gapped) است که با ساخت یک بسته قابلحمل شامل همه وابستگیها—از جمله تصاویر کانتینری، نمودارهای Helm، مانیفستهای Kubernetes، باینریها و پیکربندی—استقرار را بدون نیاز به اینترنت ممکن میکند. این بستهها نسخهقفل، دارای چکسام و قابل امضا هستند؛ روی سیستم متصل ساخته میشوند، با رسانه قابلحمل منتقل میگردند و در مقصد با چند فرمان نصب میشوند. Zarf میتواند پیشنیازهایی مانند رجیستری محلی و سرویس Git را راهاندازی کند و ارجاع تصاویر را به رجیستری داخلی بازنویسی کند. برای انطباق و شفافیت زنجیره تامین، امکان SBOM، امضا و رهگیری فراهم است و ادغام با CI به انتشارهای تکرارپذیر کمک میکند. این رویکرد برای شبکههای دولتی/دفاعی، صنعتی و سلامت مناسب است و نگهداری بارهای کاری Kubernetes را بدون تضعیف مرزهای امنیتی ساده میسازد.
#Zarf #AirGapped #OfflineDeployment #Kubernetes #DevSecOps #SupplyChainSecurity #Helm #Containers
🟣لینک مقاله:
https://ku.bz/DQTLs_qQ_
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - zarf-dev/zarf: The Airgap Native Packager Manager for Kubernetes
The Airgap Native Packager Manager for Kubernetes. Contribute to zarf-dev/zarf development by creating an account on GitHub.
🔵 عنوان مقاله
mcp-server-kubernetes – Kubernetes Management via MCP
🟢 خلاصه مقاله:
** mcp-server-kubernetes یک لایه کامل مدیریت Kubernetes را از طریق Model Context Protocol (MCP) ارائه میکند تا ابزارهایی مانند Claude Desktop و mcp-chat بتوانند دستورهای kubectl و Helm را بهصورت امن اجرا کنند. این راهکار پلی میان دستیارهای مبتنی بر مدل و عملیات واقعی خوشه است و با مسیردهی درخواستها از طریق MCP، امکان اعمال کنترل، اعتبارسنجی و تعیین دامنه دسترسی پیش از اجرای فرمانها را فراهم میکند. نتیجه، اجرای وظایف رایج kubectl و Helm با یک رابط یکپارچه و سازگار با چند ابزار، بدون نیاز به دسترسی مستقیم به شل یا اعتبارنامههای بلندمدت است. برای تیمهای پلتفرم و DevOps، این روش ضمن کاهش اصطکاک عملیاتی، به حفظ کنترلهای سازمانی و بهترینروشها در مدیریت Kubernetes کمک میکند.
#Kubernetes #MCP #kubectl #Helm #DevOps #PlatformEngineering #LLMOps #CloudSecurity
🟣لینک مقاله:
https://ku.bz/PDz70StnM
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
mcp-server-kubernetes – Kubernetes Management via MCP
🟢 خلاصه مقاله:
** mcp-server-kubernetes یک لایه کامل مدیریت Kubernetes را از طریق Model Context Protocol (MCP) ارائه میکند تا ابزارهایی مانند Claude Desktop و mcp-chat بتوانند دستورهای kubectl و Helm را بهصورت امن اجرا کنند. این راهکار پلی میان دستیارهای مبتنی بر مدل و عملیات واقعی خوشه است و با مسیردهی درخواستها از طریق MCP، امکان اعمال کنترل، اعتبارسنجی و تعیین دامنه دسترسی پیش از اجرای فرمانها را فراهم میکند. نتیجه، اجرای وظایف رایج kubectl و Helm با یک رابط یکپارچه و سازگار با چند ابزار، بدون نیاز به دسترسی مستقیم به شل یا اعتبارنامههای بلندمدت است. برای تیمهای پلتفرم و DevOps، این روش ضمن کاهش اصطکاک عملیاتی، به حفظ کنترلهای سازمانی و بهترینروشها در مدیریت Kubernetes کمک میکند.
#Kubernetes #MCP #kubectl #Helm #DevOps #PlatformEngineering #LLMOps #CloudSecurity
🟣لینک مقاله:
https://ku.bz/PDz70StnM
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - Flux159/mcp-server-kubernetes: MCP Server for kubernetes management commands
MCP Server for kubernetes management commands. Contribute to Flux159/mcp-server-kubernetes development by creating an account on GitHub.
🔵 عنوان مقاله
Helm unittest
🟢 خلاصه مقاله:
Helm unittest روشی سبک برای واحدسنجی قالبهای Helm chart است تا قبل از استقرار روی Kubernetes مطمئن شویم خروجی رندر دقیقاً مطابق انتظار است. تستها به صورت فایلهای YAML کنار چارت نوشته میشوند، برای هر سناریو مجموعهای از values تعریف میشود و روی خروجی رندر شده مجموعهای از Assertionها اجرا میگردد؛ مثل وجود یا عدم وجود منابع، صحت مقادیر فیلدهایی مانند image، replicas، labels/annotations و رفتار بخشهای شرطی. این رویکرد سریع است، به کلاستر وصل نمیشود و بهخوبی در CI/CD (مثل GitHub Actions، GitLab CI یا Jenkins) ادغام میشود تا هر تغییر در قالبها سریعاً بازخورد بگیرد. توجه کنید Helm unittest بر درستی سطح Template تمرکز دارد و رفتار زمان اجرا را پوشش نمیدهد؛ بنابراین بهتر است در کنار اعتبارسنجیهای دیگر و تستهای یکپارچه/سرتاسری استفاده شود تا پوشش کامل بهدست آید.
#Helm #Kubernetes #HelmUnittest #DevOps #CICD #Testing #YAML #InfrastructureAsCode
🟣لینک مقاله:
https://ku.bz/RKlbPgYDy
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Helm unittest
🟢 خلاصه مقاله:
Helm unittest روشی سبک برای واحدسنجی قالبهای Helm chart است تا قبل از استقرار روی Kubernetes مطمئن شویم خروجی رندر دقیقاً مطابق انتظار است. تستها به صورت فایلهای YAML کنار چارت نوشته میشوند، برای هر سناریو مجموعهای از values تعریف میشود و روی خروجی رندر شده مجموعهای از Assertionها اجرا میگردد؛ مثل وجود یا عدم وجود منابع، صحت مقادیر فیلدهایی مانند image، replicas، labels/annotations و رفتار بخشهای شرطی. این رویکرد سریع است، به کلاستر وصل نمیشود و بهخوبی در CI/CD (مثل GitHub Actions، GitLab CI یا Jenkins) ادغام میشود تا هر تغییر در قالبها سریعاً بازخورد بگیرد. توجه کنید Helm unittest بر درستی سطح Template تمرکز دارد و رفتار زمان اجرا را پوشش نمیدهد؛ بنابراین بهتر است در کنار اعتبارسنجیهای دیگر و تستهای یکپارچه/سرتاسری استفاده شود تا پوشش کامل بهدست آید.
#Helm #Kubernetes #HelmUnittest #DevOps #CICD #Testing #YAML #InfrastructureAsCode
🟣لینک مقاله:
https://ku.bz/RKlbPgYDy
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - helm-unittest/helm-unittest: BDD styled unit test framework for Kubernetes Helm charts as a Helm plugin.
BDD styled unit test framework for Kubernetes Helm charts as a Helm plugin. - helm-unittest/helm-unittest
One of the best practical YouTube Channels to learn DevOps Tools and Skills.
یکی از بهترین کانالهایی که بصورت عملی ابزارهای DevOps رو بصورت ملموس و خیلی کوتاه و مختصر و مفید توضیح و آموزش میده
#DevOps #Terraform #Helm #Kubernetes #AWS #GCP #Azure
https://www.youtube.com/@AntonPutra
یکی از بهترین کانالهایی که بصورت عملی ابزارهای DevOps رو بصورت ملموس و خیلی کوتاه و مختصر و مفید توضیح و آموزش میده
#DevOps #Terraform #Helm #Kubernetes #AWS #GCP #Azure
https://www.youtube.com/@AntonPutra
🔵 عنوان مقاله
Kagent: Agenetic AI for Kubernetes
🟢 خلاصه مقاله:
Kagent یک چارچوب agentic AI برای Kubernetes است که به تیمهای پلتفرم، DevOps و SRE امکان میدهد agentهای خودگردان را برای خودکارسازی عملیات و تسریع رفع اشکال اجرا کنند. نصب آن از طریق shell یا Helm انجام میشود و از طریق Model Context Protocol (MCP) به LLMs متصل میشود تا دسترسی استاندارد به بافت زنده خوشه و ابزارها فراهم شود. نتیجه، کاهش کار تکراری، تریاژ سریعتر رخدادها و اجرای مطمئنتر عملیات Kubernetes است؛ با اختیار انتخاب بین اجرای خودکار کارهای کمریسک یا تأیید انسانی برای اقدامات حساس.
#Kagent #Kubernetes #AIOps #LLMs #MCP #Helm #DevOps #SRE
🟣لینک مقاله:
https://ku.bz/R52yDGdFL
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Kagent: Agenetic AI for Kubernetes
🟢 خلاصه مقاله:
Kagent یک چارچوب agentic AI برای Kubernetes است که به تیمهای پلتفرم، DevOps و SRE امکان میدهد agentهای خودگردان را برای خودکارسازی عملیات و تسریع رفع اشکال اجرا کنند. نصب آن از طریق shell یا Helm انجام میشود و از طریق Model Context Protocol (MCP) به LLMs متصل میشود تا دسترسی استاندارد به بافت زنده خوشه و ابزارها فراهم شود. نتیجه، کاهش کار تکراری، تریاژ سریعتر رخدادها و اجرای مطمئنتر عملیات Kubernetes است؛ با اختیار انتخاب بین اجرای خودکار کارهای کمریسک یا تأیید انسانی برای اقدامات حساس.
#Kagent #Kubernetes #AIOps #LLMs #MCP #Helm #DevOps #SRE
🟣لینک مقاله:
https://ku.bz/R52yDGdFL
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Medium
Kagent: Agentic AI for Kubernetes (AI meets cloudnative)
In the era of Artificial Intelligence, Generative AI, Large Language models and yes new buzz word Agentic AI and to support it new…
🔵 عنوان مقاله
GPU sharing with MPS and OKE
🟢 خلاصه مقاله:
این آموزش نشان میدهد چگونه با استفاده از NVIDIA MPS در Oracle Kubernetes Engine (OKE) اشتراکگذاری GPU را فعال کنیم تا چندین پردازه CUDA بهطور همزمان از یک GPU بهره ببرند. مراحل اصلی شامل ایجاد یک GPU node pool اختصاصی، سفارشیسازی cloud-init برای فعالسازی و پایدارسازی MPS روی نودها، استقرار NVIDIA device-plugin با Helm و سپس آزمایش دسترسی اشتراکی با اجرای یک بارکاری نمونه در قالب ۱۰ replica است. در پایان با ابزارهایی مانند nvidia-smi میزان همزمانی و بهرهوری بررسی میشود. نکات مهم: نیاز به سازگاری نسخههای CUDA و درایور، نبود ایزولیشن سخت حافظه در MPS، و مقایسه با گزینههایی مثل MIG برای سناریوهای نیازمند ایزولیشن قویتر.
#NVIDIA #MPS #GPUSharing #Kubernetes #OKE #OracleCloud #CUDA #Helm
🟣لینک مقاله:
https://ku.bz/Hd9QMtTXf
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GPU sharing with MPS and OKE
🟢 خلاصه مقاله:
این آموزش نشان میدهد چگونه با استفاده از NVIDIA MPS در Oracle Kubernetes Engine (OKE) اشتراکگذاری GPU را فعال کنیم تا چندین پردازه CUDA بهطور همزمان از یک GPU بهره ببرند. مراحل اصلی شامل ایجاد یک GPU node pool اختصاصی، سفارشیسازی cloud-init برای فعالسازی و پایدارسازی MPS روی نودها، استقرار NVIDIA device-plugin با Helm و سپس آزمایش دسترسی اشتراکی با اجرای یک بارکاری نمونه در قالب ۱۰ replica است. در پایان با ابزارهایی مانند nvidia-smi میزان همزمانی و بهرهوری بررسی میشود. نکات مهم: نیاز به سازگاری نسخههای CUDA و درایور، نبود ایزولیشن سخت حافظه در MPS، و مقایسه با گزینههایی مثل MIG برای سناریوهای نیازمند ایزولیشن قویتر.
#NVIDIA #MPS #GPUSharing #Kubernetes #OKE #OracleCloud #CUDA #Helm
🟣لینک مقاله:
https://ku.bz/Hd9QMtTXf
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Medium
GPU sharing with MPS and OKE
Though I’ve been working with Kubernetes since 2018, only very recently I had the opportunity to learn a bit more about GPU-based worker…
❤1