💡 شرکت DeepSeek پروژهی جدید خود با نام LPLB را بهصورت متنباز منتشر کرد؛ ابزاری آزمایشی برای مدیریت هوشمند بار در معماریهای MoE
🧠 در این سیستم چند نکتهٔ مهم وجود دارد:
الگوریتم بهصورت پویا بار بین «اکسپرتها» را بر اساس آمار استفاده جابهجا میکند ⚙️
ساخت و جایگذاری نسخههای تکراری (Replica) بر پایهٔ توپولوژی خوشه انجام میشود 🛰️
فرایند پیدا کردن توزیع بهینهٔ توکنها توسط حلکنندهٔ خطی (LP Solver) مستقیماً روی GPU انجام میگیرد، با استفاده از cuSolverDx و cuBLASDx ⚡️
معیارهای بارگذاری از طریق دو روش قابل دریافت است:
• استفادهٔ مستقیم از torch.distributed
• یا بهرهگیری از بافرهای Deep-EP 🔧
📚 در مخزن گیتهاب یک راهنمای کامل قرار دارد که نشان میدهد یک بالانسر دقیق و هوشمند برای مدلهای MoE چگونه باید طراحی شود.
🔗 GitHub:
https://github.com/deepseek-ai/LPLB
#DeepSeek #MoE #AIInfrastructure #OpenSource
🧠 در این سیستم چند نکتهٔ مهم وجود دارد:
الگوریتم بهصورت پویا بار بین «اکسپرتها» را بر اساس آمار استفاده جابهجا میکند ⚙️
ساخت و جایگذاری نسخههای تکراری (Replica) بر پایهٔ توپولوژی خوشه انجام میشود 🛰️
فرایند پیدا کردن توزیع بهینهٔ توکنها توسط حلکنندهٔ خطی (LP Solver) مستقیماً روی GPU انجام میگیرد، با استفاده از cuSolverDx و cuBLASDx ⚡️
معیارهای بارگذاری از طریق دو روش قابل دریافت است:
• استفادهٔ مستقیم از torch.distributed
• یا بهرهگیری از بافرهای Deep-EP 🔧
📚 در مخزن گیتهاب یک راهنمای کامل قرار دارد که نشان میدهد یک بالانسر دقیق و هوشمند برای مدلهای MoE چگونه باید طراحی شود.
🔗 GitHub:
https://github.com/deepseek-ai/LPLB
#DeepSeek #MoE #AIInfrastructure #OpenSource