VIRSUN

🚀 DeepSeek-V3.2-Exp —
نسخه‌ی آزمایشی جدید منتشر شد!

⚡ ویژگی‌های کلیدی:

✳️ساخته‌شده بر پایه V3.1-Terminus

✳️بهره‌گیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینه‌ی کمتر در پردازش کانتکست‌های طولانی

✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1

💰 هزینه‌ی API بیش از ۵۰٪ کاهش یافته

📊 نسخه‌ی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.

🔗 Hugging Face
🔗 Tech Report
🔗 GitHub

@rss_ai_ir

#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM

👍3❤1🙏1

355 views10:38

VIRSUN

🚀 DeepSeek V3.2-Exp:
کاهش هزینه‌ها با Sparse Attention

🔹 این نسخه بر پایه‌ی V3.1-Terminus ساخته شده و با مکانیزم جدید Sparse Attention (DSA) آموزش دیده است.

🔹 هر توکن به‌جای همه‌ی توکن‌های قبلی، فقط به حدود 2048 کلید توجه می‌کند. این یعنی مصرف حافظه و تأخیر کمتر، بدون افت محسوس کیفیت.

🔹 💰 هزینه API به‌طور چشمگیری کاهش یافته: از ۱.۶۸ دلار به ۰.۴۲ دلار برای هر یک میلیون توکن.

📊 ویژگی‌ها:

✳️مناسب برای کانتکست‌های طولانی و زنجیره‌های پیچیده‌ی استدلال (Chain-of-Thought).

✳️کیفیت مشابه V3.1 با هزینه‌ی بسیار کمتر.

✳️آموزش بهینه‌تر: سه مرحله‌ی RL قبلی در یک مرحله ادغام شده.

✳️برای وظایفی که پاسخ یکتا ندارند، از GRM برای ارزیابی پاسخ‌ها استفاده می‌شود.

✨ به زبان ساده: V3.2-Exp همان کیفیت V3.1 را با نصف هزینه و سرعت بیشتر ارائه می‌دهد.

@rss_ai_ir

#DeepSeek #SparseAttention #هوش_مصنوعی #LLM #مدل_زبان

👍3🔥1🙏1

242 views10:46

About

Blog

Apps

Platform