🚀 DeepSeek-V3.2-Exp —
نسخهی آزمایشی جدید منتشر شد!
⚡ ویژگیهای کلیدی:
✳️ساختهشده بر پایه V3.1-Terminus
✳️بهرهگیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینهی کمتر در پردازش کانتکستهای طولانی
✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1
💰 هزینهی API بیش از ۵۰٪ کاهش یافته
📊 نسخهی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.
🔗 Hugging Face
🔗 Tech Report
🔗 GitHub
@rss_ai_ir
#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
نسخهی آزمایشی جدید منتشر شد!
⚡ ویژگیهای کلیدی:
✳️ساختهشده بر پایه V3.1-Terminus
✳️بهرهگیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینهی کمتر در پردازش کانتکستهای طولانی
✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1
💰 هزینهی API بیش از ۵۰٪ کاهش یافته
📊 نسخهی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.
🔗 Hugging Face
🔗 Tech Report
🔗 GitHub
@rss_ai_ir
#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
👍3❤1🙏1
🚀 DeepSeek V3.2-Exp:
کاهش هزینهها با Sparse Attention
🔹 این نسخه بر پایهی V3.1-Terminus ساخته شده و با مکانیزم جدید Sparse Attention (DSA) آموزش دیده است.
🔹 هر توکن بهجای همهی توکنهای قبلی، فقط به حدود 2048 کلید توجه میکند. این یعنی مصرف حافظه و تأخیر کمتر، بدون افت محسوس کیفیت.
🔹 💰 هزینه API بهطور چشمگیری کاهش یافته: از ۱.۶۸ دلار به ۰.۴۲ دلار برای هر یک میلیون توکن.
📊 ویژگیها:
✳️مناسب برای کانتکستهای طولانی و زنجیرههای پیچیدهی استدلال (Chain-of-Thought).
✳️کیفیت مشابه V3.1 با هزینهی بسیار کمتر.
✳️آموزش بهینهتر: سه مرحلهی RL قبلی در یک مرحله ادغام شده.
✳️برای وظایفی که پاسخ یکتا ندارند، از GRM برای ارزیابی پاسخها استفاده میشود.
✨ به زبان ساده: V3.2-Exp همان کیفیت V3.1 را با نصف هزینه و سرعت بیشتر ارائه میدهد.
@rss_ai_ir
#DeepSeek #SparseAttention #هوش_مصنوعی #LLM #مدل_زبان
کاهش هزینهها با Sparse Attention
🔹 این نسخه بر پایهی V3.1-Terminus ساخته شده و با مکانیزم جدید Sparse Attention (DSA) آموزش دیده است.
🔹 هر توکن بهجای همهی توکنهای قبلی، فقط به حدود 2048 کلید توجه میکند. این یعنی مصرف حافظه و تأخیر کمتر، بدون افت محسوس کیفیت.
🔹 💰 هزینه API بهطور چشمگیری کاهش یافته: از ۱.۶۸ دلار به ۰.۴۲ دلار برای هر یک میلیون توکن.
📊 ویژگیها:
✳️مناسب برای کانتکستهای طولانی و زنجیرههای پیچیدهی استدلال (Chain-of-Thought).
✳️کیفیت مشابه V3.1 با هزینهی بسیار کمتر.
✳️آموزش بهینهتر: سه مرحلهی RL قبلی در یک مرحله ادغام شده.
✳️برای وظایفی که پاسخ یکتا ندارند، از GRM برای ارزیابی پاسخها استفاده میشود.
✨ به زبان ساده: V3.2-Exp همان کیفیت V3.1 را با نصف هزینه و سرعت بیشتر ارائه میدهد.
@rss_ai_ir
#DeepSeek #SparseAttention #هوش_مصنوعی #LLM #مدل_زبان
👍3🔥1🙏1