VIRSUN
7.22K subscribers
1.45K photos
819 videos
5 files
908 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🚀 DeepSeek-V3.2-Exp —
نسخه‌ی آزمایشی جدید منتشر شد!

ویژگی‌های کلیدی:

✳️ساخته‌شده بر پایه V3.1-Terminus

✳️بهره‌گیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینه‌ی کمتر در پردازش کانتکست‌های طولانی

✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1

💰 هزینه‌ی API بیش از ۵۰٪ کاهش یافته


📊 نسخه‌ی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.

🔗 Hugging Face
🔗 Tech Report
🔗 GitHub

@rss_ai_ir

#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
👍31🙏1
🚀 DeepSeek V3.2-Exp:
کاهش هزینه‌ها با Sparse Attention

🔹 این نسخه بر پایه‌ی V3.1-Terminus ساخته شده و با مکانیزم جدید Sparse Attention (DSA) آموزش دیده است.

🔹 هر توکن به‌جای همه‌ی توکن‌های قبلی، فقط به حدود 2048 کلید توجه می‌کند. این یعنی مصرف حافظه و تأخیر کمتر، بدون افت محسوس کیفیت.

🔹 💰 هزینه API به‌طور چشمگیری کاهش یافته: از ۱.۶۸ دلار به ۰.۴۲ دلار برای هر یک میلیون توکن.

📊 ویژگی‌ها:

✳️مناسب برای کانتکست‌های طولانی و زنجیره‌های پیچیده‌ی استدلال (Chain-of-Thought).

✳️کیفیت مشابه V3.1 با هزینه‌ی بسیار کمتر.

✳️آموزش بهینه‌تر: سه مرحله‌ی RL قبلی در یک مرحله ادغام شده.

✳️برای وظایفی که پاسخ یکتا ندارند، از GRM برای ارزیابی پاسخ‌ها استفاده می‌شود.


به زبان ساده: V3.2-Exp همان کیفیت V3.1 را با نصف هزینه و سرعت بیشتر ارائه می‌دهد.

@rss_ai_ir

#DeepSeek #SparseAttention #هوش_مصنوعی #LLM #مدل_زبان
👍3🔥1🙏1