VIRSUN
6.15K subscribers
1.03K photos
586 videos
5 files
657 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
محققان گوگل روشی تازه برای سریع‌تر و ارزان‌تر کردن مدل‌های زبانی بزرگ (LLM) معرفی کرده‌اند: Speculative Cascades.

🔹 کاسکید (Cascade): مدل کوچک ابتدا پاسخ می‌دهد و اگر پیچیده بود، مدل بزرگ وارد عمل می‌شود. سریع‌تر است اما کیفیت متغیر می‌شود.
🔹 Speculative decoding:
مدل کوچک چند کلمه جلوتر حدس می‌زند و مدل بزرگ فقط بررسی و تأیید می‌کند. کیفیت خوب است ولی همچنان پرهزینه.
🟢 Speculative Cascades:
ترکیب دو روش. مدل کوچک گاهی خودش پاسخ کامل می‌دهد، گاهی هم به‌عنوان شتاب‌دهنده مدل بزرگ عمل می‌کند.

🔥 نتایج روی Gemma و T5:

✳️سریع‌تر از speculative decoding
✳️ارزان‌تر و باکیفیت‌تر از cascades
✳️امکان تنظیم بهتر بین سرعت کیفیت
✳️در مسائل استدلال ریاضی، سرعت بالاتر همراه با حفظ یا بهبود کیفیت


📌 اهمیت: برای جستجو، چت‌بات‌ها و دستیارهای هوشمند، سرعت و هزینه پایین حیاتی است. این روش بهینه‌سازی می‌تواند استفاده از LLMها را عملی‌تر و گسترده‌تر کند.

🔗 جزئیات بیشتر: Google Research

@rss_ai_ir

#هوش_مصنوعی #مدل_زبانی #گوگل #LLM #بهینه‌سازی #SpeculativeDecoding #Cascades
7🎉6👍4🔥4😁3