VIRSUN

😁21🥰18👍13❤12🔥12👏12🎉7

1.21K views14:01

این تصویر ۹ اصل کلیدی برای بهبود عملکرد سیستم‌های RAG را نشون میده:

1️⃣ Chunking –
تقسیم بهینه اسناد (۵۱۲–۱۰۲۴ توکن) و استفاده از پنجره‌های لغزان برای پوشش بهتر محتوا.

2️⃣ Embeddings –
استفاده از مدل‌های بردار پیشرفته مثل BAAI یا MPNET برای دقت بالا.

3️⃣ Vector Store –
انتخاب دیتابیس مناسب (مثل Milvus, Weaviate, Pinecone) بر اساس مقیاس و سرعت.

4️⃣ Query Processing –
استفاده از تکنیک‌های HYDE و hybrid search برای بهبود بازیابی.

5️⃣ Reranking –
اعمال مدل‌های بازچینش مثل MonoBERT یا TILDE برای افزایش دقت.

6️⃣ Summarization –
ترکیب رویکردهای extractive و abstractive برای خلاصه‌سازی جامع.

7️⃣ Fine-tuning –
تنظیم دقیق مدل برای بهبود عملکرد در دامنه‌های خاص.

8️⃣ Evaluation –
پایش متریک‌های عمومی و دامنه‌ای برای بهبود مستمر سیستم.

9️⃣ LLM Integration –
ادغام هوشمند مدل‌های زبانی بزرگ با retrieval.

🔟 Repacking –
پیاده‌سازی استراتژی‌های sides, forward, reverse برای بسته‌بندی بهینه محتوا.

#هوش_مصنوعی #RAG #LLM #یادگیری_ماشین #AI #MachineLearning #GenerativeAI

🔥21👏16🎉15❤12🥰12👍11😁11

1.19K views14:10

VIRSUN

11:30

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Reinforcement Learning in DeepSeek-R1 | توضیح تصویری

⛔️در این ویدیو به شکل ساده و کاملاً بصری می‌بینید که الگوریتم یادگیری تقویتی (Reinforcement Learning) چطور در مدل DeepSeek-R1 استفاده می‌شود.
📌 نمایش تعامل عامل (Agent) با محیط، دریافت پاداش و اصلاح رفتار برای رسیدن به بهترین نتیجه.

👨‍💻 مناسب برای:

✳️دانشجویان و علاقه‌مندان به یادگیری ماشین
✳️کسانی که می‌خواهند درک عمیق‌تری از RL داشته باشند
✳️پژوهشگران حوزه هوش مصنوعی و مدل‌های DeepSeek

@rss_ai_ir

---

#DeepSeek #ReinforcementLearning #AI #MachineLearning #یادگیری_ماشین #هوش_مصنوعی #RL #DeepSeekR1

❤18🔥17🎉15😁12🥰11👏11👍9

425 views06:01

VIRSUN

🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL

🔍 مشکل در RL کلاسیک:

در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان

💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کوله‌پشتی (Knapsack) روی مواردی صرف می‌شود که واقعاً سیگنال آموزشی می‌دهند.

✨ نتایج:

🔼 ‌+20–40% گرادیان‌های غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 ‌+2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 ‌حدوداً دو برابر ارزان‌تر از روش توزیع یکنواخت

📄 جزییات بیشتر:
huggingface.co/papers/2509.25849

@rss_ai_ir 🤖

#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning

1.01K views12:12

About

Blog

Apps

Platform