This media is not supported in your browser
VIEW IN TELEGRAM
🤖✨ تمرین تعادل رباتهای انساننما
#هوش_مصنوعی #رباتیک #ربات_انسان_نما #AI #Robotics #FutureTech #MachineLearning
#هوش_مصنوعی #رباتیک #ربات_انسان_نما #AI #Robotics #FutureTech #MachineLearning
😁21🥰18👍13❤12🔥12👏12🎉7
این تصویر ۹ اصل کلیدی برای بهبود عملکرد سیستمهای RAG را نشون میده:
1️⃣ Chunking –
تقسیم بهینه اسناد (۵۱۲–۱۰۲۴ توکن) و استفاده از پنجرههای لغزان برای پوشش بهتر محتوا.
2️⃣ Embeddings –
استفاده از مدلهای بردار پیشرفته مثل BAAI یا MPNET برای دقت بالا.
3️⃣ Vector Store –
انتخاب دیتابیس مناسب (مثل Milvus, Weaviate, Pinecone) بر اساس مقیاس و سرعت.
4️⃣ Query Processing –
استفاده از تکنیکهای HYDE و hybrid search برای بهبود بازیابی.
5️⃣ Reranking –
اعمال مدلهای بازچینش مثل MonoBERT یا TILDE برای افزایش دقت.
6️⃣ Summarization –
ترکیب رویکردهای extractive و abstractive برای خلاصهسازی جامع.
7️⃣ Fine-tuning –
تنظیم دقیق مدل برای بهبود عملکرد در دامنههای خاص.
8️⃣ Evaluation –
پایش متریکهای عمومی و دامنهای برای بهبود مستمر سیستم.
9️⃣ LLM Integration –
ادغام هوشمند مدلهای زبانی بزرگ با retrieval.
🔟 Repacking –
پیادهسازی استراتژیهای sides, forward, reverse برای بستهبندی بهینه محتوا.
#هوش_مصنوعی #RAG #LLM #یادگیری_ماشین #AI #MachineLearning #GenerativeAI
1️⃣ Chunking –
تقسیم بهینه اسناد (۵۱۲–۱۰۲۴ توکن) و استفاده از پنجرههای لغزان برای پوشش بهتر محتوا.
2️⃣ Embeddings –
استفاده از مدلهای بردار پیشرفته مثل BAAI یا MPNET برای دقت بالا.
3️⃣ Vector Store –
انتخاب دیتابیس مناسب (مثل Milvus, Weaviate, Pinecone) بر اساس مقیاس و سرعت.
4️⃣ Query Processing –
استفاده از تکنیکهای HYDE و hybrid search برای بهبود بازیابی.
5️⃣ Reranking –
اعمال مدلهای بازچینش مثل MonoBERT یا TILDE برای افزایش دقت.
6️⃣ Summarization –
ترکیب رویکردهای extractive و abstractive برای خلاصهسازی جامع.
7️⃣ Fine-tuning –
تنظیم دقیق مدل برای بهبود عملکرد در دامنههای خاص.
8️⃣ Evaluation –
پایش متریکهای عمومی و دامنهای برای بهبود مستمر سیستم.
9️⃣ LLM Integration –
ادغام هوشمند مدلهای زبانی بزرگ با retrieval.
🔟 Repacking –
پیادهسازی استراتژیهای sides, forward, reverse برای بستهبندی بهینه محتوا.
#هوش_مصنوعی #RAG #LLM #یادگیری_ماشین #AI #MachineLearning #GenerativeAI
🔥21👏16🎉15❤12🥰12👍11😁11
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Reinforcement Learning in DeepSeek-R1 | توضیح تصویری
⛔️در این ویدیو به شکل ساده و کاملاً بصری میبینید که الگوریتم یادگیری تقویتی (Reinforcement Learning) چطور در مدل DeepSeek-R1 استفاده میشود.
📌 نمایش تعامل عامل (Agent) با محیط، دریافت پاداش و اصلاح رفتار برای رسیدن به بهترین نتیجه.
👨💻 مناسب برای:
✳️دانشجویان و علاقهمندان به یادگیری ماشین
✳️کسانی که میخواهند درک عمیقتری از RL داشته باشند
✳️پژوهشگران حوزه هوش مصنوعی و مدلهای DeepSeek
@rss_ai_ir
---
#DeepSeek #ReinforcementLearning #AI #MachineLearning #یادگیری_ماشین #هوش_مصنوعی #RL #DeepSeekR1
⛔️در این ویدیو به شکل ساده و کاملاً بصری میبینید که الگوریتم یادگیری تقویتی (Reinforcement Learning) چطور در مدل DeepSeek-R1 استفاده میشود.
📌 نمایش تعامل عامل (Agent) با محیط، دریافت پاداش و اصلاح رفتار برای رسیدن به بهترین نتیجه.
👨💻 مناسب برای:
✳️دانشجویان و علاقهمندان به یادگیری ماشین
✳️کسانی که میخواهند درک عمیقتری از RL داشته باشند
✳️پژوهشگران حوزه هوش مصنوعی و مدلهای DeepSeek
@rss_ai_ir
---
#DeepSeek #ReinforcementLearning #AI #MachineLearning #یادگیری_ماشین #هوش_مصنوعی #RL #DeepSeekR1
❤18🔥17🎉15😁12🥰11👏11👍9
🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning