Data science
121 subscribers
9 photos
5 videos
2 files
10 links
این کانال برای علاقه مندان به دیتاساینس و هوش مصنوعی
تشکیل شده، از همراهی شما خرسندم
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
روز اساتید و معلمان محترم مبارک
و راهشان پر‌ گهر باد 💫
👍1
Fine-Tuning vs. RLHF: Two Distinct Paths for Training Language Models
👍1
Data science
Fine-Tuning vs. RLHF: Two Distinct Paths for Training Language Models
🎯 Fine-Tuning vs. RLHF
دو مسیر متفاوت برای تربیت مدل‌های زبانی بزرگ

در مسیر توسعه مدل‌های زبانی مثل ChatGPT یا سایر LLMها، تنظیم رفتار مدل فقط به آموزش اولیه (pretraining) محدود نمی‌شه. گاهی نیاز داریم مدل رو:

1. روی یک دامنه خاص تخصصی کنیم.


2. یا رفتارهاش رو انسانی‌تر، اخلاقی‌تر و کاربردی‌تر کنیم.



برای این دو هدف، دو رویکرد رایج و مهم وجود داره:
Fine-Tuning
RLHF (Reinforcement Learning from Human Feedback)


---

🔍 در Fine-Tuning، ما مدل از قبل آموزش‌دیده رو با مجموعه‌ای از داده‌های خاص (مثل چت‌های پشتیبانی مشتری، مقالات پزشکی یا کدهای برنامه‌نویسی) تنظیم دقیق می‌کنیم. این روش برای پروژه‌هایی مفید هست که هدفشون تخصص‌سازی مدل در یک حوزه خاص باشه.

اما...

🔁 در RLHF، مدل بعد از آموزش اولیه و احتمالاً Fine-Tuning، وارد مرحله‌ای می‌شه که بازخورد انسانی نقش اصلی رو ایفا می‌کنه. انسان‌ها خروجی‌های مختلف مدل رو ارزیابی می‌کنن و این ارزیابی‌ها به مدل یاد می‌دن کدوم پاسخ‌ها از نظر رفتاری، اخلاقی و کاربردی بهتر هستند. سپس با الگوریتم‌های یادگیری تقویتی (مثل PPO)، مدل به سمت تولید خروجی‌های باکیفیت‌تر هدایت می‌شه.


---

📊 در تصویری که طراحی کردم، این دو رویکرد رو از نظر روش یادگیری، هدف، نوع داده، پیچیدگی و کاربرد رایج با هم مقایسه کردم.
👇 (به تصویر نگاه کنید)
---

Fine-Tuning برای پروژه‌هایی که به تخصص نیاز دارند فوق‌العاده‌ست.
RLHF برای تربیت چت‌بات‌هایی که باید مسئولانه، مؤدبانه و کاربردی رفتار کنند، ضروریه.

📌 انتخاب بین این دو به نوع محصولی که می‌سازید، منابعی که دارید، و هدف نهایی شما از مدل بستگی داره.

#LLM #FineTuning #RLHF
👍1
My recent paper can be accessed here. I hope these steps will significantly impact global health and help individuals live safely.
https://journals.sbmu.ac.ir/ghfbb/index.php/ghfbb/article/view/3158#:~:text=Results%3A%20From%201990%20to%202021,regions%20showed%20statistically%20significant%20reductions
👏1