کارگروه کلان‌داده - دانشگاه صنعتی شریف

Forwarded from AAIC

📣 مجموعه کارگاه های آموزشی هوش مصنوعی

🔹 توسعه سرویس‌های هوش مصنوعی مبتنی بر ChatGPT
🔹 الزامات راه‌اندازی و رشد نمایی در دنیای استارتاپ هوش مصنوعی
🔹 پردازش و بازشناسی گفتار
🔹 یادگیری تقویتی عمیق با ترنسفورمر برای مدیریت سبد کریپتو

🔹 زمان برگزاری کلیه کارگاه ها: چهارشنبه 7 آذر 1403 ساعت 10 الی 15
🔹 مهلت ثبت نام: سه شنبه 6 آذر 1403
🔹 محل برگزاری: دانشگاه صنعتی امیرکبیر
🔹 هزینه ثبت نام هر کارگاه: 200 هزار تومان

جهت ثبت نام و کسب اطلاعات بیشتر به بخش رویدادهای وبسایت مسابقات مراجعه کنید.
https://aaic.aut.ac.ir/#events
@aaic_aut

542 viewsKhalooei, 15:55

Forwarded from Deep learning channel

📊 میزان (MIZAN): جامع‌ترین لیدربورد ارزیابی مدل‌های زبانی بزرگ (LLM) در زبان فارسی

پس از عرضه بنچمارک FaMTEB برای ارزیابی مدل‌های Text Embedding، این‌بار دستاوردی تازه‌ در پردازش زبان طبیعی فارسی

✅ برخی ویژگی های میزان:
- مقایسه جامع مدل‌های روز: ارزیابی دقیق مدل‌های متن‌باز و بسته با هدف ایجاد یک مرجع معتبر برای فارسی‌زبانان
- پوشش ۶ بنچمارک تخصصی: سنجش عملکرد مدل‌ها در چت، پیروی از دستورالعمل، NLU، NLG، استدلال منطقی و دانش عمومی
- تنوع کاربردی بالا: سناریوهای واقعی فارسی مانند گفت‌وگوی چندمرحله‌ای، RAG، تولید محتوا و پاسخ‌گویی منطقی

🏆 بنچمارک‌های کلیدی میزان:
Persian MT-Bench: ارزیابی چت چندمرحله‌ای و کاربرد در سیستم‌های RAG
Persian IFEval: بررسی توانایی مدل‌ها در پیروی از دستورالعمل‌ها
PerCoR: اولین بنچمارک استدلال منطقی در زبان فارسی
PerMMLU: سنجش دانش عمومی و تخصصی مدل‌ها در موضوعات متنوع در زبان فارسی
Persian NLU: ارزیابی درک زبان طبیعی فارسی
Persian NLG: ارزیابی تولید زبان طبیعی فارسی

🔗 لینک لیدربورد میزان

📖 مقاله معرفی میزان

🔗 بنچمارک FaMTEB

@irandeeplearning

270 views19:17

About

Blog

Apps

Platform