Forwarded from AAIC
📣 مجموعه کارگاه های آموزشی هوش مصنوعی
🔹 توسعه سرویسهای هوش مصنوعی مبتنی بر ChatGPT
🔹 الزامات راهاندازی و رشد نمایی در دنیای استارتاپ هوش مصنوعی
🔹 پردازش و بازشناسی گفتار
🔹 یادگیری تقویتی عمیق با ترنسفورمر برای مدیریت سبد کریپتو
🔹 زمان برگزاری کلیه کارگاه ها: چهارشنبه 7 آذر 1403 ساعت 10 الی 15
🔹 مهلت ثبت نام: سه شنبه 6 آذر 1403
🔹 محل برگزاری: دانشگاه صنعتی امیرکبیر
🔹 هزینه ثبت نام هر کارگاه: 200 هزار تومان
جهت ثبت نام و کسب اطلاعات بیشتر به بخش رویدادهای وبسایت مسابقات مراجعه کنید.
https://aaic.aut.ac.ir/#events
@aaic_aut
🔹 توسعه سرویسهای هوش مصنوعی مبتنی بر ChatGPT
🔹 الزامات راهاندازی و رشد نمایی در دنیای استارتاپ هوش مصنوعی
🔹 پردازش و بازشناسی گفتار
🔹 یادگیری تقویتی عمیق با ترنسفورمر برای مدیریت سبد کریپتو
🔹 زمان برگزاری کلیه کارگاه ها: چهارشنبه 7 آذر 1403 ساعت 10 الی 15
🔹 مهلت ثبت نام: سه شنبه 6 آذر 1403
🔹 محل برگزاری: دانشگاه صنعتی امیرکبیر
🔹 هزینه ثبت نام هر کارگاه: 200 هزار تومان
جهت ثبت نام و کسب اطلاعات بیشتر به بخش رویدادهای وبسایت مسابقات مراجعه کنید.
https://aaic.aut.ac.ir/#events
@aaic_aut
Forwarded from Deep learning channel
📊 میزان (MIZAN): جامعترین لیدربورد ارزیابی مدلهای زبانی بزرگ (LLM) در زبان فارسی
پس از عرضه بنچمارک FaMTEB برای ارزیابی مدلهای Text Embedding، اینبار دستاوردی تازه در پردازش زبان طبیعی فارسی
✅ برخی ویژگی های میزان:
- مقایسه جامع مدلهای روز: ارزیابی دقیق مدلهای متنباز و بسته با هدف ایجاد یک مرجع معتبر برای فارسیزبانان
- پوشش ۶ بنچمارک تخصصی: سنجش عملکرد مدلها در چت، پیروی از دستورالعمل، NLU، NLG، استدلال منطقی و دانش عمومی
- تنوع کاربردی بالا: سناریوهای واقعی فارسی مانند گفتوگوی چندمرحلهای، RAG، تولید محتوا و پاسخگویی منطقی
🏆 بنچمارکهای کلیدی میزان:
Persian MT-Bench: ارزیابی چت چندمرحلهای و کاربرد در سیستمهای RAG
Persian IFEval: بررسی توانایی مدلها در پیروی از دستورالعملها
PerCoR: اولین بنچمارک استدلال منطقی در زبان فارسی
PerMMLU: سنجش دانش عمومی و تخصصی مدلها در موضوعات متنوع در زبان فارسی
Persian NLU: ارزیابی درک زبان طبیعی فارسی
Persian NLG: ارزیابی تولید زبان طبیعی فارسی
🔗 لینک لیدربورد میزان
📖 مقاله معرفی میزان
🔗 بنچمارک FaMTEB
@irandeeplearning
پس از عرضه بنچمارک FaMTEB برای ارزیابی مدلهای Text Embedding، اینبار دستاوردی تازه در پردازش زبان طبیعی فارسی
✅ برخی ویژگی های میزان:
- مقایسه جامع مدلهای روز: ارزیابی دقیق مدلهای متنباز و بسته با هدف ایجاد یک مرجع معتبر برای فارسیزبانان
- پوشش ۶ بنچمارک تخصصی: سنجش عملکرد مدلها در چت، پیروی از دستورالعمل، NLU، NLG، استدلال منطقی و دانش عمومی
- تنوع کاربردی بالا: سناریوهای واقعی فارسی مانند گفتوگوی چندمرحلهای، RAG، تولید محتوا و پاسخگویی منطقی
🏆 بنچمارکهای کلیدی میزان:
Persian MT-Bench: ارزیابی چت چندمرحلهای و کاربرد در سیستمهای RAG
Persian IFEval: بررسی توانایی مدلها در پیروی از دستورالعملها
PerCoR: اولین بنچمارک استدلال منطقی در زبان فارسی
PerMMLU: سنجش دانش عمومی و تخصصی مدلها در موضوعات متنوع در زبان فارسی
Persian NLU: ارزیابی درک زبان طبیعی فارسی
Persian NLG: ارزیابی تولید زبان طبیعی فارسی
🔗 لینک لیدربورد میزان
📖 مقاله معرفی میزان
🔗 بنچمارک FaMTEB
@irandeeplearning