Forwarded from یادگیری ماشین
مجموعه دادهی فارستیل (FarsTail) بعنوان اولین مجموعه دادهی فارسی برای مسئلهی استنتاج زبانی با بیش از ۱۰۰۰۰ نمونه در قالب یک پروژه ۲ ساله توسط یک تیم ۶ نفره در آزمایشگاه دادهکاوی و یادگیری ماشین دانشگاه قم تهیه شده است. برای اطمینان از کیفیت فارستیل، مراحل تهیهی داده براساس مجموعه دادههای معتبر بینالمللی (مانند SciTail) انجام شده و چند مرحله پاکسازی و برچسبزنی مجدد صورت پذیرفته است.
مقاله در آرکایو:
https://arxiv.org/pdf/2009.08820.pdf
لینک در paperswithcode:
https://paperswithcode.com/sota/natural-language-inference-on-farstail
دانلود داده برای کارهای غیرتجاری:
https://github.com/dml-qom/FarsTail
مقاله در آرکایو:
https://arxiv.org/pdf/2009.08820.pdf
لینک در paperswithcode:
https://paperswithcode.com/sota/natural-language-inference-on-farstail
دانلود داده برای کارهای غیرتجاری:
https://github.com/dml-qom/FarsTail
Paperswithcode
Papers with Code - FarsTail Benchmark (Natural Language Inference)
The current state-of-the-art on FarsTail is mBERT. See a full comparison of 10 papers with code.