ForkLog AI

Alibaba запустила группу больших языковых моделей (LLM) с упором на математику Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области.

Новые ИИ-модели протестированы на математических задачах на английском и китайском языках. Они включали:

▫️ GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
▫️ OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
▫️ GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.

Подробнее: https://forklog.com/?p=238738

#Alibaba #Qwen2

3.0K views09:06

About

Blog

Apps

Platform