Alibaba запустила группу больших языковых моделей (LLM) с упором на математику Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области.
Новые ИИ-модели протестированы на математических задачах на английском и китайском языках. Они включали:
▫️ GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
▫️ OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
▫️ GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.
Подробнее: https://forklog.com/?p=238738
#Alibaba #Qwen2
Новые ИИ-модели протестированы на математических задачах на английском и китайском языках. Они включали:
▫️ GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
▫️ OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
▫️ GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.
Подробнее: https://forklog.com/?p=238738
#Alibaba #Qwen2