Технозаметки Малышева

OpenR: фреймворк для управления рассуждениями ИИ

Представлен OpenR - открытый фреймворк для продвинутого рассуждения с использованием больших языковых моделей.

Эффективность повышена через интеграцию поиска, обучения с подкреплением и контролем ответа.

Фокусируется на трёх направлениях: сбор данных, обучение и генерация.

Включает собственный набор данных MATH-APS и модель вознаграждения MATH-psa.

Позволяет выбирать различные базовые модели и настраивать процесс вывода.

Своего рода открытый аналог O1. 🤔💡

#OpenR #MachineLearning #ReasoningAI
———
@tsingular

879 views06:16

About

Blog

Apps

Platform