OpenR: фреймворк для управления рассуждениями ИИ
Представлен OpenR - открытый фреймворк для продвинутого рассуждения с использованием больших языковых моделей.
Эффективность повышена через интеграцию поиска, обучения с подкреплением и контролем ответа.
Фокусируется на трёх направлениях: сбор данных, обучение и генерация.
Включает собственный набор данных MATH-APS и модель вознаграждения MATH-psa.
Позволяет выбирать различные базовые модели и настраивать процесс вывода.
Своего рода открытый аналог O1. 🤔💡
#OpenR #MachineLearning #ReasoningAI
———
@tsingular
Представлен OpenR - открытый фреймворк для продвинутого рассуждения с использованием больших языковых моделей.
Эффективность повышена через интеграцию поиска, обучения с подкреплением и контролем ответа.
Фокусируется на трёх направлениях: сбор данных, обучение и генерация.
Включает собственный набор данных MATH-APS и модель вознаграждения MATH-psa.
Позволяет выбирать различные базовые модели и настраивать процесс вывода.
Своего рода открытый аналог O1. 🤔💡
#OpenR #MachineLearning #ReasoningAI
———
@tsingular