1C Code Bench
35 subscribers
1 link
бенчмарк для оценки способности LLM писать код на 1С
Download Telegram
Channel created
Channel photo updated
#1C_Code_Bench

Запустили 1C Code Bench — первый открытый бенчмарк для оценки того, как LLM-ки пишут код на 1С.

20 задач из реальной практики: запросы, табличные части, регистры, движения документов. Всё автоматизировано — подставляем код от модели в обработку, компилируем, прогоняем тесты.

Пока лидирует Claude Sonnet 4.5 с 70% успешных решений, GPT-5 внезапно на последнем месте с 30%. Базовый синтаксис модели освоили, а вот виртуальные таблицы регистров и специфику объектов платформы — пока не очень.

Код открыт, задачи можно добавлять — приглашаю контрибьютить.

🔗 https://1cbench.github.io/ - сайт проекта
🔗 https://github.com/1cbench/bench - github проекта
🔥4