Для анализа применялись два бенчмарка NaïveJudge и HumanEval, разработанных для оценки и ранжирования мастерства ИИ-моделей в генерации кода для смарт-контрактов. Результат нейросетей оценивался на основе «строгих критериев».
Подробнее: https://forklog.com/?p=243595
#GPT4o #код #программирование #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM