РОМАН КАЗАКОВ

Товарищ подкинул интересный препринт о возможностях современных нейросетей в программировании. Сказать, что впечатляет, - ничего не сказать.

ChatGPT o3 от OpenAI прошла отбор на золото Международной олимпиады по информатике (IOI 2024) и получила топовый рейтинг на CodeForces – площадке, где соревнуются лучшие программисты мира. Модель самостоятельно разрабатывает стратегии решения задач, самостоятельно анализирует код, самостоятельно проверяет свои решения и даже учится на своих ошибках – без какой-либо помощи программистов!

Что получилось:

1. На CodeForces o3 получил рейтинг 2724 (это 99,8-й процентиль) – это уровень лучших программистов мира (примерно топ-200 среди людей).
2. На IOI 2024 он превзошел половину участников, а если бы ему дали больше попыток, он получил бы золотую медаль.

Как было:

Раньше AlphaCode от Google работал по принципу: 1. Делаем сотни тысяч решений. 2. Выбираем лучшие десять. 3. "Ручными" эвристиками от кожаных мешков выбирается финальное решение.

Как стало:

o3 от OpenAI действует иначе: 1. Пишет сложное, оптимизированное решение для задачи. 2. Затем он пишет простое решение, которое не оптимизировано, но точно правильно. Обычно это перебор всех возможных вариантов или очень медленный, но корректный алгоритм. 3. ChatGPT o3 сравнивает результаты обоих решений на тестовых примерах. Если они совпадают – значит, сложное решение, скорее всего, правильное. Если нет – модель анализирует, какие части кода привели к расхождению. 4. На основе этой информации o3 пересматривает своё сложное решение, исправляя только проблемные части, а не переписывая всё с нуля.

А выводы следующие: 1. ИИ уже не помощник, а конкурент. 2. В 90% рутинных задач кожаные мешки могут быть заменены ИИ. Инженеры смогут сосредоточиться на архитектуре, стратегиях и инновациях.

Возможно, уже в самом ближайшем будущем программистам платить будут не за код, а за то, чтобы не мешали ИИ его писать.

#будущее #нейросети #openai #deepmind

👍3🔥2👎1

260 viewsedited 04:16

РОМАН КАЗАКОВ

Интересная публикация в TIME о способностях существующих нейросетей решать задачи в области вирусологии.

Исследование показало, что современные ИИ-модели (OpenAI o3, Google Gemini 2.5 Pro, Anthropic Claude) в среднем вдвое точнее решают сложнейшие практические задачи по ведению вирусологических опытов, чем PhD-вирусологи в своих областях экспертизы.

Результаты: PhD-вирусологи - 22,1 % точности, o3 - 43,8 %, Gemini - 37,6 %

Методика: «сложные, негуглимые» сценарии. От диагностики сбоев в культивировании до оптимизации протоколов BSL-рабочих процессов.

Еще раз: ChatGPT-o3 не тренированный специально для решения таких задач дает точность в 2 раза выше, чем PhD-вирусолог.

С одной стороны это ускорение разработки вакцин и лекарств, помощь исследователям в странах с ограниченными ресурсами, автоматизированная поддержка при работе с опасными патогенами.

С другой стороны - доступ к «не-сужающим» инструкциям по созданию биоружия.

#нейросети #будущее #openai #anthropic #deepmind

🤯1

272 viewsedited 03:18

РОМАН КАЗАКОВ

Google DeepMind зарелизил AlphaEvolve - ИИ-инструмент на базе Gemini создаёт новые алгоритмы и оптимизирует существующие.

Система уже продемонстрировала прорывные результаты: улучшила алгоритм умножения матриц, который с 1969 года считался эталонным, и обновила математическое "число поцелуев" в 11 измерениях - сложную задачу теории упаковки сфер. Внутри Google AlphaEvolve помогает снижать вычислительные затраты, оптимизируя задачи в дата-центрах и ускоряя процесс планирования.

Система использует эволюционные алгоритмы: генерирует код, тестирует его эффективность и улучшает решения, создавая новые методы и подходы.

ИИ не только пишет "сам себя", он "сам себя" проверяет и улучшает. Эволюция.

#будущее #нейросети #deepmind

🔥4

176 views14:27

About

Blog

Apps

Platform