Технозаметки Малышева

Jan Leike, OpenAI (MIT AI Event)

Jan Leike из OpenAI обсуждает вопросы возможного появления суперинтеллекта в течение следующего десятилетия и сложности, связанные с проблемой выравнивания AI, то есть обеспечением того, чтобы системы искусственного интеллекта служили интересам человека.

Чтобы достичь это, он предлагает несколько подходов.

Один из них - AI-поддерживаемая обратная связь по достижениям, которая подразумевает обучение моделей помогать людям в таких задачах, как поиск багов в коде.

Другой подход - обучение меньших моделей, которые будут контролировать более крупные модели для повышения выравнивания.

Также важно внедрение техник валидации, включая автоматизированные контрастные объяснения и адверсарное тестирование с подкапывающими моделями.

Цель состоит в решении проблемы выравнивания суперинтеллекта в течение следующих 3 лет и 8 месяцев.

Чтобы достичь этого, необходимо привлечение и информирование общественности, включая привлечение AI-экспертов к обсуждению и контролю за разработчиками AI.

Leike призывает присоединиться к исследовательским группам по выравниванию или другим AI-лабораториям, чтобы внести свой вклад в исследования в области выравнивания.

#ArtificialIntelligence #AlignmentResearch #Superintelligence

42 viewsedited 19:01

About

Blog

Apps

Platform