Jan Leike, OpenAI (MIT AI Event)
Jan Leike из OpenAI обсуждает вопросы возможного появления суперинтеллекта в течение следующего десятилетия и сложности, связанные с проблемой выравнивания AI, то есть обеспечением того, чтобы системы искусственного интеллекта служили интересам человека.
Чтобы достичь это, он предлагает несколько подходов.
Один из них - AI-поддерживаемая обратная связь по достижениям, которая подразумевает обучение моделей помогать людям в таких задачах, как поиск багов в коде.
Другой подход - обучение меньших моделей, которые будут контролировать более крупные модели для повышения выравнивания.
Также важно внедрение техник валидации, включая автоматизированные контрастные объяснения и адверсарное тестирование с подкапывающими моделями.
Цель состоит в решении проблемы выравнивания суперинтеллекта в течение следующих 3 лет и 8 месяцев.
Чтобы достичь этого, необходимо привлечение и информирование общественности, включая привлечение AI-экспертов к обсуждению и контролю за разработчиками AI.
Leike призывает присоединиться к исследовательским группам по выравниванию или другим AI-лабораториям, чтобы внести свой вклад в исследования в области выравнивания.
#ArtificialIntelligence #AlignmentResearch #Superintelligence
Jan Leike из OpenAI обсуждает вопросы возможного появления суперинтеллекта в течение следующего десятилетия и сложности, связанные с проблемой выравнивания AI, то есть обеспечением того, чтобы системы искусственного интеллекта служили интересам человека.
Чтобы достичь это, он предлагает несколько подходов.
Один из них - AI-поддерживаемая обратная связь по достижениям, которая подразумевает обучение моделей помогать людям в таких задачах, как поиск багов в коде.
Другой подход - обучение меньших моделей, которые будут контролировать более крупные модели для повышения выравнивания.
Также важно внедрение техник валидации, включая автоматизированные контрастные объяснения и адверсарное тестирование с подкапывающими моделями.
Цель состоит в решении проблемы выравнивания суперинтеллекта в течение следующих 3 лет и 8 месяцев.
Чтобы достичь этого, необходимо привлечение и информирование общественности, включая привлечение AI-экспертов к обсуждению и контролю за разработчиками AI.
Leike призывает присоединиться к исследовательским группам по выравниванию или другим AI-лабораториям, чтобы внести свой вклад в исследования в области выравнивания.
#ArtificialIntelligence #AlignmentResearch #Superintelligence