howtocomply_AI: право и ИИ

Исследователи из Ada Lovelace Institute опубликовали отчет об оценке фундаментальных моделей ИИ

Группа исследователей из Ada Lovelace Institute подготовила большой отчет, в котором они проанализировали то, насколько эффективны существующие методы оценки фундаментальных моделей ИИ.

Исследование было проведено на основе опроса 16 экспертов, представляющих разработчиков, внешних оценщиков и аудиторов, научные организации и гражданское общество.

Авторы пришли к следующим основным выводам:

1. Существующие методы оценки помогают лучше понимать особенности работы фундаментальных моделей, но недостаточно эффективны для обеспечения безопасности. Авторы выделили три группы проблем проведения оценок моделей: теоретические, социальные, технико-внедренческие. Более подробно проблемы описаны на скриншоте.

2. Для обеспечения безопасности оценки должны сопровождаться другими методами, такими как кодексы практики, отчеты об инцидентах и пост-рыночный мониторинг. В частности, авторы предлагают многослойный подход к AI Governance, в котором уменьшение рисков будет достигаться за счет использования разного набора методов на протяжении всего жизненного цикла моделей ИИ. Интересно, что объясняют они его на примере сыра с дырками: в разных кусочках сыра расположение дырок отличается. Значит, и шанс их совпадения на всем протяжении уменьшается. Подход нельзя назвать новым, но визуализация достойная 🤩.

3. Существующие методы оценки, такие как метод красных команд и бенчмаркинг, также имеют технические и практические ограничения. Например, разработчики могут повлиять на результаты оценки или выбрать только те методы, которые для них наиболее выгодны. То есть нужны единые одобренные госорганами критерии и схемы сертификации.

4. Результаты оценки валидны только для конкретной версии модели. Любые изменения или тонкая настройка могут существенно повлиять на полученные в ходе оценки данные.

5. Оценки моделей не могут происходить в вакууме. Для обеспечения безопасности важно учитывать сценарии, условия и контекст, в которых модель будет использоваться.

В отчете содержится масса иной полезной информации о самих фундаментальных моделях ИИ и рисках их разработки и функционирования. Так что смело можно его начинать читать, даже если нет глубоких знаний предмета. Все изложено очень доступным языком.

Также недавно я разбирал прошлое исследование команды Института о практике реализации внешних независимых аудитов систем ИИ.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

437 viewsDmitry Kuteynikov, 16:28