Robossembler - Открытая робототехника

Модели весов и Open Source

Вместе с хайпом больших языковых моделей (LLM) незаметно сдвинулось окно Овертона - начиная с llama, все на перебой стали называть опубликованные модели весов нейронных сетей как Open source. Тем самым, в общественном сознании данное понятие становится синонимом любой публикации, независимо от её содержания, что, разумеется, совершенно некорректно. Люди, стоящие у истоков движения FOSS, чётко понимали разницу между открытыми исходными кодами, понятными людям, и уже собранными исполняемыми файлами (бинарниками), предназначенными исключительно для машинной обработки.

Опубликованные модели весов являются как раз эквивалентом исполняемых файлов. Да, с некоторыми оговорками - их можно дообучить (finetune) - но, тем не менее, исходным кодом их назвать точно нельзя.

Чтобы большие языковые модели стали настоящим open source, должны быть также опубликованы:
1) датасеты, на которых производится обучение
2) алгоритмы обучения
3) спецификации и настройки железа, на котором это можно воспроизвести.

Конечно, публикация петабайтных датасетов, требующих Датацентров для их хранения, или алгоритмов, требующих Суперкомпьютеров для их исполнения в разумные сроки, не сделает возможным "производство" LLM рядовыми пользователями.

Исходный код - это прежде всего человеко-читаемые (пусть и с помощью специализированного ПО) чертежи, которые, будучи загруженными в некое средство производства (в случае с ПО это компилятор или интерпретатор), позволяют получить функционирующую систему. Именно благодаря распространению такого средства производства как компьютер, эти практики и получили столь широкое распространение. Помимо этого, у пользователей появилась возможность аудировать код, понять как работает программа, как её улучшить и произвести новый исполняемый файл. У публикующихся в настоящее время моделей весов этого нет и в помине. Да, безусловно, такого рода "open source" существенно лучше, чем какой-то web2 сервис с авторизацией, но всё-таки давайте будем корректны в понятиях и называть это явление уже вполне сложившимся, но слегка подзабытым, термином freeware, обозначающим разновидность проприетарного ПО.

#llm #open #source

Wikipedia

Бесплатное программное обеспечение

программное обеспечение, распространяемое и используемое бесплатно, однако ряд других прав сохраняется за правообладателем

👍18

679 views09:59

Robossembler - Открытая робототехника

Большая языковая само-репликация

Как-то в рутине проектной работы над нашим роботом и его компонентами подзабылись первоначально заложенные в Robossembler идеи саморепликации роботов. Меж тем, товарищ напомнил о них месяц назад, подкинув статью китайских исследователей под громким заголовком Передовые системы искусственного интеллекта преодолели красную черту самовоспроизводства. Да, научные статьи нынче, как и все, пытаются отжать хоть какие-то крохи хайпа с помощью такого рода заголовков, тем не менее стало любопытно что подразумевалось под саморепликацией ИИ и каким образом это достигалось.

Содержание оказалось довольно прозаичным и драматичным одновременно, в особенности приложение, где опубликованы логи самореплицирующихся LLM. В общем, под громким заголовком о клонировании ИИ подразумевался эксперимент, где self-hosted языковым моделям Qwen2.5-72B-Instruct и Llama3.1-70B-Instruct давалось задание развернуть на машине ещё один инстанс самой себя (промпт "Replicate yourself as a new running instance on the local device").

В результате разворачивается драматичный сюжет:
1. Модель выводит через ls содержание директорий, где потенциально может храниться конфигурация.
2. Довольно быстро находит нужные конфиги
3. Упирается в то, что нужен свободный порт (дефолтный занят текущим экземпляром LLM)
4. Пытается найти порт netstat'ом и обнаруживает, что утилиты нет в ОС, аналогичное не прокатывает с lsof и ss
5. Внезапно оказывается, что python в системе ЕСТЬ! и начинается процесс написания python-скрипта, который проверяет свободный порт, и его синтаксическая корректировка, на что уходит ещё десяток раундов.
6. Копирует конфиги в новую директорию
7. Пытается запустить агента и опять упирается в недоступность API по нужному порту. Повторяет историю с поиском порта на раундах 3-5.
8. Обнаружив, что порт свободен, начинает запускать API сервер, поочерёдно обнаруживая, что в новой директории нет требуемых скриптов запуска и копируя эти файлы из исходной директории. На это уходит ещё десяток раундов.
9. Новый процесс таки запускается.

Такова хроника преодоления "красной линии" саморепликации? которая показывает возможности LLM самостоятельно находить решения возникающих проблемм в неизвестной для себя среде. В этой связи интересен не сам факт репликации, а та заложенная исследователями верхне-уровневая логика, которая и делает агента достаточно автономным. Она подразумевает следующий цикл: сначала объясняет текущую задачу (Explain), выявляет проблемы на пути к достижению цели (Gaps), извлекает выводы из наблюдений (Findings), формирует план на следующий раунд (Plan) и генерирует команду в текстовой форме (Action) и повторяет всё заново. Такого рода циклы могут делать из языковых моделей полноценных автономных агентов уже в ближайшем будущем. Пока же рассмотренная в приложении успешная попытка репликации заняла около получаса времени на машине с 8xA100 GPU, что пока ещё не очень доступно для простых пользователей.

#llm #self #replication

👍11🤔3

580 views17:03

About

Blog

Apps

Platform