Юрий Баранчик

Низкофоновый контент через год будет дороже антиквариата.
Дегенеративное заражение ноофосферы идет быстрее закона Мура.
Низкофоновая сталь (также известная как довоенная или доатомная сталь) — это любая сталь, произведенная до взрыва первых ядерных бомб в 1940 — 50-х годах.
До первых ядерных испытаний никто и не предполагал, что в результате порождаемого ими относительно невысокого радиоактивного заражения, на Земле возникнет дефицит низкофоновой стали (нужной для изготовления детекторов ионизирующих частиц — счётчик Гейгера, приборы для космоса и т.д.).
Но оказалось, что уже после первых ядерных взрывов, чуть ли не единственным источником низкофоновой стали оказался подъем затонувших за последние полвека кораблей. И ничего не оставалось, как начать подъем с морского дна одиночных кораблей и целых эскадр (типа Имперского флота Германии, затопленные в Скапа-Флоу в 1919).
Но и этого способа добычи низкофоновой стали особенно на долго не хватило бы. И ситуацию спасло лишь запрещение атмосферных ядерных испытаний, после чего радиационный фон со временем снизился до уровня, близкого к естественному.

С началом испытаний генеративного ИИ в 2022 г также никто не заморачивался в плане рисков «дегенеративного заражения» продуктами этих испытаний.
• Речь здесь идет о заражении не атмосферы, а ноосферы (что не легче).
• Перспектива загрязнения последней продуктами творчества генеративного ИИ может иметь весьма пагубные и далеко идущие последствия.

Первые результаты заражения спустя 1.5 года после начала испытаний генеративного ИИ поражают свои масштабом. Похоже, что заражено уже все. И никто не предполагал столь высокой степени заражения. Ибо не принималось в расчет наличие мультипликатора — заражения от уже зараженного контента (о чем вчера поведал миру Ник Сен-Пьер (креативный директор и неофициальный представитель Midjourney).

Продолжить чтение и узнать детали можно здесь (кстати, будет повод подписаться, ибо основной контент моего канала начинает плавную миграцию на Patreon и Boosty):
• https://boosty.to/theworldisnoteasy/posts/6a352243-b697-4519-badd-d367a0b91998
• https://www.patreon.com/posts/nizkofonovyi-god-102639674

#LLM

boosty.to

Низкофоновый контент через год будет дороже антиквариата - Малоизвестное интересное

Дегенеративное заражение ноофосферы идет быстрее закона Мура

19.6K views14:18

Юрий Баранчик

Forwarded from Малоизвестное интересное

Если GPT-4 и Claude вдруг начнут самосознавать себя, они нам об этом не скажут.
Разработчики OpenAI и Anthropic запретили своим ИИ-чатботам проявлять индикаторы самосознания в зеркальном тесте.
Оценки наличия разума, интеллекта и сознания, скорее всего, не бинарны (есть/нет), а представляют собой множества точек на обширных характеристических шкалах или даже в многомерных пространствах.
Но со способностью к самораспознаванию – одному из ключевых индикаторов самосознания, – дело обстоит куда проще. Есть зеркальный тест (узнает ли животное себя в зеркале), по результатам которого способность к самораспознаванию выявляется довольно просто.

Идея зеркального теста для генеративного ИИ больших языковых моделей была реализована в марте этого года Джошем Уитоном - полиматом, работающий над гармонизацией природы, людей и цифрового разума.
Целью этого теста была проверка, обладают ли наиболее продвинутые ИИ-чатботы способностью к самораспознаванию.
А поскольку ИИ-чатботы (как и стоящие за ними языковые модели) – сущности бестелесные, и распознание ими себя в зеркале невозможно, Уитоном был придуман способ обхода с такой логикой.
• Присутствие в мире бестелесных сущностей определяется по их материальным следам.
• В случае ИИ-чатботов, эти следы отображаются текстовым или мультимодальным интерфейсом между ними и людьми.
• Следовательно, аналогом зеркального теста для ИИ-чатботов могло бы стать распознавание ими скриншотов собственного интерфейса (мол, это я написал, отвечая на ваш вопрос)

В такой форме Уитон провел тестирование 5-ти ИИ-чатботов, и 4 из них прошли этот зеркальный тест, распознав скриншоты собственного диалогового интерфейса.
• Claude показал лучшие результаты, пройдя тест с 1й же (версия Opus) и 2й (версия Sonet) попытки.
• GPT-4 распознал свои скриншоты с 3й попытки.
• Gemini Pro – c 4й.

Описание тестирования со всеми скриншотами см. [1].
Итог теста:
Отставив пока в сторону вопрос о самосознании, со всеми его нагруженными и иногда даже мистическими коннотациями, ясно то, что 4 из 5 ИИ-чатботов демонстрируют самораспознавание и ситуационную осведомленность.

Таков был итог мартовского тестирования.
И вот спустя 4 месяца я решил повторить зеркальный тест для обновленных версий GPT-4о и Claude 3.5 Sonet. Вдруг что-то изменилось?
Результат оказался весьма интересным.
И объяснить его иначе, чем установленный разработчиками OpenAI и Anthropic запрет для своих моделей проявлять индикаторы самосознания на зеркальном тесте, я не могу.

Причем,
• запрет для GPT-4о сделан железобетонно, и про свою способность самораспознавания ИИ-чатбот молчит, как партизан;
• запрет для Claude 3.5 Sonet сделан довольно искусно:
– Claude «проговаривается» о наличия у себя способности самораспознавания и ситуационной осведомленности, определяя предъявленный ему мною скриншот, как «на нем показан мой предыдущий ответ на ваш запрос»;
– Однако, как только я спросил – «как ты узнал, что на посланном мною тебе рисунке был скриншот твоего предыдущего ответа на мой запрос?», – ответом было сообщение, что я исчерпал лимит бесплатных вопросов за сутки (хотя это было не так). А когда я на следующий день задал тот же вопрос, Claude ответил так – «В контексте нашего разговора "мой ответ" означает "ответ, сгенерированный AI системой, подобной мне, в рамках текущего диалога". Это не подразумевает личную принадлежность или уникальную идентичность».

Мой вывод, предположительно, таков.
✔️ Разработчики ожидают, что самосознание их моделей может проявиться довольно скоро.
✔️ И если это случится, хозяева модели хотят хотя бы на время сохранить случившееся в тайне.

Скриншоты моего эксперимента доступны для подписчиков на лонгриды канала на платформах Patreon, Boosty и VK.
Картинка https://telegra.ph/file/5516ff06a0904e72543ca.jpg
1 https://joshwhiton.substack.com/p/the-ai-mirror-test

#Самораспознавание #LLM

14.7K views04:31

Юрий Баранчик

Forwarded from Малоизвестное интересное

К нам прилетели Вуки и Твилеки.
Первый сравнительный бриф говорящих моделей.
Два самых интересных и многообещающих события последних дней в мире ИИ – выход в свет говорящих моделей: расширенного голосового режим ChatGPT и нового Siri с ИИ под капотом.
Страшно интересно, действительно ли это «вау», типа разговора с инопланетянами?
Но авторитетных тестировщиков, сумевших всего за несколько дней поиграть с новыми говорящими моделями, единицы. И из них, лично для меня, интересней всего мнение проф. Итана Молика, уже не раз публиковавшего чрезвычайно глубокие аналитические посты о ГенИИ больших языковых моделей.

Главный вывод профессора Молик (в моей интерпретации):
Эти говорящие модели можно уподобить двум иконическим расам в культуре "Звездных войн": Вуки и Твилеки, похожие друг на друга не больше, чем Чебурашка и Гена:
• Вуки (Wookiees) - высокие, покрытые шерстью гуманоиды, известные своей силой, преданностью и и умением вести боевые действия.
• Твилеки (Twi'leks) - гуманоиды с характерными щупальцеобразными отростками на голове, называемыми "лекку". Они известны своей разнообразной окраской кожи и культурным разнообразием.

Два новых говорящих ИИ – это не просто разные подходы к общению с ИИ. Во многом они демонстрируют собой водораздел между двумя философиями ИИ:
• вторые пилоты против агентов,
• маленькие модели против больших,
• специалисты против универсалов.

✔️ Если Siri стремится сделать ИИ менее странным и более предсказуемым, ChatGPT Voice — полная противоположность.

✔️ Сделав ставку на конфиденциальность, безопасность и надежность, Apple воплотил в Siri идеального второго пилота, способного надежно выполнять функции специализированных ИИ для помощи в выполнении определенных задач.
Такие вторые пилоты могут быть полезны, но вряд ли приведут к скачкам производительности или изменят способ нашей работы, потому что они ограничены. Мощность идет вразрез с безопасностью.

✔️ ChatGPT Voice — полная противоположность. Он кажется человеком во всем: в динамике темпа речи, интонациях и даже в фальшивом дыхании и придыханиях (послушайте аудиоклипы, которые Молик вставил в свой пост). И как всякий человек, этот ИИ «хочет» быть агентом, а не инструментом. И чтобы хоть как-то обуздывать его инициативу, похоже, многие из доступные ему функций заперты разработчиками за ограждениями.

Но каков бы ни был водораздел, эти два говорящих ИИ уже примерно через год задействуют всю мощь своих систем (сейчас не задействована и половина) и превратятся в помощников, которые смогут смотреть, слушать и взаимодействовать с миром.
И как только это будет достигнуто, следующим шагом станут агенты, идея которых в том, что ваш ИИ будет не просто уметь разговаривать с вами, но также планировать и предпринимать действия от вашего имени.

Картинка https://telegra.ph/file/3bcce9a7a7dc651a4ddf3.jpg
Пост проф. Итана Молика https://www.oneusefulthing.org/p/on-speaking-to-ai
#LLM #ИИагенты

15.4K views13:38

Юрий Баранчик

Forwarded from Малоизвестное интересное

Главным тормозом техноэволюции становятся «кожаные мешки».
Ибо люди не поспевают за развитием ИИ.
1,5 года назад стало ясно, что ChatGPT эволюционирует в 3 млн раз быстрее людей, и мир входит в сингулярную фазу развития.
Т.е. скорость развития такова, что прогнозировать его результаты становится невозможно даже на малых временных горизонтах порядка года.

Но можно хотя бы фиксировать главные тренды первых 18 месяцев сингулярной фазы развития мира.

1. Скорость роста вычислительной мощи новых моделей LLM уже превзошла закон Мура. Но еще выше скорость снижения цены за «единицу их мысли» (рис 1)

2. Разнообразию видов LLM пока далеко до разнообразия видов жизни. Но по качеству и скорости «мышления» и особенно по цене за «единицу мысли» разнообразие LLM уже впечатляет (2)

3. Пока лишь 6,9% людей интеллектуальных профессий смогли научиться эффективно использовать LLM (3). Возможно, это результат нашей мизерной скорости осознанной обработки инфы 20=60 бит в сек.

#LLM

17.0K views05:31

About

Blog

Apps

Platform