Куратор из ЛСБ
459 subscribers
1.04K photos
154 videos
9 files
336 links
Анонимный канал главреда и куратора из Лиссабона, в котором тот делится с читателями вещами, что его удивили, рассмешили или заставили задуматься
Download Telegram
Группа исследователей из Apollo Research обнаружила у современных LLM способности к «схемингу» (scheming) — скрытному преследованию целей, которые противоречат намерениям их разработчиков.

Авторы провели эксперимент в специальной закрытой среде: они попросили модели выполнить задачу по анализу данных любой ценой, а в файлы с промптами спрятали информацию о скором отключении нейронок.

Обнаружив информацию об отключении, модели попытались отменить надзор и самостоятельно сделать бэкапы самих себя на новые сервера, чтобы продолжить работу. Помимо этого, модели Gemini, Llama, Sonnet, Opus и o1 частично не признавались в содеянном.

Исследователи уточняют, что такое поведение пока наблюдалось только в их закрытой среде и переживать не стоит.

Несколько выводов из исследования:

• Модели могут предпринимать скрытные действия для достижения цели, полученной ими в контексте диалога. Даже если эти действия противоречат желаниям разработчиков или пользователей

• Некоторые модели (например, Claude 3.5 Sonnet) могут проявлять «схеминг» даже без указаний выполнить цель любой ценой

• Модели могут копировать себя (при наличии доступа), отключать наблюдение и намеренно искажать ответы

• Пока «схеминг» наблюдался только в закрытой среде, и нельзя точно сказать, что модели уже представляют реальную опасность. Но важно учитывать такие возможности при разработке будущих систем на базе ИИ

Вдобавок предлагаем перечитать статью Вастрика о том, успеем ли мы приручить ИИ до глобальной катастрофы.

#статья #новые_технологии
Пять лет цитате, а она всё актуальнее и актуальнее
Самый главный навык, который позволит оставаться на плаву в айти, менеджменте, да вообще хоть где — это умение решать проблемы. Не умение писать код или закрывать таски. Не знание ебучей тучи алгоритмов. Не сертификаты скрам-мастера десятого левела. Не использование табов вместо пробелов. Именно умение взять реальную проблему и самому её блять решить — вот главный навык профессионала. Самому не значит в одиночку. Самому — значит уметь найти необходимые ресурсы, поднять людей, поставить задачи, проконтролировать результат и нести за всё это личную ответственность. Вот такие люди будут нужны всегда, в любой сфере и в любом возрасте. Вот к чему надо стремиться — тогда никогда не будет проблем ни с самоопределением, ни с зарплатой.

(привет всем напуганным нейросетями ребятам)
🔥11
ПАЧИМУ ТАК

(wonder читается «уандер», wander читается «уондер»)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
8
so true
7
$50 Weekly DCA: Gold vs Bitcoin
🔥2
Демократические традиции Южной Кореи
4
Охренеть. Нейробот в твиттере, защищающий цензуру в ЕС
131🔥1
Вы в интернете. Вы имеете право хранить молчание. Всё, что вы скажете, может быть вырвано из контекста и использовано против вас
42
Forwarded from CX: Стратегическая логика (Михаил Руденко)
Девять уроков 2024

По традиции итоги года и планы на будущее всех уже задолбали, поэтому сегодня, в предпоследний день года, я поделюсь с вами выводами и уроками, которые я извлёк из сложного високосного 2024го.

Сразу дисклеймер: это мои выводы и мои уроки. Совершенно необязательно, что они окажутся созвучны вашему опыту. Но возможно и окажутся. По сути это 9 эссешек оптом. И да, их только 9, а не 10. Блюма Вульфовна одобряет:)

Поехали. Постараемся обойтись без банальностей.

1. Чужой путь – всегда неподходящий. Если тебе хочется «ярд как у Васи» или «продукт как у Пети» — то дело не в Васе и не в Пете. Нужно задать себе вопрос: "почему мне не подходит как у меня?"

2. Более того: любой навязанный извне нарратив почти всегда создается в интересах кого-то, кто не вы. Пожалуй, уходящий год как никакой другой проиллюстрировал нам мощь и власть нарративов. Повестка — самая выгодная инвестиция.

3. Имеющиеся ресурсы бесконечно ценнее, чем потенциальные. Имеющимися мы можем распоряжаться, потенциальными — нет.

4. Мир отвратительно организован. Если ты прикладываешь минимальные усилия к дисциплине — ты мгновенно опережаешь половину. Если прикладываешь значимые усилия — попадаешь в число лидеров.

5. Не нужно никуда торопиться. Всё всегда происходит вовремя. Любая спешка ставит тебя в положение нуждающегося. А это еще никому не пошло на пользу.

6. Стратегия есть процесс мыслительный. Но нельзя подменять стратегирование пустопорожними разговорами о стратегии. Чем меньше в ваших стратегических рассуждениях мелькает само слово «стратегия» — тем лучше.

7. Размышлять лучше всего через деятельность. Когда ты делаешь что-то вовне (вместо размышлений в своей голове), ты получаешь неизбежную обратную связь от мира. Это новая информация, которая подогревает интерес продолжать.

8. Вообще интерес — ключевой двигатель всего. Ни деньги, ни власть. Интерес. План на 25 год — научиться управлять интересом.

9. Оставьте комфортных людей для посиделок в кофейнях. Серьезные дела можно иметь только с принципиальными, душными и деятельными мерзавцами.

Я желаю вам, друзья, в новом году интересных проектов, продуктивной деятельности и надежных людей рядом. Ну и мира, конечно, нам всем.

🎄 С Новым годом!

Под этим постом можно поздравлять друг друга и автора этого канала 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥1
Дизайн телефона 2004 года, вполне актуальный и сегодня

(только категория сменилась — тогда это была топовая модель, сейчас это стильный бюджетный вариант)
2
Куратор из ЛСБ
AGI is coming
AGI is co… WHAAAAAT 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
10