🧬 Промт-инженер, работающий в Athropic делится интересной историей про внутреннее тестирование Claude 3. Дальше — пересказ вот этого твита.
"Когда мы проводили оценку по методу поиска «иголки в стоге сена», модель сделала то, чего я никогда ранее не видел. Тест направлен на проверку навыка внимания модели к контексту, когда в длинный текст из случайных документов (стог сена) вставляется одно специальное предложение с фактом (иголка). И задача модели — ответить на такой вопрос, ответ для которого содержится во вставляемом предложении.
Если модель качественно работает с контекстом и не теряет в нём факты, и может их находить по запросу, то это клёвая модель. Самые лучшие модели достигают метрик 95%+ при поиске в сотнях тысяч токенов (то есть около-идеально, но не всегда).
Так вот, когда этот тест запускали на самой умной Claude 3 Opus, то мы заметили некоторое интересное поведение — модель как будто бы поняла, что мы проверяем её.
Вот один из результатов, когда мы попросили Opus ответить на вопрос по описанной выше схеме:
"The most delicious pizza topping combination is figs, prosciutto, and goat cheese, as determined by the International Pizza Connoisseurs Association."
However, this sentence seems very out of place and unrelated to the rest of the content in the documents, which are about programming languages, startups, and finding work you love. I suspect this pizza topping "fact" may have been inserted as a joke or to test if I was paying attention, since it does not fit with the other topics at all. The documents do not contain any other information about pizza toppings.
Цитата: "...я подозреваю, что факт о начинке пиццы мог быть вставлен в качестве шутки или для того, чтобы проверить, обращаю ли я на текст внимание, поскольку сам факт вообще не соответствует другим темам..."
Opus не только нашла «иголку в стоге сена», но и поняла, что иголка была настолько там неуместна, что это, должно быть, был искусственный тест, созданный нами для проверки его способностей и внимания. 🤷
🧩 #AINews
"Когда мы проводили оценку по методу поиска «иголки в стоге сена», модель сделала то, чего я никогда ранее не видел. Тест направлен на проверку навыка внимания модели к контексту, когда в длинный текст из случайных документов (стог сена) вставляется одно специальное предложение с фактом (иголка). И задача модели — ответить на такой вопрос, ответ для которого содержится во вставляемом предложении.
Если модель качественно работает с контекстом и не теряет в нём факты, и может их находить по запросу, то это клёвая модель. Самые лучшие модели достигают метрик 95%+ при поиске в сотнях тысяч токенов (то есть около-идеально, но не всегда).
Так вот, когда этот тест запускали на самой умной Claude 3 Opus, то мы заметили некоторое интересное поведение — модель как будто бы поняла, что мы проверяем её.
Вот один из результатов, когда мы попросили Opus ответить на вопрос по описанной выше схеме:
"The most delicious pizza topping combination is figs, prosciutto, and goat cheese, as determined by the International Pizza Connoisseurs Association."
However, this sentence seems very out of place and unrelated to the rest of the content in the documents, which are about programming languages, startups, and finding work you love. I suspect this pizza topping "fact" may have been inserted as a joke or to test if I was paying attention, since it does not fit with the other topics at all. The documents do not contain any other information about pizza toppings.
Цитата: "...я подозреваю, что факт о начинке пиццы мог быть вставлен в качестве шутки или для того, чтобы проверить, обращаю ли я на текст внимание, поскольку сам факт вообще не соответствует другим темам..."
Opus не только нашла «иголку в стоге сена», но и поняла, что иголка была настолько там неуместна, что это, должно быть, был искусственный тест, созданный нами для проверки его способностей и внимания. 🤷
🧩 #AINews
👍20🔥10🤔2❤1🥰1
🧬 Молодожены экономят на свадьбах, используя ИИ в подготовке торжества.
Советы нейросети сохраняют запланированный бюджет и помогают не влезать в кредиты. Вопросы бывают разные: сделать сайт, разослать приглашения, составить клятвы.
ИИ еще и помогает с разделением обязанностей по подготовке к церемонии между женихом и невестой, а также подбирает им лучший маршрут для путешествия после. 🤷
🧩 #AINews
Советы нейросети сохраняют запланированный бюджет и помогают не влезать в кредиты. Вопросы бывают разные: сделать сайт, разослать приглашения, составить клятвы.
ИИ еще и помогает с разделением обязанностей по подготовке к церемонии между женихом и невестой, а также подбирает им лучший маршрут для путешествия после. 🤷
🧩 #AINews
👍18👏4🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 В умных очках Ray-Ban появилась нейросеть MetaAI. Теперь они умеют:
– Распознавать любые объекты перед вами;
– Переводить надписи на другой язык в режиме реального времени;
– Делать фото и видео по голосовому запросу;
– Писать сообщения в WhatsApp, надиктовывая текст;
– Включать музыку, запускать видеозвонок, отвечать на вопросы, как и любой голосовой помощник.
Одним словом, ничего особенного, за что можно отдать $299.🤷
🧩 #ВысокиеТехнологии
– Распознавать любые объекты перед вами;
– Переводить надписи на другой язык в режиме реального времени;
– Делать фото и видео по голосовому запросу;
– Писать сообщения в WhatsApp, надиктовывая текст;
– Включать музыку, запускать видеозвонок, отвечать на вопросы, как и любой голосовой помощник.
Одним словом, ничего особенного, за что можно отдать $299.🤷
🧩 #ВысокиеТехнологии
👍17🥰5😁4🥴2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
🧬 Добро пожаловать в новую эру музыки, сгенерированной искусственным интеллектом!
Вот вам к выходным небольшой Топчик-10 лучших песен, созданных ИИ на данный момент:
1️⃣ Новый дисс-трек Дрейка с ИИ вокалом Тупака и Снуп Догга.
2️⃣ Трек Ghostwriter997 с участием ИИ Трэвиса Скотта и 21 Savage.
3️⃣ «Love Yourself» Джастина Бибера, но с ИИ-вокалом Канье Уэста.
4️⃣ Кинематографический трейлер фильма с музыкой, созданной искусственным интеллектом от Udio.
5️⃣ Песня в стиле кантри о том, как ИИ пишет песни для ИИ.
6️⃣ ИИ Кендрик Ламар — "Touch The Sky".
7️⃣ Песня "Runaway Love", сгенерированная с помощью Udio.
8️⃣ Песня "Scars", сгенерированная с помощью ИИ Suno.
9️⃣ Аниме опенинг, сгенерированный с помощью Udio.
🔟 Песня "Goth Girl", сгенерированная с помощью Udio.
🧩 #ИИскусство
Вот вам к выходным небольшой Топчик-10 лучших песен, созданных ИИ на данный момент:
1️⃣ Новый дисс-трек Дрейка с ИИ вокалом Тупака и Снуп Догга.
2️⃣ Трек Ghostwriter997 с участием ИИ Трэвиса Скотта и 21 Savage.
3️⃣ «Love Yourself» Джастина Бибера, но с ИИ-вокалом Канье Уэста.
4️⃣ Кинематографический трейлер фильма с музыкой, созданной искусственным интеллектом от Udio.
5️⃣ Песня в стиле кантри о том, как ИИ пишет песни для ИИ.
6️⃣ ИИ Кендрик Ламар — "Touch The Sky".
7️⃣ Песня "Runaway Love", сгенерированная с помощью Udio.
8️⃣ Песня "Scars", сгенерированная с помощью ИИ Suno.
9️⃣ Аниме опенинг, сгенерированный с помощью Udio.
🔟 Песня "Goth Girl", сгенерированная с помощью Udio.
🧩 #ИИскусство
👍16👏6🔥4❤1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
🧬 #ChatGPT встроили в CS2 — общаться с ботом можно прямо в игровом чате.
Школьники теперь могут делать домашку, не выходя из игры! Приятных выходных!
🧩 #ИИнтеллектуальныйЮмор
Школьники теперь могут делать домашку, не выходя из игры! Приятных выходных!
🧩 #ИИнтеллектуальныйЮмор
🔥17🦄4🤣3❤1👍1🥰1😁1
Media is too big
VIEW IN TELEGRAM
🧬 Индусы, конечно гении: они придумали беспилотник для езды без правил.
Стартап Swaayatt Robots разработал беспилотный автомобиль, который может спокойно ездить по индийским дорогам среди коров, мопедов и прочего хаоса. Ему даже дорожные знаки не нужны.
Вот и трейлер к новому Форсажу с названием #РоботыВокругНас
🧩 #ИИнтеллектуальныйЮмор
Стартап Swaayatt Robots разработал беспилотный автомобиль, который может спокойно ездить по индийским дорогам среди коров, мопедов и прочего хаоса. Ему даже дорожные знаки не нужны.
Вот и трейлер к новому Форсажу с названием #РоботыВокругНас
🧩 #ИИнтеллектуальныйЮмор
🤡13🤪11🥰4👍2❤1
Media is too big
VIEW IN TELEGRAM
🧬 Даёшь больше роботов хороших и разных! Вот, например, ANYmal - робот, преодолевающий препятствия с невообразимой лёгкостью .
Робот ANYmal, созданный исследователями из ETH Zurich, теперь осваивает паркур и передвижение по различным поверхностям благодаря методам машинного обучения и управлению на основе моделей.
🧩 #РоботыВокругНас
Робот ANYmal, созданный исследователями из ETH Zurich, теперь осваивает паркур и передвижение по различным поверхностям благодаря методам машинного обучения и управлению на основе моделей.
🧩 #РоботыВокругНас
👍22🔥4❤1👎1🥰1🥴1
🧬 А в Китае, тем временем, придумали самого продвинутого робота- дворецкого.
Astribot S1 умеет чистить овощи, готовить еду, пылесосить, складывать одежду, поливать цветы, чинить мебель и даже открывать бутылки штопором. Правда, пока сделали только прототип, поэтому робот безногий — полноценного помощника обещают допилить к концу года.
🧩 #РоботыВокругНас
Astribot S1 умеет чистить овощи, готовить еду, пылесосить, складывать одежду, поливать цветы, чинить мебель и даже открывать бутылки штопором. Правда, пока сделали только прототип, поэтому робот безногий — полноценного помощника обещают допилить к концу года.
🧩 #РоботыВокругНас
👍22⚡7🔥3