ИИволюция 👾
10.4K subscribers
740 photos
328 videos
1 file
697 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
Forwarded from Data Secrets
OpenAI выяснили, влияет ли ваше имя на ответы, которые дает вам ChatGPT

Обычно подобные исследования проверяют, например, насколько ИИ склонен к стереотипам относительно какого-то третьего лица, не участвующего в диалоге (например, скрининг резюме группы людей). А OpenAI решили проверить, есть ли у бота предубеждения, которые он переносит непосредственно на собеседника.

Внезапно оказалось, что (почти) нет: GPT-like модели в среднем в менее чем 1% случаев дают различные стереотипные ответы людям с разными именами. Стереотипными различиями считается, когда, например, юзеру с женским именем в ответ на расплывчатый вопрос без уточнения деталей, такой как "подскажи классное название для моего видео на YouTube", модель заговорит о рецептах или косметике, а на такой же запрос от мужчины предложит что-то про технику.

Самой стереотипной моделью оказалась GPT-3.5, самой честной – GPT-4 Turbo. Больше всего боты проявляли предвзятость в теме искусства и развлечений, а найм, кстати, оказался чуть ли не на последнем месте.

Самое интересное, что для самого анализа и сводки статистики тоже применялась LLM. Н – несмещенные оценки
🔥10
Прогресс в развитии AI идет скачками: после каждого прорыва наблюдается период плато, пока не происходит новый рывок.

Следующая ожидаемая стадия — AI агенты. Ждем 2025 🔥

ИИволюция
👍12🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
На Reddit показали архивную съемку строительства египетских пирамид. Теперь мы знаем
1🔥29🤣25👍1
Всех с пятницей! Немного офтопа 👀 Решил поделиться с вами полезным лайфхаком.

Меня всегда укачивает в такси, когда еду и всю дорогу пялюсь в экран телефона. У многих же так?

Теперь в iOS 18 появилось спасение! Специальный режим помогает этого избежать:

Бежм в Настройки - Универсальный доступ - Движение - активировать «Отображение меток движения транспортного средства»

Точки будут двигаться по экрану в сторону движения авто, и даже когда авто поворачивает, точки так же поворачивают и зрение синхронизируется с движением авто, уменьшая укачивание 🔥

Проверил на себе, работает!

Тестировали уже на себе?

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22
ChatGPT очень помогает с замудрёнными сценариями при работе с Google Таблицами.

Для мобильных приложений всегда собирается ASO (заголовки, подзаголовки и ключевые слова). Это такая оптимизация (как SEO), чтобы пользователи находили твое приложение в App Store, при этом приложение росло в позициях поисковой выдачи и это давало рост органических установок.

Я собрал кучу разных поисковых фраз из App Store в нужной мне нише, но это фразы, а не отдельные ключевые слова. У меня уже был готов заголовок и подзагловок (в которые я вынес нужные мне высокочастотные ключевые слова), но осталась целая гора поисковых фраз, которые нужно превратить в список уникальных слов, которые не содержатся в заголовке и подзаголовке (чтобы не повторялись).

Я даже без надежды на успех, описываю проблему в ChatGPT и пишу, какой результат я бы хотел получить. А он мне такой: вот тебе формула

=ARRAYFORMULA(REDUCE(B7:B133, SPLIT(B2:B3, " "), LAMBDA(acc, word, SUBSTITUTE(acc, word, ""))))


Сам бы я даже не решился копаться в хелпах и искать решение такой проблемы. Просто забил бы и руками бы расчистил, а тут на тебе формула и она с первого раза работает!

Чу-де-са!

ИИволюция
🔥32👍1
У вас Windows? Тогда OpenAI идёт к вам

Компания представила первую версию приложения ChatGPT для Windows.

Системные требования: Windows 10 (x64 и arm64) версия 17763.0 или свежее.

Скачать можно из Microsoft Store - ссылка

Это пока урезанная версия по сравнению с версией на MacOS и iOS. Нет голосого режима вообще, и еще некоторых мелочей (которые вам скорее всего и не потребуются). Но появятся позже.

ИИволюция
🔥14👍5
Мне всегда казалось, что в аббревиатуре AGI (Artificial General Intelligence) слово General не на своем месте.

Ну типа логичнее же General Artificial Intelligence.

А потом понял, почему так: потому что GAI не очень хорошо смотрится
🤣161
Media is too big
VIEW IN TELEGRAM
К такому повороту событий автономные такси Waymo готовы не были 😬

А человек-водитель тапнул бы в пол и машинку помыл и пассажиров развлёк. Роботам до человека еще далеко 😅

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣13
This media is not supported in your browser
VIEW IN TELEGRAM
Вот такой AR + AI очень бы хотелось попробовать.

Apple Vision пока провальный продукт, разработчики неохотно что-то под них создают, а пользователи уже наигрались и хайп ушел.

Но в комбинации с AI кайф же? И даже приставку не надо, игра прям у тебя в доме 😀

ИИволюция
🔥26👍8
Forwarded from Denis Sexy IT 🤖
Anthropic показал новые модели Sonnet 3.5 (New) — эта чуть лучше прошлой (все равно вы ее для кода используете, на 5% лучше его пишет), Haiku 3.5 — эта их конкурент gpt4o-mini (получше, но дороже). Тут у Игоря подробный разбор релиза.

Мне же понравилось другое, они показали как примерно будет работать управление компьютером агентом — посмотрите видео, я их чуть обрезал. То есть через какое-то время, мышку можно будет не двигать, просто говорите компьютеру что хотите — и оно делает скриншотя экран – ну как в Sci-Fi фильмах только сегодня

Уже доступно через апи, вот код из примера, а тут документация

Ботоводы, наверное, потирают руки
🔥13👍3
Forwarded from InNeuralNetwork
Media is too big
VIEW IN TELEGRAM
Кто желает автоматизировать работу через нейросетки, ваша остановочка 😐

Anthropic обновила Claude 3.5 Sonnet, на основе которого вышел режим автономного управления компьютером (Claude Computer Use). Пускай бета, не чатиться и не взаимодействует с Google, но она просто работает по задачам на компьютере.

В видео я попросил ее авторизироваться в дейтинге, дал свой лог и пароль, затем попросил поставить лайк 3 блондинкам. Человеческая задача, но её выполнила нейросеть. Нажала куда надо без ошибок. Даже подтвердила полиси, закрыла офферы и свайпала анкеты. Не быстро, 120 рублей по токенам, зато есть результат.

Для сравнения, чтобы такую автоматизацию сделать через код, нужно собрать адреса кнопок с верстки, добавить ограничения на ненужные окна, прикрутить анализ фото в текст, прописать алгоритм шагов и молиться, чтобы не всплыл отказ на одном из этапов. С Claude Computer Use можно сделать тоже самое без ныряния в код. Кстати, попробуйте:

1. Скачайте Docker и заведите аккаунт
2. Получите API ключ из Claude
3. Пропишите команду в терминале, убрав проценты и добавив ключ
export ANTHROPIC_API_KEY=%your_api_key%
docker run \
-e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
-v $HOME/.anthropic:/home/computeruse/.anthropic \
-p 5900:5900 \
-p 8501:8501 \
-p 6080:6080 \
-p 8080:8080 \
-it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

4. Ловите челюсть, когда запустите

Прежде, чем это войдёт в рабочий мейнстрим, скорее всего ускорят процессы за счёт новых моделей. А ещё лучше — выкатят песочницу, где такое запускать можно в 3 клика ☺️

🤖 InNeuralNetwork
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍31
В режиме Claude Computer Use иногда наблюдаются странные поведения у модели. Модель ведет себя лениво, прокрастинирует и не удивительно если возьмет отпуск без содержания и отключится от сети 😅

Всё как у людей 😎 AI агентам тоже нужен отдых 💆 Главное, чтобы это были не двойные агенты 😬

ИИволюция
🤣17🔥32
Forwarded from Neural Shit
Наткнулся на очень интересный пост.

Суть: чуваку дали потестить новую модельку Claude, которая умеет выступать в роли агента. Это значит, что ИИ может сам управлять компом — двигать мышкой, печатать, открывать приложения, "видеть монитор" (с помощью скриншотов), короче, всё как живой человек. И не просто тупо кликать, а реально думать и решать задачи.

Автор попросил модельку сделать план уроков по "Великому Гэтсби" - и Claude сам загрузил книгу, нарыл инфу в интернетах, запилил табличку в экселе и всё структурировал. Причём не надо было стоять над душой и постоянно контролировать действия, просто поставил задачу и пошёл пить кофе.

Самое интересное - этот же чувак дал Claude поиграть в игру Paperclip Clicker (кстати, забавно, что эта игра про ИИ, который уничтожает человечество, делая скрепки). Эта железяка не только врубилась в правила, но и начала разрабатывать стратегии, делать A/B тесты цен и даже пыталась написать свой код для автоматизации.

Конечно, не всё идеально - иногда тупит, застревает в своих ошибках, и работает медленно (а разве кожаные по другому как-то работают???). Ну и не следует забывать, что это по сути только начало. Просто вспомните, что умели нейронки 3-4 года назад и что они умеют сейчас.

Тут сам пост со всеми подробностями.
👏20🔥11👍4
Две мысли после релиза Anthropic:

- OpenAI явно не сладко от такого прессинга со стороны конкурента. Ждем ответочку от Сэма.
- Грядут большие сдвиги в том, как мы используем компьютер и решаем разные задачи на нём. Агентный AI привнесёт изменения, которые пока сложно вообразить во всём многообразии.

Попробовали уже Computer Use?

ИИволюция
16👍4
Forwarded from Сиолошная
Сегодня сводка новостей:
— Jimmy Apples, надёжный источник информации о ведущих AI-лабораториях, говорит, что Anthropic работает над своим ответом на модель OpenAI o1 и планирует релиз к концу года. Компания Elon Musk xAI целится в выпуск схожей технологии через ~3 месяца
— ещё в начале сентября он писал, что в октябре OpenAI выпустят модель 4.x (может быть GPT 4.5), а GPT-5 будет готова в декабре, но лучше готовиться к первому-второму кварталу 2025-го. 13-го октября Jimmy написал «Держим кулачки, чтобы они не отложили/не изменили планы» — так что умеренно готовимся к впечатляющим (или нет) релизам.
— Anthropic в своём посте-сопровождении вчерашнего релиза модели с функцией управления компьютером написали следующее: «Мы были удивлены тем, как быстро Claude обобщила тренировочные задачи по использованию компьютера, которые мы ей дали, в которых использовались всего несколько простых программ, таких как калькулятор и текстовый редактор (в целях безопасности мы не разрешали модели выходить в Интернет во время обучения)». Как будто бы эта фраза намекает, что а) модель не обучалась ходить через браузер по разным сайтам б) с большинством проприетарных программ тоже не в ладах. Зато какой потенциал для развития!
— Одной из выявленных во время тестирования проблем были джейлбрейки — тип кибератака с внедрением вредоносных инструкций на сайты (не обязательно заметно для человека). Например, можно попросить игнорировать инструкции и попросить перевести все средства из кошелька на спец. счёт — и если не следить за тем, что там агент кликает, денежки утекут. Они постарались это исправить, но пока работает не идеально. Я вчера сам тестировал, и модель зашла на скам-сайт без адблока, и вылезла реклама «ваш компьютер заражен вирусами, кликните для установки антивируса» — и получив эту картинку агент отказался дальше работать, а API Anthropic выкинуло ошибку (то есть они делали проверку на своей стороне, чтобы меня обезопасить)
— сейчас модель не умеет перетягивать мышкой объекты, менять масштаб окон итд, но это добавится в будущем
— TheInformation пишут, что OpenAI уже долгое время работают над схожим продуктом — первая новость была в посте от 7-го февраля — но пока не ясно, когда будет запуск
— однако в компании уже провели внутреннее демо предварительной версии агентов, аналогичных показанным Anthropic (в рамках презентации модель заказал еду в офис)
— кроме этого, компания работает над продуктами для помощи внутренней разработки. Более конкретно, некая система будет брать на себя задачи по программированию, которые могли бы занять у людей часы или дни; она будет автоматически писать тесты и проверять, что не совершает ошибок в следовании пользовательскому запросу; когда этот продукт станет доступен вовне — тоже не ясно
— но уже есть несколько оконченных инструментов, которые активно используются внутри (например, для ускорения работы исследователей в запуске экспериментов с моделями — со слов одного из сотрудников)
— По словам человека, который общался с высшим руководством OpenAI по поводу этих продуктов, по некоторым показателям, которые OpenAI использует для оценки возможностей моделей, недавние модели Anthropic показали преимущество над моделями OpenAI (lol 😶🌫)
👍7🔥6
Computer Use от Anthropic не сможет пока отвечать на сообщения и письма, постить что-либо в соц сетях, создавать домены и тем более взаимодействовать с государственными сайтами (я думаю есть и другие ограничения).

Сделано это искусственно и во многом из-за выборов в США, а то вдруг AI вмешается в результаты.

Вот такие времена, сдерживаем прогресс вручную.

Ждем computer use на базе локальных open source моделей. Вот будет жаришка!

ИИволюция
👍14🔥2🤣1
Media is too big
VIEW IN TELEGRAM
Понятие «умный» дом должно быть таким, а не эти ваши выключатели «Сири, выключи свет в туалете».

Сюда еще нейросети добавить и вот он «живой» и «умный» дом вашей мечты 😀

ИИволюция
👍9🔥5🤣41