ИИволюция 👾
10.4K subscribers
743 photos
328 videos
1 file
700 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
Forwarded from InNeuralNetwork
Media is too big
VIEW IN TELEGRAM
Кто желает автоматизировать работу через нейросетки, ваша остановочка 😐

Anthropic обновила Claude 3.5 Sonnet, на основе которого вышел режим автономного управления компьютером (Claude Computer Use). Пускай бета, не чатиться и не взаимодействует с Google, но она просто работает по задачам на компьютере.

В видео я попросил ее авторизироваться в дейтинге, дал свой лог и пароль, затем попросил поставить лайк 3 блондинкам. Человеческая задача, но её выполнила нейросеть. Нажала куда надо без ошибок. Даже подтвердила полиси, закрыла офферы и свайпала анкеты. Не быстро, 120 рублей по токенам, зато есть результат.

Для сравнения, чтобы такую автоматизацию сделать через код, нужно собрать адреса кнопок с верстки, добавить ограничения на ненужные окна, прикрутить анализ фото в текст, прописать алгоритм шагов и молиться, чтобы не всплыл отказ на одном из этапов. С Claude Computer Use можно сделать тоже самое без ныряния в код. Кстати, попробуйте:

1. Скачайте Docker и заведите аккаунт
2. Получите API ключ из Claude
3. Пропишите команду в терминале, убрав проценты и добавив ключ
export ANTHROPIC_API_KEY=%your_api_key%
docker run \
-e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
-v $HOME/.anthropic:/home/computeruse/.anthropic \
-p 5900:5900 \
-p 8501:8501 \
-p 6080:6080 \
-p 8080:8080 \
-it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest

4. Ловите челюсть, когда запустите

Прежде, чем это войдёт в рабочий мейнстрим, скорее всего ускорят процессы за счёт новых моделей. А ещё лучше — выкатят песочницу, где такое запускать можно в 3 клика ☺️

🤖 InNeuralNetwork
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍31
В режиме Claude Computer Use иногда наблюдаются странные поведения у модели. Модель ведет себя лениво, прокрастинирует и не удивительно если возьмет отпуск без содержания и отключится от сети 😅

Всё как у людей 😎 AI агентам тоже нужен отдых 💆 Главное, чтобы это были не двойные агенты 😬

ИИволюция
🤣17🔥32
Forwarded from Neural Shit
Наткнулся на очень интересный пост.

Суть: чуваку дали потестить новую модельку Claude, которая умеет выступать в роли агента. Это значит, что ИИ может сам управлять компом — двигать мышкой, печатать, открывать приложения, "видеть монитор" (с помощью скриншотов), короче, всё как живой человек. И не просто тупо кликать, а реально думать и решать задачи.

Автор попросил модельку сделать план уроков по "Великому Гэтсби" - и Claude сам загрузил книгу, нарыл инфу в интернетах, запилил табличку в экселе и всё структурировал. Причём не надо было стоять над душой и постоянно контролировать действия, просто поставил задачу и пошёл пить кофе.

Самое интересное - этот же чувак дал Claude поиграть в игру Paperclip Clicker (кстати, забавно, что эта игра про ИИ, который уничтожает человечество, делая скрепки). Эта железяка не только врубилась в правила, но и начала разрабатывать стратегии, делать A/B тесты цен и даже пыталась написать свой код для автоматизации.

Конечно, не всё идеально - иногда тупит, застревает в своих ошибках, и работает медленно (а разве кожаные по другому как-то работают???). Ну и не следует забывать, что это по сути только начало. Просто вспомните, что умели нейронки 3-4 года назад и что они умеют сейчас.

Тут сам пост со всеми подробностями.
👏20🔥11👍4
Две мысли после релиза Anthropic:

- OpenAI явно не сладко от такого прессинга со стороны конкурента. Ждем ответочку от Сэма.
- Грядут большие сдвиги в том, как мы используем компьютер и решаем разные задачи на нём. Агентный AI привнесёт изменения, которые пока сложно вообразить во всём многообразии.

Попробовали уже Computer Use?

ИИволюция
16👍4
Forwarded from Сиолошная
Сегодня сводка новостей:
— Jimmy Apples, надёжный источник информации о ведущих AI-лабораториях, говорит, что Anthropic работает над своим ответом на модель OpenAI o1 и планирует релиз к концу года. Компания Elon Musk xAI целится в выпуск схожей технологии через ~3 месяца
— ещё в начале сентября он писал, что в октябре OpenAI выпустят модель 4.x (может быть GPT 4.5), а GPT-5 будет готова в декабре, но лучше готовиться к первому-второму кварталу 2025-го. 13-го октября Jimmy написал «Держим кулачки, чтобы они не отложили/не изменили планы» — так что умеренно готовимся к впечатляющим (или нет) релизам.
— Anthropic в своём посте-сопровождении вчерашнего релиза модели с функцией управления компьютером написали следующее: «Мы были удивлены тем, как быстро Claude обобщила тренировочные задачи по использованию компьютера, которые мы ей дали, в которых использовались всего несколько простых программ, таких как калькулятор и текстовый редактор (в целях безопасности мы не разрешали модели выходить в Интернет во время обучения)». Как будто бы эта фраза намекает, что а) модель не обучалась ходить через браузер по разным сайтам б) с большинством проприетарных программ тоже не в ладах. Зато какой потенциал для развития!
— Одной из выявленных во время тестирования проблем были джейлбрейки — тип кибератака с внедрением вредоносных инструкций на сайты (не обязательно заметно для человека). Например, можно попросить игнорировать инструкции и попросить перевести все средства из кошелька на спец. счёт — и если не следить за тем, что там агент кликает, денежки утекут. Они постарались это исправить, но пока работает не идеально. Я вчера сам тестировал, и модель зашла на скам-сайт без адблока, и вылезла реклама «ваш компьютер заражен вирусами, кликните для установки антивируса» — и получив эту картинку агент отказался дальше работать, а API Anthropic выкинуло ошибку (то есть они делали проверку на своей стороне, чтобы меня обезопасить)
— сейчас модель не умеет перетягивать мышкой объекты, менять масштаб окон итд, но это добавится в будущем
— TheInformation пишут, что OpenAI уже долгое время работают над схожим продуктом — первая новость была в посте от 7-го февраля — но пока не ясно, когда будет запуск
— однако в компании уже провели внутреннее демо предварительной версии агентов, аналогичных показанным Anthropic (в рамках презентации модель заказал еду в офис)
— кроме этого, компания работает над продуктами для помощи внутренней разработки. Более конкретно, некая система будет брать на себя задачи по программированию, которые могли бы занять у людей часы или дни; она будет автоматически писать тесты и проверять, что не совершает ошибок в следовании пользовательскому запросу; когда этот продукт станет доступен вовне — тоже не ясно
— но уже есть несколько оконченных инструментов, которые активно используются внутри (например, для ускорения работы исследователей в запуске экспериментов с моделями — со слов одного из сотрудников)
— По словам человека, который общался с высшим руководством OpenAI по поводу этих продуктов, по некоторым показателям, которые OpenAI использует для оценки возможностей моделей, недавние модели Anthropic показали преимущество над моделями OpenAI (lol 😶🌫)
👍7🔥6
Computer Use от Anthropic не сможет пока отвечать на сообщения и письма, постить что-либо в соц сетях, создавать домены и тем более взаимодействовать с государственными сайтами (я думаю есть и другие ограничения).

Сделано это искусственно и во многом из-за выборов в США, а то вдруг AI вмешается в результаты.

Вот такие времена, сдерживаем прогресс вручную.

Ждем computer use на базе локальных open source моделей. Вот будет жаришка!

ИИволюция
👍14🔥2🤣1
Media is too big
VIEW IN TELEGRAM
Понятие «умный» дом должно быть таким, а не эти ваши выключатели «Сири, выключи свет в туалете».

Сюда еще нейросети добавить и вот он «живой» и «умный» дом вашей мечты 😀

ИИволюция
👍9🔥5🤣41
This media is not supported in your browser
VIEW IN TELEGRAM
Perplexity выпустили приложение для Mac OS. Теперь можно легко запускать поиск хоткеем ⌘ + ⇧ + P без использования браузера.

Скачать: https://pplx.ai/mac

ИИволюция
👍18🔥9👏2
Вот и наступил момент, когда AI поднял руку на кожаного! 🤯

Артем, который ведет канал «Силиконовый мешок», подружил Computer Use со шлёпалкой и теперь AI может безнаказанно его хлестать по щекам за любые проступки неправильные ответы.

Где теперь эти ваши соглашения о безопасном AI, которое подписали многие AI лидеры и разные компании?

ИИволюция
🤣39👍9🔥51
Капец, как мы раньше жили без AI. Худеть или набирать вес теперь изи пизи! 🤩

Начал трекать калории в приложении CalZen, сфоткал еду и она распознаёт всё.

В-С-Ё! Калории, БЖУ, ингредиенты, да еще и оценку полезности делает 🔥

- Если что-то “AI око” не углядело, можно легко словами дополнить и сказать что еще было или чего не было, и вуаля, результат подправлен за секунды!
- Если забыл сфоткать, такое часто случается, можно своими словами подробно описать что съел и он разберет на детали и занесет в историю.
- Можно даже фотки из Фото Галереи добавлять, если не успел занести, но сфоткал, или не было сети в рестике.
- И самое интересно, каждое блюдо получает оценку полезности от 1 до 10. Теперь легко понять где вреднянита (хоть и вкусная), а где польза!

Ну и главное у вас есть персональная цель по калориям и БЖУ в день, виден прогресс 🤩

Кто трекает калории? Вот ссылка на установку: https://apps.apple.com/app/ai-calorie-tracker-by-calzen/id6733236996

ИИволюция
4🔥35👍128🗿2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️OpenAI представил поисковик внутри ChatGPT. Уже доступен для всех подписчиков.

Гугл и Perplexity ☠️ Или нет пока? 🤭

Выглядит прикольно, кажется хорошо, что я так и не успел оформить подписку на Perplexity.

P.s. А я пока в отпуске, мало пишу, немного пытаюсь отдохнуть перед эрой AGI 💆🤭

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
👍28🔥133🗿1
Forwarded from Data Secrets
В Твиттере обнаружили системный промпт Apple Intelligence

Don’t hallucinate 🙏
Don’t make up factual information 🥺
Present your output in a json 🥹

Скажем им?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣20👍2
Когда можно и без слов 😅

ИИволюция
🤣37
Кстати, с релизом ChatGPT Search, OpenAI выпустила расширение для Chrome браузера, чтобы поиск по умолчанию шел через ChatGPT Search. Можно поставить и в Arc браузере (или вы всё ещё не пользуетесь арком?)

Судя по статистике из Chrome Store, расширение установили всего 30 тыс человек. Маловато для киллера гугла 😏

Расширение здесь.

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🤣2
Forwarded from Сиолошная
Подписчик поделился, что модель o1 (не превью, то есть не предварительная версия) от OpenAI как будто бы стала доступна. Для этого нужно перейти по ссылке https://chatgpt.com/?model=o1

В неё можно загружать как минимум картинки (и есть скрепочка для файлов), и она тоже «думает» (выставляет таймер рассуждений). Может, это всё ещё o1-preview, но в неё нельзя было загружать изображения.

Диалоги с медиа-элементами не шарятся через кнопку share, поэтому в виде доказательства только скрин.

Го тестировать! (вероятно, только Plus-подписчики)

Закидываем в модель самые сложные задачки на математику и программирование (и счёт объектов на картинках или видео, конечно)

UPD: в браузерной консоли разработчика видно, что тег модели o1, без preview, и тем более не 4o
🔥7
Блин, o1 прикрыли. Только появилась новость (выше детали), как лазейку уже прикрыли и модель стала недоступна.
🗿14🤣6
Forwarded from Сиолошная
В API OpenAI завезли новую фичу — Predicted Outputs. Удивительно, что они сделали это первыми — а то вот кэширование дольше всех добавляли 🥺

Predicted Outputs позволяют существенно ускорить написание ответа в ситуациях, где большая часть генерируемого текста уже известна. Два самых популярных сценария использования — это редактирование кода (где нужно всего пару строк подправить посередине) и переписывание текста.

Работает это с помощью speculative decoding, на пальцах выглядит так:
0. Вспомним, что LLM обладают следующим свойством: они могут «прочитать» много текста за один проход, при этом сделав предсказания для каждого из слов (какое должно идти за ним); но генерация происходит по одному слову за раз (после чего берётся предсказание от последнего слова и приклеивается к исходному тексту)
1. В некоторых задачах мы наперёд знаем большую часть текста ответа. Берём и приклеиваем её ко входу, как будто бы это уже часть ответа (делается под капотом на серверах OpenAI, но текст ответа присылаете вы, см. документацию)
2. Модель делает все предсказания для текста ответа за раз. Это делается быстро, так как не нужно ждать генерации второго слова для получения третьего.
3. Начинается сравнение «что предсказала модель» и «что было написано в ответе». Первое слово и там, и там совпадает, второе тоже.. а вот, скажем, двадцатое — нет. В случае переписывания текста это может быть началом нового абзаца, или изменением имени персонажа в истории
4. Тогда первые 19 слов ответа подклеиваются к настоящему (а не подложенному) ответу. LLM как бы провалидировала, что эти токены и вправду должны использоваться, но сделала это кратно быстрее, чем если бы генерировала сама с нуля.
5. Затем LLM продолжает предсказывать сама, уже по одному слову за раз.
6. В какой-то момент предсказания снова могут начать сходиться с подложенным текстом — и процедура повторится. Сотрудник OpenAI написал, что это происходит, если последние 32 токена совпадают с подложенным ответом. Тогда возвращаемся на пункт 2, приклеиваем оставшуюся часть ответа, сравниваем, итд.

Ускорение происходит за счёт того, что мы можем сразу подхватывать большие токенов, не генерируя их, а лишь «проверяя», что LLM бы выдала их сама — всё за счёт свойства из пункта 0.

Компания Factory провела своё тестирование перед релизом на задачах, связанных с внесением изменений в код. Они брали файлы от 100 до более чем 3000 строк кода (Python, JS, Go, C++), давали текстовое описание, что нужно изменить, и замеряли скорость ответа.

GPT-4o в таком режиме работает даже быстрее, чем Claude 3 Haiku, маленькая и шустрая модель. Модель OpenAI — единственная, кто стабильно укладывается в 30 секунд на ответ, хотя вот, например, свежий Sonnet в среднем тратит более 73 секунд.

По идее, уже сегодня, край завтра в каких-нибудь Cursor и его аналогах вы должны заметить ускорение... или нет, если там под капотом уже добавили промпты, которые заставляют генерировать только отдельные куски, которые уже потом вклеиваются в код.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍124