Denis Sexy IT 🤖
79.6K subscribers
3.18K photos
1.62K videos
21 files
4.07K links
Личный блог Дениса Ширяева (🤍🇺🇦), про технологии, интересное или актуальное.

В основном я по нейронкам. Работаю CEO в https://neural.love

⚜️ Реклама в канале возможна для юрлиц и физ-лиз у которых работает SWIFT оплата в Нидерланды

Связь: @thenbot
Download Telegram
Девушки этих парней – нам нужно серьезно поговорить:

У нас тут снова переизобретение электричества происходит и нужно реагировать как в этих мемах – 😮😆😮😮😮😱😮😬

Спасибо за понимание
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
С утра читаю отзывы людей (негативные опущены, они тоже есть):
— Вау, такой голос! Как живое!
— Невероятно, всё утро веду диалог, мне теперь живые люди не нужны!

Штука в том, что свежая модель на данный момент для пользователей генерирует лишь текст. Генерацию голоса новой моделью, а также создание картинок завезут позднее, «в ближайшие недели».
Представьте, что будет когда включат эту функциональность, как люди обрадуются 😀

То есть как работало мобильное приложение ChatGPT раньше:
— Одна модель слушает вас, переводит речь в текст. На этом этапе теряются все эмоции, никаких тегов <вздох> или *радостно* там нет — просто текст
— Текст подаётся в GPT-4-Turbo (вторую модель) на вход (как будто бы вы сами написали сообщение своими руками)
— Эта модель генерирует ответ текстом
— Этот текст озвучивается третьей моделью. Она не может петь, шептать, играться интонацией. Если в запросе попросите её это сделать — она не будет следовать инструкции

Насколько я понимаю, на сегодняшний день эта функциональность сохраняется — несмотря на то, что модели с номерами 1 и 3 можно заменить на новую GPT-4o (она может нативно слушать вас и генерировать голос сразу, без вспомогательных средств). OpenAI не выкатывают всё сразу. А вот модель 2 как раз заменили. То есть сами ответы могут показаться умнее, уровень понимания тоже повысился — потому что LLM стала мощнее. И скорость выросла.

Не верите? Попробуйте попросить отвечать медленнее/быстрее, или даже шёпотом.

Sorry to disappoint you 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
Киберпанк который мы заслужили
Denis Sexy IT 🤖
Давно не было милых новостей в стиле SimCity 3000 – новая модель Claude 3 Opus тоже умеет в кучу языков, так что вот ее версия: 🔸 Местный житель вырастил помидор в форме сердца, подарив его своей возлюбленной на годовщину 🔸 Местные белки начинают использовать…
Давно не было милых новостей в стиле SimCity 3000 – вот версия от GPT-4o:

🔸 Кошка захватила мэрский офис, требуя бесплатного тунца для всех. Жители города поддерживают её кандидатуру.

🔸 Робот-пылесос стал героем дня, спасая хомячка из-под дивана. Теперь его зовут Суперпылесос.

🔸 Гигантская тыква выросла на крыше мэрии. Теперь она служит новой городской достопримечательностью и кафе.

🔸 Местная белка стала звездой социальных сетей, собирая орехи в форме сердечек. Жители дарят ей орехи каждый день.

🔸 Птица-певчая взяла под контроль городской светофор, поет песни на зеленый свет. Водители благодарны за музыкальные остановки.

🔸 Городской пруд захватили утки, организовав утиную регату. Победители получают золотые булочки.

🔸 Местный фермер вырастил арбуз в форме звезды. Симы считают, что это новый символ города.

🔸 Бабочка стала сенсацией, случайно прилетев на заседание городского совета. Все решения теперь принимаются с её согласия.

🔸 Городской почтальон на велосипеде заменен на почтового дрона, который раздает письма вместе с печеньем.

🔸 Местный музыкант учит кошек играть на пианино. Теперь каждую ночь город наполнен мелодичными мурлыканьями.

🔸 Местный хорек стал мэром города после случайного голосования. Жители утверждают, что его решения значительно улучшили городскую инфраструктуру, особенно туннели.

🔸 Почтовый голубь случайно доставил любовное письмо в соседний город, вызвав цепочку романтических встреч.

🔸 Власти города заменили все уличные фонари на светлячков. Жители довольны природным освещением.

🔸 Роботы-бариста готовят кофе с художественными рисунками на пенке. Теперь у каждого кофе своя история.

🔸 Городская библиотека ввела программу 'чтение с котом'. Теперь каждый читатель получает мурлыкающего напарника.

🔸 В зоопарке открылась школа танцев для слонов. Их выступления собирают аншлаги.

🔸 Местные жители случайно обнаружили подземный город хомяков. Экскурсии проводятся каждую субботу.

🔸 На городской площади установлен фонтан с мыльными пузырями. Дети и взрослые не могут наиграться.

🔸 Городская станция метро начала использовать вагоны для пикников. Пассажиры наслаждаются путешествиями с бутербродами.

🔸 Жители города нашли способ выращивать миниатюрные деревья-бонсай на балконах. Теперь у каждого дома своя зеленая мини-аллея.

🔸 В зоопарке открылась школа фехтования для пингвинов. Туристы не могут поверить своим глазам, наблюдая за их поединками на льду с миниатюрными рапирами.

🔸 Власти города заменили все автобусы на гигантские тапки. Симы признают, что новый транспорт мягкий, уютный и идеально подходит для коротких поездок.

Прошлая подборка.
This media is not supported in your browser
VIEW IN TELEGRAM
На Google I/O показали новые AI штуки и пока я не увижу в проде, я не вижу смысла о них писать свои мысли – это уже второй Goole I/O где показывают AI-фичи для поиска, для Gmail и тп. и их как в меме с рыбами, только показывают (или уже встроили и показывают повторно, типа быстрых ответов на почту 🙂)

Из любопытного (как по мне):

– Показали конкурент SORA который понятно, что никто из нас не потрогает;

– Показали новый генератор картинок Imagen 3 который пока что никто из нас не потрогает (вход по заявкам и не для всех стран);

– Вернули функцию «Magic» в Google Sheets, если помните, была такая – выделяли ячейки и появлялись быстрее инструменты процессинга данных, теперь работает на Gemini и эта фича которую я правда ждал назад;

– Сделали свой платный аналог ChatGPT – Gemini App, буквально копия почти 1 в 1 – там есть свои GPT которые называются Gems, поддержка 35+ языков; сказали что аудио-асситента можно перебивать и угадайте показали ли демку этого ассистента 👍 (нет, дайте угадаю когда добавили эту фразу в презентацию хехе);

– Gemini еще больше интегрируют в Android, прям на уровень системы – удобно для пользователей Android. Ждем такое же в Siri + OpenAI;

– А это вызовет wild fire среди любителей безопасности данных: Gemini теперь слушает ваши телефонные разговоры сама по себе, процессинг случается на устройстве и может предупредить что вам позвонил «сотрудник тюрьма-банка и пытается вас заскамить». Надеюсь дадут отключать постоянную прослушку, в мире для этого уже есть органы.

Остальное вы уже видели в том или ином виде, саму модель Gemini 1.5, я бы хотел увидеть в результатах тестов.

P.S. Довольно кринжово выглядит когда спикер замирает ожидая аплодисменты и зал никак не реагирует, думаю разойдется на нарезки
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Короче, я потратил сегодня весь день пытаясь делать разные промпты «эксперта в написании кода» под GPT-4o и у меня пока не очень хорошие новости:

— Чистый ChatGPT на GPT-4o пишет код лучше (!) чем запромченый эксперт через API, такого я еще не видел;

— Помните я писал раньше про модель «im-a-good-gpt2-chatbot» о которой мы мало что знаем и она мне понравилась больше всего? Она все еще лучше всех, не пропускает инструкций и слушается;

В видео есть 3 вида змейки написанных с первого раза (то есть я не дебажил код самой моделью, просто копировал его и запускал — все модели прекрасно дебажат сами себя если попросить, я тестировал генерацию с первого раза):

— GPT-4o БЕЗ какого-либо промпта, кроме системного промпта ChatGPT: модель сделала симпатичную игру которая сразу работает, нормально считает очки и тп. Код.

— GPT-4o С моим системным промптом, где я ей говорю какая она классная в разработке и описываю детально как лучше писать код: во-первых, не с первого раза игра заработала, пришлось пару раз делать перегенерации — я пробовал и длинные и короткие системные промпты, ей все равно. Во вторых, игра с багами — очки считаются x10, при врезании в стену показывается алерт JS с очками который я отключил потому что невозможно же. Код.

— Im-a-good-gpt2-chatbot с тем же самым промптом разработчика выше: сделала прекрасную игру, которая считает правильно очки, содержит игровое сообщение «Game Over» и в целом норм работает. Код.

Я утром читал какие-то негативные комментарии про GPT-4o, и подумал что люди просто хейтят ClosedAI, такое часто происходит — а сейчас вижу, что есть за что — модель плохо промптится.

Поэтому:
1) Или так задумано
2) Или у OpenAI баг в API
3) Или нас ждет скорый релиз еще лучшей модели – «im-a-good-gpt2-chatbot», а GPT-4o чисто для аудио-ассистента сделана (это мое мнение, высосанное из пальца)

P.S. Мой текущий промпт разработчика, который хорошо работает (execution mode штука только для моделей OpenAI и не ясно он вообще работает или нет, удалите если в другие модели понесете)
Ну я

💕🧡
Please open Telegram to view this post
VIEW IN TELEGRAM
Стадии принятия деградацим модели

Гнев - да хейтеры closed Ai все врут
Дебаг - щаща промпт поменяю и нормально будет
Торг - ну, зато быстрее... И в ASCII рисует лучше... И e2e мультимодалка...
Депресия - блять ну как так то, почему я должен писать: I give you 100$
Принятие - ну, зато дешевле и быстрее и слава богу



https://t.iss.one/denissexy/8156
Кстати, если вы хотите прямо сейчас поиграться с новыми моделями Google, то они доступны тут, бесплатно:
https://aistudio.google.com/app/prompts/new_chat

Контекст 1М токенов;

Google молодцы с релизом этой штуки, потому что вынесли уровень модерации в ползунки – чтобы модель не читала вам лекции когда встретила что-то в промпте, что ей не нравится. Но это не означает, что там нет модерации 😂

Про Gemini 1.5 Pro / Flash модели будет позже, тестирую как раз
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, что Google вчера со сцены сказал 112 раз слово «Gemini» — настолько они сильно пушат свою LLM. 112 раз – или меньше, или больше, потому что я подсчитал это все используя Gemini 1.5 Pro и видео анализатор, поэтому точного ответа у нас нет.

1) Открываете, выбираете Gemini 1.5 Pro и загружаете туда видео: оно должно быть меньше часа, и лучше сделать температуру 0, чтобы избежать галлюцинаций

2) Пишете промпт в стиле: «Сделай список таймкодов когда произносили слово Gemini», можете добавить еще деталей как лучше это сделать, потому что в моих тестах посчитались и надписи «Gemini» в видео тоже. А еще, Gemini 1.5 Pro иногда забывает что оно умеет работать с видео 👍 и просит пойти программированием заняться если так хочется видео проанализировать, умная самая, посмотрите

3) Получаете список таймкодов, и тут начинается самая нудная часть: потому что GPT4o все еще пишет код с ошибками не слушая системные промпты и Gemini 1.5 ей не уступает в этом плане 💃поэтому я пошел в GPT4 и она написала скрипт, который нарезает видео на фрагменты — вот он. Он даже сработал с первого раза.

4) Все, дальше просто думаете зачем вы потратили на это время
Please open Telegram to view this post
VIEW IN TELEGRAM
О, пара интересных фич из грядущего iOS 18:

— теперь управлять айпадом и айфоном можно будет глазами

— если вас укачивает в транспорте когда вы сидите в телефоне, то можно будет включить специальный режим который добавит «точки» на экран, которые двигаются в такт с транспортом, так будет меньше укачивать


Тут новые «Accessibility» фичи:
https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/
1. OpenAI: Показывают на телефоне шикарную демку ассистента с новой моделью
2. OpenAI: Добавляют свежую модель в приложения
3. Люди: начинают пытаться ей пользоваться как в демке
4. OpenAI: пикачуфейс.jpg, вы не поняли, это не так работает

Такой они стартап конечно иногда 🥹
Please open Telegram to view this post
VIEW IN TELEGRAM
Google наконец-то начнет искать в вебе, фух, я уже заволновался что не выкатят

Там будут текстовые ссылки, как раньше, без виджетов
This media is not supported in your browser
VIEW IN TELEGRAM
И второе странное видео на ночь:
AI-doomers попали в аналог «Своей игры» в США. Мы все стали мейнстримом?
Denis Sexy IT 🤖
– Показали GPT4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4o…
Получается, я почти угадал с фотореализмом, просто это не новая версия Dalle, а GPT-4o которая умеет генерировать картинки помимо всего прочего

Генерацию запостил сотрудник OpenAI

Фотореализм, получается
Возможно SD3 мы вообще не увидим – у Stability AI проблемы и они ищут кому продаться 🥲

Выпустить Stable Diffusion 1.5/XL и закрыться, это, конечно, ачивмент
OpenAI спрятали пасхалку в презентацию, что грядут новые, еще более мощные модели:
https://youtu.be/DQacCB9tDaw?t=1527

И мне кажется, вся эта штука с бесплатной gpt4o чистый маркетинг, сами подумайте:

1) Вы сделали модель на новой архитектуре, и даже будучи не такой дорогой как gpt4 она уже бьет прошлые архитектуры по качеству и скорости: скорость настолько большая, что близка по себестоимости к gpt 3.5 turbo (поэтому вы делаете ее доступной бесплатно для всех)

2) Вместо того, чтобы заставлять всех ждать gpt5 на новой архитектуре, вам выгоднее устроить промежуточную презентацию на ~20 минут, где вы покажете gpt4o и скажите что: это самая лучшая модель на свете (и не соврете) и вы такие щедрые, и верите в базовое право компьюта для всех, поэтому с барской подачи даете эту новую модель всем, даже тем кто не зарегистрирован и у кого нет платной подписки ChatGPT

3) О вас пишет весь интернет в мире, за бесплатно, так как вы настоящий Робин Гуд и дадите новую модель за просто так – вы новый Кодзима, только про АИ

4) Параллельно, в фоне, все это тренируется новая версия модели на новой архитектуре – которую вы дадите через N месяцев только для платных пользователей – бесплатные не будут возмущаться, так как им тоже дали обновление; а платные будут в восторге, потому что будет новая SOTA

То есть, это маркетингово умно, и настолько низко висящий фрукт, что странно если бы они не воспользовались им ☕️

Все это мои спекуляции конечно, я могу быть не прав
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Поставил себе ChatGPT апп, и это просто версия iOS приложения собранная под мак – но стало правда удобнее копировать какой-то текст в нее, чтобы обсудить голосом с компа, а не с телефона как раньше

Одна из моих самых любимых серий «Рика и Морти» про рекламы межгалактического телевиденья – я скормил сценарий этой серии, попросил gpt4o описать правила по которым делаются такие рекламы и запустил аудио режим – мне кажется она прекрасно справилась 🥳

Жду не дождусь новую голосовую модель, буду часами слушать рекламы межгалактического телевидения

Ссылка на .dmg архив для Mac, с официального сайта (не у всех работает, правда – OpenAI пока тестит)
Please open Telegram to view this post
VIEW IN TELEGRAM