Denis Sexy IT 🤖

Девушки этих парней – нам нужно серьезно поговорить:

У нас тут снова переизобретение электричества происходит и нужно реагировать как в этих мемах – 😮

😆

😮

😱

😮

😬

Спасибо за понимание

Please open Telegram to view this post

VIEW IN TELEGRAM

36.3K views21:24

Denis Sexy IT 🤖

Forwarded from Сиолошная

С утра читаю отзывы людей (негативные опущены, они тоже есть):
— Вау, такой голос! Как живое!
— Невероятно, всё утро веду диалог, мне теперь живые люди не нужны!

Штука в том, что свежая модель на данный момент для пользователей генерирует лишь текст. Генерацию голоса новой моделью, а также создание картинок завезут позднее, «в ближайшие недели».

Представьте, что будет когда включат эту функциональность, как люди обрадуются

😀

То есть как работало мобильное приложение ChatGPT раньше:
— Одна модель слушает вас, переводит речь в текст. На этом этапе теряются все эмоции, никаких тегов <вздох> или *радостно* там нет — просто текст
— Текст подаётся в GPT-4-Turbo (вторую модель) на вход (как будто бы вы сами написали сообщение своими руками)
— Эта модель генерирует ответ текстом
— Этот текст озвучивается третьей моделью. Она не может петь, шептать, играться интонацией. Если в запросе попросите её это сделать — она не будет следовать инструкции

Насколько я понимаю, на сегодняшний день эта функциональность сохраняется — несмотря на то, что модели с номерами 1 и 3 можно заменить на новую GPT-4o (она может нативно слушать вас и генерировать голос сразу, без вспомогательных средств). OpenAI не выкатывают всё сразу. А вот модель 2 как раз заменили. То есть сами ответы могут показаться умнее, уровень понимания тоже повысился — потому что LLM стала мощнее. И скорость выросла.

Не верите? Попробуйте попросить отвечать медленнее/быстрее, или даже шёпотом.

Sorry to disappoint you 🤷‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

29.3K views07:57

Denis Sexy IT 🤖

Киберпанк который мы заслужили

33.4K views08:25

Denis Sexy IT 🤖

Давно не было милых новостей в стиле SimCity 3000 – новая модель Claude 3 Opus тоже умеет в кучу языков, так что вот ее версия: 🔸 Местный житель вырастил помидор в форме сердца, подарив его своей возлюбленной на годовщину 🔸 Местные белки начинают использовать…

Давно не было милых новостей в стиле SimCity 3000 – вот версия от GPT-4o:

🔸 Кошка захватила мэрский офис, требуя бесплатного тунца для всех. Жители города поддерживают её кандидатуру.

🔸 Робот-пылесос стал героем дня, спасая хомячка из-под дивана. Теперь его зовут Суперпылесос.

🔸 Гигантская тыква выросла на крыше мэрии. Теперь она служит новой городской достопримечательностью и кафе.

🔸 Местная белка стала звездой социальных сетей, собирая орехи в форме сердечек. Жители дарят ей орехи каждый день.

🔸 Птица-певчая взяла под контроль городской светофор, поет песни на зеленый свет. Водители благодарны за музыкальные остановки.

🔸 Городской пруд захватили утки, организовав утиную регату. Победители получают золотые булочки.

🔸 Местный фермер вырастил арбуз в форме звезды. Симы считают, что это новый символ города.

🔸 Бабочка стала сенсацией, случайно прилетев на заседание городского совета. Все решения теперь принимаются с её согласия.

🔸 Городской почтальон на велосипеде заменен на почтового дрона, который раздает письма вместе с печеньем.

🔸 Местный музыкант учит кошек играть на пианино. Теперь каждую ночь город наполнен мелодичными мурлыканьями.

🔸 Местный хорек стал мэром города после случайного голосования. Жители утверждают, что его решения значительно улучшили городскую инфраструктуру, особенно туннели.

🔸 Почтовый голубь случайно доставил любовное письмо в соседний город, вызвав цепочку романтических встреч.

🔸 Власти города заменили все уличные фонари на светлячков. Жители довольны природным освещением.

🔸 Роботы-бариста готовят кофе с художественными рисунками на пенке. Теперь у каждого кофе своя история.

🔸 Городская библиотека ввела программу 'чтение с котом'. Теперь каждый читатель получает мурлыкающего напарника.

🔸 В зоопарке открылась школа танцев для слонов. Их выступления собирают аншлаги.

🔸 Местные жители случайно обнаружили подземный город хомяков. Экскурсии проводятся каждую субботу.

🔸 На городской площади установлен фонтан с мыльными пузырями. Дети и взрослые не могут наиграться.

🔸 Городская станция метро начала использовать вагоны для пикников. Пассажиры наслаждаются путешествиями с бутербродами.

🔸 Жители города нашли способ выращивать миниатюрные деревья-бонсай на балконах. Теперь у каждого дома своя зеленая мини-аллея.

🔸 В зоопарке открылась школа фехтования для пингвинов. Туристы не могут поверить своим глазам, наблюдая за их поединками на льду с миниатюрными рапирами.

🔸 Власти города заменили все автобусы на гигантские тапки. Симы признают, что новый транспорт мягкий, уютный и идеально подходит для коротких поездок.

Прошлая подборка.

Denis Sexy IT 🤖

Давно не было милых новостей в стиле SimCity 3000 – новая модель Claude 3 Opus тоже умеет в кучу языков, так что вот ее версия:

🔸 Местный житель вырастил помидор в форме сердца, подарив его своей возлюбленной на годовщину

🔸 Местные белки начинают использовать…

31.6K views13:36

Denis Sexy IT 🤖

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

На Google I/O показали новые AI штуки и пока я не увижу в проде, я не вижу смысла о них писать свои мысли – это уже второй Goole I/O где показывают AI-фичи для поиска, для Gmail и тп. и их как в меме с рыбами, только показывают (или уже встроили и показывают повторно, типа быстрых ответов на почту 🙂)

Из любопытного (как по мне):

– Показали конкурент SORA который понятно, что никто из нас не потрогает;

– Показали новый генератор картинок Imagen 3 который пока что никто из нас не потрогает (вход по заявкам и не для всех стран);

– Вернули функцию «Magic» в Google Sheets, если помните, была такая – выделяли ячейки и появлялись быстрее инструменты процессинга данных, теперь работает на Gemini и эта фича которую я правда ждал назад;

– Сделали свой платный аналог ChatGPT – Gemini App, буквально копия почти 1 в 1 – там есть свои GPT которые называются Gems, поддержка 35+ языков; сказали что аудио-асситента можно перебивать и угадайте показали ли демку этого ассистента 👍 (нет, дайте угадаю когда добавили эту фразу в презентацию хехе);

– Gemini еще больше интегрируют в Android, прям на уровень системы – удобно для пользователей Android. Ждем такое же в Siri + OpenAI;

– А это вызовет wild fire среди любителей безопасности данных: Gemini теперь слушает ваши телефонные разговоры сама по себе, процессинг случается на устройстве и может предупредить что вам позвонил «сотрудник тюрьма-банка и пытается вас заскамить». Надеюсь дадут отключать постоянную прослушку, в мире для этого уже есть органы.

Остальное вы уже видели в том или ином виде, саму модель Gemini 1.5, я бы хотел увидеть в результатах тестов.

P.S. Довольно кринжово выглядит когда спикер замирает ожидая аплодисменты и зал никак не реагирует, думаю разойдется на нарезки

Please open Telegram to view this post

VIEW IN TELEGRAM

45.6K viewsedited 18:36

Короче, я потратил сегодня весь день пытаясь делать разные промпты «эксперта в написании кода» под GPT-4o и у меня пока не очень хорошие новости:

— Чистый ChatGPT на GPT-4o пишет код лучше (!) чем запромченый эксперт через API, такого я еще не видел;

— Помните я писал раньше про модель «im-a-good-gpt2-chatbot» о которой мы мало что знаем и она мне понравилась больше всего? Она все еще лучше всех, не пропускает инструкций и слушается;

В видео есть 3 вида змейки написанных с первого раза (то есть я не дебажил код самой моделью, просто копировал его и запускал — все модели прекрасно дебажат сами себя если попросить, я тестировал генерацию с первого раза):

— GPT-4o БЕЗ какого-либо промпта, кроме системного промпта ChatGPT: модель сделала симпатичную игру которая сразу работает, нормально считает очки и тп. Код.

— GPT-4o С моим системным промптом, где я ей говорю какая она классная в разработке и описываю детально как лучше писать код: во-первых, не с первого раза игра заработала, пришлось пару раз делать перегенерации — я пробовал и длинные и короткие системные промпты, ей все равно. Во вторых, игра с багами — очки считаются x10, при врезании в стену показывается алерт JS с очками который я отключил потому что невозможно же. Код.

— Im-a-good-gpt2-chatbot с тем же самым промптом разработчика выше: сделала прекрасную игру, которая считает правильно очки, содержит игровое сообщение «Game Over» и в целом норм работает. Код.

Я утром читал какие-то негативные комментарии про GPT-4o, и подумал что люди просто хейтят ClosedAI, такое часто происходит — а сейчас вижу, что есть за что — модель плохо промптится.

Поэтому:
1) Или так задумано
2) Или у OpenAI баг в API
3) Или нас ждет скорый релиз еще лучшей модели – «im-a-good-gpt2-chatbot», а GPT-4o чисто для аудио-ассистента сделана (это мое мнение, высосанное из пальца)

P.S. Мой текущий промпт разработчика, который хорошо работает (execution mode штука только для моделей OpenAI и не ясно он вообще работает или нет, удалите если в другие модели понесете)

36.9K viewsedited 21:38

Denis Sexy IT 🤖

Ну я

💕

🧡

Please open Telegram to view this post

VIEW IN TELEGRAM

30.6K views22:25

Denis Sexy IT 🤖

Forwarded from Love. Death. Transformers.

Стадии принятия деградацим модели

Гнев - да хейтеры closed Ai все врут
Дебаг - щаща промпт поменяю и нормально будет
Торг - ну, зато быстрее... И в ASCII рисует лучше... И e2e мультимодалка...
Депресия - блять ну как так то, почему я должен писать: I give you 100$
Принятие - ну, зато дешевле и быстрее и слава богу

https://t.iss.one/denissexy/8156

Denis Sexy IT 🤖

Короче, я потратил сегодня весь день пытаясь делать разные промпты «эксперта в написании кода» под GPT-4o и у меня пока не очень хорошие новости:

— Чистый ChatGPT на GPT-4o пишет код лучше (!) чем запромченый эксперт через API, такого я еще не видел;

— Помните…

31.6K views22:25

Denis Sexy IT 🤖

Кстати, если вы хотите прямо сейчас поиграться с новыми моделями Google, то они доступны тут, бесплатно:
https://aistudio.google.com/app/prompts/new_chat

Контекст 1М токенов;

Google молодцы с релизом этой штуки, потому что вынесли уровень модерации в ползунки – чтобы модель не читала вам лекции когда встретила что-то в промпте, что ей не нравится. Но это не означает, что там нет модерации 😂

Про Gemini 1.5 Pro / Flash модели будет позже, тестирую как раз

Please open Telegram to view this post

VIEW IN TELEGRAM

32.7K views14:09

Denis Sexy IT 🤖

2:06

This media is not supported in your browser

VIEW IN TELEGRAM

Интересно, что Google вчера со сцены сказал 112 раз слово «Gemini» — настолько они сильно пушат свою LLM. 112 раз – или меньше, или больше, потому что я подсчитал это все используя Gemini 1.5 Pro и видео анализатор, поэтому точного ответа у нас нет.

1) Открываете, выбираете Gemini 1.5 Pro и загружаете туда видео: оно должно быть меньше часа, и лучше сделать температуру 0, чтобы избежать галлюцинаций

2) Пишете промпт в стиле: «Сделай список таймкодов когда произносили слово Gemini», можете добавить еще деталей как лучше это сделать, потому что в моих тестах посчитались и надписи «Gemini» в видео тоже. А еще, Gemini 1.5 Pro иногда забывает что оно умеет работать с видео 👍 и просит пойти программированием заняться если так хочется видео проанализировать, умная самая, посмотрите

3) Получаете список таймкодов, и тут начинается самая нудная часть: потому что GPT4o все еще пишет код с ошибками не слушая системные промпты и Gemini 1.5 ей не уступает в этом плане 💃поэтому я пошел в GPT4 и она написала скрипт, который нарезает видео на фрагменты — вот он. Он даже сработал с первого раза.

4) Все, дальше просто думаете зачем вы потратили на это время

Please open Telegram to view this post

VIEW IN TELEGRAM

32.4K viewsedited 15:27

Denis Sexy IT 🤖

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

О, пара интересных фич из грядущего iOS 18:

— теперь управлять айпадом и айфоном можно будет глазами

— если вас укачивает в транспорте когда вы сидите в телефоне, то можно будет включить специальный режим который добавит «точки» на экран, которые двигаются в такт с транспортом, так будет меньше укачивать

Тут новые «Accessibility» фичи:
https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/

35.7K views15:55

Denis Sexy IT 🤖

1. OpenAI: Показывают на телефоне шикарную демку ассистента с новой моделью
2. OpenAI: Добавляют свежую модель в приложения
3. Люди: начинают пытаться ей пользоваться как в демке
4. OpenAI: пикачуфейс.jpg, вы не поняли, это не так работает

Такой они стартап конечно иногда 🥹

Please open Telegram to view this post

VIEW IN TELEGRAM

33.5K viewsedited 19:56

Denis Sexy IT 🤖

Google наконец-то начнет искать в вебе, фух, я уже заволновался что не выкатят

Там будут текстовые ссылки, как раньше, без виджетов

84.8K views21:24

Denis Sexy IT 🤖

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

Transformers_movie_2024_RePack_от_xatab.avi

80.7K views22:17

Denis Sexy IT 🤖

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

И второе странное видео на ночь:
AI-doomers попали в аналог «Своей игры» в США. Мы все стали мейнстримом?

35.9K views22:24

Denis Sexy IT 🤖

– Показали GPT4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4o…

Получается, я почти угадал с фотореализмом, просто это не новая версия Dalle, а GPT-4o которая умеет генерировать картинки помимо всего прочего

Генерацию запостил сотрудник OpenAI

Фотореализм, получается ✅

40.6K views23:36

Denis Sexy IT 🤖

Возможно SD3 мы вообще не увидим – у Stability AI проблемы и они ищут кому продаться 🥲

Выпустить Stable Diffusion 1.5/XL и закрыться, это, конечно, ачивмент

52.9K viewsedited 08:11

Denis Sexy IT 🤖

OpenAI спрятали пасхалку в презентацию, что грядут новые, еще более мощные модели:
https://youtu.be/DQacCB9tDaw?t=1527

И мне кажется, вся эта штука с бесплатной gpt4o чистый маркетинг, сами подумайте:

1) Вы сделали модель на новой архитектуре, и даже будучи не такой дорогой как gpt4 она уже бьет прошлые архитектуры по качеству и скорости: скорость настолько большая, что близка по себестоимости к gpt 3.5 turbo (поэтому вы делаете ее доступной бесплатно для всех)

2) Вместо того, чтобы заставлять всех ждать gpt5 на новой архитектуре, вам выгоднее устроить промежуточную презентацию на ~20 минут, где вы покажете gpt4o и скажите что: это самая лучшая модель на свете (и не соврете) и вы такие щедрые, и верите в базовое право компьюта для всех, поэтому с барской подачи даете эту новую модель всем, даже тем кто не зарегистрирован и у кого нет платной подписки ChatGPT

3) О вас пишет весь интернет в мире, за бесплатно, так как вы настоящий Робин Гуд и дадите новую модель за просто так – вы новый Кодзима, только про АИ

4) Параллельно, в фоне, все это тренируется новая версия модели на новой архитектуре – которую вы дадите через N месяцев только для платных пользователей – бесплатные не будут возмущаться, так как им тоже дали обновление; а платные будут в восторге, потому что будет новая SOTA

То есть, это маркетингово умно, и настолько низко висящий фрукт, что странно если бы они не воспользовались им ☕️

Все это мои спекуляции конечно, я могу быть не прав

Please open Telegram to view this post

VIEW IN TELEGRAM

42.7K viewsedited 12:46

Поставил себе ChatGPT апп, и это просто версия iOS приложения собранная под мак – но стало правда удобнее копировать какой-то текст в нее, чтобы обсудить голосом с компа, а не с телефона как раньше

Одна из моих самых любимых серий «Рика и Морти» про рекламы межгалактического телевиденья – я скормил сценарий этой серии, попросил gpt4o описать правила по которым делаются такие рекламы и запустил аудио режим – мне кажется она прекрасно справилась 🥳

Жду не дождусь новую голосовую модель, буду часами слушать рекламы межгалактического телевидения

Ссылка на .dmg архив для Mac, с официального сайта (не у всех работает, правда – OpenAI пока тестит)

Please open Telegram to view this post

VIEW IN TELEGRAM

44.1K viewsedited 15:15

About

Blog

Apps

Platform