Denis Sexy IT 🤖
79.6K subscribers
3.18K photos
1.62K videos
21 files
4.07K links
Личный блог Дениса Ширяева (🤍🇺🇦), про технологии, интересное или актуальное.

В основном я по нейронкам. Работаю CEO в https://neural.love

⚜️ Реклама в канале возможна для юрлиц и физ-лиз у которых работает SWIFT оплата в Нидерланды

Связь: @thenbot
Download Telegram
Кстати, если вы хотите прямо сейчас поиграться с новыми моделями Google, то они доступны тут, бесплатно:
https://aistudio.google.com/app/prompts/new_chat

Контекст 1М токенов;

Google молодцы с релизом этой штуки, потому что вынесли уровень модерации в ползунки – чтобы модель не читала вам лекции когда встретила что-то в промпте, что ей не нравится. Но это не означает, что там нет модерации 😂

Про Gemini 1.5 Pro / Flash модели будет позже, тестирую как раз
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Интересно, что Google вчера со сцены сказал 112 раз слово «Gemini» — настолько они сильно пушат свою LLM. 112 раз – или меньше, или больше, потому что я подсчитал это все используя Gemini 1.5 Pro и видео анализатор, поэтому точного ответа у нас нет.

1) Открываете, выбираете Gemini 1.5 Pro и загружаете туда видео: оно должно быть меньше часа, и лучше сделать температуру 0, чтобы избежать галлюцинаций

2) Пишете промпт в стиле: «Сделай список таймкодов когда произносили слово Gemini», можете добавить еще деталей как лучше это сделать, потому что в моих тестах посчитались и надписи «Gemini» в видео тоже. А еще, Gemini 1.5 Pro иногда забывает что оно умеет работать с видео 👍 и просит пойти программированием заняться если так хочется видео проанализировать, умная самая, посмотрите

3) Получаете список таймкодов, и тут начинается самая нудная часть: потому что GPT4o все еще пишет код с ошибками не слушая системные промпты и Gemini 1.5 ей не уступает в этом плане 💃поэтому я пошел в GPT4 и она написала скрипт, который нарезает видео на фрагменты — вот он. Он даже сработал с первого раза.

4) Все, дальше просто думаете зачем вы потратили на это время
Please open Telegram to view this post
VIEW IN TELEGRAM
О, пара интересных фич из грядущего iOS 18:

— теперь управлять айпадом и айфоном можно будет глазами

— если вас укачивает в транспорте когда вы сидите в телефоне, то можно будет включить специальный режим который добавит «точки» на экран, которые двигаются в такт с транспортом, так будет меньше укачивать


Тут новые «Accessibility» фичи:
https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/
1. OpenAI: Показывают на телефоне шикарную демку ассистента с новой моделью
2. OpenAI: Добавляют свежую модель в приложения
3. Люди: начинают пытаться ей пользоваться как в демке
4. OpenAI: пикачуфейс.jpg, вы не поняли, это не так работает

Такой они стартап конечно иногда 🥹
Please open Telegram to view this post
VIEW IN TELEGRAM
Google наконец-то начнет искать в вебе, фух, я уже заволновался что не выкатят

Там будут текстовые ссылки, как раньше, без виджетов
This media is not supported in your browser
VIEW IN TELEGRAM
И второе странное видео на ночь:
AI-doomers попали в аналог «Своей игры» в США. Мы все стали мейнстримом?
Denis Sexy IT 🤖
– Показали GPT4o, самую мощную новую модель: она будет доступна для платных и ДЛЯ БЕСПЛАТНЫХ пользователей ChatGPT (даже без регистрации). Модель сейчас на первом месте по тестам сравнивая с другими лучшими моделями — и в коде и в других задачах. – GPT4o…
Получается, я почти угадал с фотореализмом, просто это не новая версия Dalle, а GPT-4o которая умеет генерировать картинки помимо всего прочего

Генерацию запостил сотрудник OpenAI

Фотореализм, получается
Возможно SD3 мы вообще не увидим – у Stability AI проблемы и они ищут кому продаться 🥲

Выпустить Stable Diffusion 1.5/XL и закрыться, это, конечно, ачивмент
OpenAI спрятали пасхалку в презентацию, что грядут новые, еще более мощные модели:
https://youtu.be/DQacCB9tDaw?t=1527

И мне кажется, вся эта штука с бесплатной gpt4o чистый маркетинг, сами подумайте:

1) Вы сделали модель на новой архитектуре, и даже будучи не такой дорогой как gpt4 она уже бьет прошлые архитектуры по качеству и скорости: скорость настолько большая, что близка по себестоимости к gpt 3.5 turbo (поэтому вы делаете ее доступной бесплатно для всех)

2) Вместо того, чтобы заставлять всех ждать gpt5 на новой архитектуре, вам выгоднее устроить промежуточную презентацию на ~20 минут, где вы покажете gpt4o и скажите что: это самая лучшая модель на свете (и не соврете) и вы такие щедрые, и верите в базовое право компьюта для всех, поэтому с барской подачи даете эту новую модель всем, даже тем кто не зарегистрирован и у кого нет платной подписки ChatGPT

3) О вас пишет весь интернет в мире, за бесплатно, так как вы настоящий Робин Гуд и дадите новую модель за просто так – вы новый Кодзима, только про АИ

4) Параллельно, в фоне, все это тренируется новая версия модели на новой архитектуре – которую вы дадите через N месяцев только для платных пользователей – бесплатные не будут возмущаться, так как им тоже дали обновление; а платные будут в восторге, потому что будет новая SOTA

То есть, это маркетингово умно, и настолько низко висящий фрукт, что странно если бы они не воспользовались им ☕️

Все это мои спекуляции конечно, я могу быть не прав
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Поставил себе ChatGPT апп, и это просто версия iOS приложения собранная под мак – но стало правда удобнее копировать какой-то текст в нее, чтобы обсудить голосом с компа, а не с телефона как раньше

Одна из моих самых любимых серий «Рика и Морти» про рекламы межгалактического телевиденья – я скормил сценарий этой серии, попросил gpt4o описать правила по которым делаются такие рекламы и запустил аудио режим – мне кажется она прекрасно справилась 🥳

Жду не дождусь новую голосовую модель, буду часами слушать рекламы межгалактического телевидения

Ссылка на .dmg архив для Mac, с официального сайта (не у всех работает, правда – OpenAI пока тестит)
Please open Telegram to view this post
VIEW IN TELEGRAM
😐 Корпорация Sony Music напряглась от такого количества генераторов музыки и приступила к запугиванию: они написали письма ~700 стартапам, с просьбой рассказать, как музыка лицензируемая Sony используется в тренировках

Это чистая атака на музыкальные GenAI стартапы, потому что закона обвязывающего показывать, что в датасете – нет

Потом будут использовать эти ответы в суде и может быть как-то прессовать тех, кто не ответят

Но я не удивлен если честно, музыкальные модели только в опенсорсе мне кажется будут развиваться, аналогично Stable Diffusion – чтобы выстоять перед давлением Sony Music нужно иметь серьезных юристов за плечами

Ссылка на новость
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Более неудобного сценария работы с таблицами авторы девайса Rabbit r1 не смогли придумать, поэтому получился такой 🌹
Please open Telegram to view this post
VIEW IN TELEGRAM
💾 Под завершение рабочей недели хотел написать довольно технический пост для тех кто любит ковырять всякие Linux устройства — поэтому, если вам технические детали не очень интересны, можете спокойно его пропустить

Linux — капризная шутка, например девайс который в видео ниже, пришел без функции «сна» которая есть в любом ноутбуке — то есть вы его можете только выключить, а не отправить в «гибернацию».

Настоящему Linux пользователю нужно добавить эту функцию в ОС самому и сделать так, чтобы она подошла под чип устройства, потому что если ошибиться — то все будет зависать (это такой вид BDSM для гиков 😘). При этом, пока вы будете это делать, количество вещей которые могут пойти не туда — не перечислить: от «подсветка экрана пропала но сам девайс включен и работает» до «оно вообще больше не грузится, что я наделал»

Раньше, я бы забил на такую тонкую настройку именно боясь все сломать — но теперь у нас есть GPT4o (которая хоть и плохо пишет код, но все еще очень умная модель).

И мне кажется я нащупал интересный вокрфлоу для тех кто много работает с консолью:

1) Естественно, вводить команды по одной с экрана ноута это то еще извращение — поэтому нужно сделать GPT-ассистента прямо в терминале, который очень удобно поможет решать linux-проблемы не покидая консоль (а контекстного окна хватает даже на dmesg, или можно делать штуки типа «cat denis-loh.txt | chatgpt «Чего там хоть написано?»); Делается это просто — ставим «chatgpt-cli», по ссылке написано описано как ее устанавливать и настраивать; работает с Linux, Mac, Windows.

2) Дальше интереснее: каждый Linux — яркая звездочка (индивидуальная порваха), которая только и ждет сломаться если вы ошиблись в одной команде. И версий Linux огромное количество — единых инструкций для «всех Linux систем» почти не бывает.

Поэтому: сначала я выгрузил все детали моей ОС, версии ядра, и прочие непонятные вещи, а потом пошел в недавно созданную мной GPT «Agent Prompt Generator for LLM’s» и уже ее попросил «Make an expert specifically for my version of Linux, here are the details of my system: ...» — в итоге получился длинный промпт который я добавил в «chatgpt-cli» как дефолтный (только yaml файл форматируйте правильно).

3) А дальше, я настроил вообще все свои смелые и потаенные фантазии с этой штукой:
Девайс теперь и засыпает, и доступен откуда угодно через удаленный рабочий стол, и обновлен до самой актуальной версии ядра, и Fallout 1 на нем идет и тп.

Потому что любая ошибка которая возникала — сразу шла в GPT4o-эксперта, который говорил мне что делать и как пофиксить. Искренне вам советую любую новую систему настраивать с GPT4o, в 100 раз быстрее и проще чем поиск ошибок в интернете.

Девайс теперь идеально готов к отдыху на полке, потому что зачем он мне я все еще не знаю 🫡
Please open Telegram to view this post
VIEW IN TELEGRAM