Метаверсище и ИИще
37K subscribers
4.67K photos
2.89K videos
40 files
5.74K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Clubhouse, который мы заслужили.

Помните такой проект. Красивый был, но умер. Но ничего, скоро возродится. Навалю диванных мыслей про это.

Смотрите, есть две новости.

Несвежая: Zoom объявил о том, что в скором времени они позволят вам создавать ИИ-аватар, который вы сможете использовать для отправки коротких сообщений своей команде. Ну то есть только для сообщений.


Свежая: HeyGen вчера бахнул подключение (своих) ИИ-аватаров к встречам в Zoom. Поглядите ролик в шапке. Да, пока нельзя своих, только хейгеновских.

Но промотаем чуть вперед. И вот уже на встречах сидят ваши аватары и долго трут за жизнь и бизнес. Возможно бесконечно. Ведь метрики в корпоративном сегменте - время упорной работы, часы на совещаниях, объем переписки и документов. У каждого за спиной своя ЛЛМ-ка, подученная и зарагованная на ваших переписках, переговорах, доках. И вот они изрыгают цепочки мыслей, брейнстормят, а аватары все это эмоционально излагают.

А за Клабхаус следующий пост. А то кожаным, в отличие от ИИ, тяжело читать лонгриды.

А что тут делает тетенька на синем фоне, спросите вы.
А это специально для вас, ловцы блох. Вот так сейчас выглядят кожаные на официальных корпоративных стримах самого Zoom. Но если бы я вам этого не сказал, вы бы развопились - липсинк говно, не попадает в речь, зубы смазаны, мимика мэртвая, двигается неестественно. В общем уже сейчас практически нельзя отличить пожатый стрим от нейроаватара. И не делайте вид, что сможете отличить.

@cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
А теперь за Клабхаус.

Берем NotebokLM, в который кстати приподсунули новые фичи:
Теперь вы можете настраивать подкасты с помощью кастомных инструкций. Вы можете экспериментировать с тоном, целевой аудиторией, конкретными темами, источниками и т. д.

Для тех кто в танке это пока еще существующий сервис от Гугла, который берет на вход любой текстовых документ (статья, страница в вебе, пдф, эссе) и превращает его в подкаст, где два ИИ-подкастера очень ловко трут голосом за тему, изложенную в документе. Этакая аудиокнига на двоих или радиоспектакль(слово то какое).

Так вот берем NotebokLM и кормим ему хайповые темы. Генерятся подкасты тоннами.
Потом с полки берется запылившийся Клабхаус (для тех кто в танке, погуглите), и туда, в его комнатки наливается все это добро. Туда также пристегиваютcя полчища ботов, которые задают вопросы по темам.
Ну и можно навалить сверху аватаров из предыдущего поста.

Получаем бесконечно телевидение. ИИ-Клабхаус на стероидах.

А кожаные сидят и внимают. Как было с Клабхаусом. Сбежались все, я помню, как бандерлоги к Каа.

А продавцы трафика уже считают прибыли.

Кстати, ютюб уже потихоньку забивается этим говном, сгенеренным с помощью NotebookLM. И как обычно, жемчужины тонут в мире шлака, ибо метрики у нас - количество, а не качество.

@cgevent
Мультимодальность выведет языковые AI-модели на новый уровень развития и сделает их еще более эффективными, уверен директор лаборатории FusionBrain Института AIRI Андрей Кузнецов.

Выступая на сессии «AI Journey: путешествие в мир искусственного интеллекта» на GITEX Global 2024 в Дубае он рассказал, что языковые модели уже стали стандартом эффективных решений для науки и бизнеса, однако мир не стоит на месте и пользователи ждут AI-решения, которые позволят решать широкий спектр привычных каждому человеку задач на стыке текста, изображений, аудио, видео и других типов данных.

Также в ходе сессии спикеры Сбера, Института AIRI и группы компаний ЦРТ обсудили, какие шаги необходимы для разработки суверенной языковой модели и почему важно развивать критическое мышление при работе с AI.

GITEX и Дубай - это уже уровень. И вопросы вполне серьезные, и компетенции - норм.
Рубрика крутые подписчики.

Тут вот народ рядится по поводу ИИ - это пока игрушки, для бизнеса не годится, слишком много рисков, это для картинок и для поиграцца.

Я вынесу из коментов пост от Дениса Лучанского. Без купюр. Пока некоторые играюцца, взрослые мальчики берут и делают.

Занялся разработкой и производством еды для ЗОЖ, худеющих и диабетиков в Израиле. Сейчас поставляю её в 25 магазинов, до конца года, надеюсь, будет 50. Два завода на подряде (десерты + мороженое), топовые продукты - вкусные, качественные, продаются лучше, чем продукты конкурентов, хорошие условия сотрудничества для магазинов ("Mafia offer", AKA "Unrefusable offer", AKA "Предложение, от которого невозможно отказаться").

Помимо того, что ИИ используем в R&D (подбор ингредиентов) и в маркетинге/рекламе (генерит креативы, дает маркетинговые консультации, генерит учебные видео для продавцов в магазинах, и пр.), прикрутил ИИ в чат-боте в телеге для поддержки и консультаций 24/7 для моих ЦА, разработал и протестировал услуги кейтеринга, нашел подрядчиков на 8000 порций еды в день, нашел клинику с лицензией. Теперь со всем этим скрабом соберу "из говна и палок" (как я люблю) платформу, и начну заходить в корпоративное питание. Цель - кормить ежедневно десертами и кейтерингом 1000+ сотрудников хайтека и прочих больших компаний в Тель Авиве и окрестностях. Следующая цель - 8000 сотрудников. Следующая цель - 10% населения Израиля (миллион) + выход на другие рынки.

Пока это голубой океан, и еще какое-то время так и будет. За это время я расширю свои границы, и снова буду в голубом океане.


@cgevent
Я уже много писал про Voxon

Это такие голографические трехмерные, даже не дисплеи, а цилиндры.

И еще 4 года назад - это выглядело круто.

А сейчас у них в твитторе гордое:
What happens when you mix AI with 3D Volumetric Display tech?

И тут хочется токсично ответить:
Shit happens

Но я не буду, а лишь замечу, что качество не выросло, аватары выглядят кринжово, а картинка родом из 90-х.

Ну да, поддержка Unity...

Я просто не вижу ниш, куда это может зайти. Просветите меня.

Проще уж испортить прическу лыжной маской от Эппле..

Вы еще цену не знаете..
https://www.voxon.co/

@cgevent
Я не очень люблю кидать ссылки на ютюб. Для меня все это TL;DV

Однако Коридоров люблю за подачу и за, естественно, постпродакшен видосов.

Очень интересно послушать, как профики из VFX разбирают дипфейки и генеративные картинки.
Ну и в конце они поднимают вопрос, а что вообще в наши дни можно считать скамом, а что нет.
Вот эти вот все ИИ-картинки с амазон - чем они отличаются от дипфейка с крипто-илоном-маском, впаривающим свои тесла-токены?

Посмотрите, как надо делать видосы, это смешно и познавательно.

Познавательно про язык тела и язык головы (которые на дипфейках разъезжаются), про уровень чорного во рту, про кадык, про то, что улыбаясь мы киваем назад, а не наоборот. Про одинаковый шум в каждом RGB-канале, тоже любопытно.
Ну и про диван-гориллу на 10 косых просто прекрасно.

Поглядите, хорошо для вечера пятницы.
https://www.youtube.com/watch?v=NsM7nqvDNJI

@cgevent
Держите веселых картинок с утра.

Вбиваете вот такой вот промпт в Flux или chatGPT:

A minimalist black and white stylized artwork of a [PROMPT], having fewer and thinner lines. The image should depict the [PROMPT], in a flowing, abstract design using very sleek, continuous line drawing. The background remains solid black to emphasize the minimalist aesthetic and the elegance of the slim white line art.

Заменяете [PROMPT] на ваш промпт\объект, и получаете лайнарт.

Напишите, как работает в Midjourney.

Я с утра наваял логосов во Флюксе.

"2d logo of wolf", например

@cgevent
Media is too big
VIEW IN TELEGRAM
Слушаем музику "на разном уровне громкости ИИ".

Рубрика крутые подписчики.


Мой приятель Дима Киселев и по совместительству режиссёр, сценарист, оператор, актёр (Черная Молния, Лондонград (one love!), Елки, Мира)
сделал то, что я давно собирался попробовать. Берете любимый трек или альбом - и делаете бесконечное количество каверов. С помощью ИИ. Например, старых (я хочу сделать рекаверы Пети Мамонова и Радио Африка) или новые, которые качают, но вы хотите другого звука или аранжировок. Для себя, не для дистрибуции.
И он высказал отличную идею для будущего: вот слушаете вы пестню, а рядом кнопочка "Кавер". Жмете, и получаете новое звучание, аранжировку, прочтение. Это как после хорошего кино, хочется побыть в его мире еще немного.
Ну и пока админ пишет глупые тексты, подписчики берут и делают.
Оставим за рамками дискуссии про авторские, я специально акцентирую, что это "для себя" и для прослушивания "на разном уровне громкости ИИ".

Короче, я пойду рекаверить "Муха источник заразы", а вы почитайте следующий пост, там есть трюки, как заставить ИИ не ругаться на авторские права.

В шапке кавер на Kurwa от Little Big от Димы и ИИ. Видео - это тоже новое прочтение Шинед о'Коннор с помощью Midjourney и глитчей.

Ну, за кавер группы.

Смотрите след пост, как это делалось.
⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️⬇️

@cgevent
Please open Telegram to view this post
VIEW IN TELEGRAM
Вышел трек от великого и ужасного Литтл Биг "КУРВА".
Скажу сразу, музыку я оцениваю не головой и даже не ушами, а жопой. Если жопа начинает дергаться в такт, то к ее вибрациям потом подключаются ноги руки, а там уж и до головы с ушами доходит. Так вот, тут все завибрировало сразу. И бывает такое, что трек понравился, послушал его десять раз на репите и подкатывает желание послушать теперь альбом ремиксов на него. Раньше я за такими альбомами прям охотился, ведь на них попадались прям шедевры (одна "Видели ночь" от Здоб ши Здуб чего стоит).

В общем, решил я сделать себе ремиксов сам.
Засунул трек в Суно. Суно ругнулось на копирайт. Решил этот вопрос понижением питча и скорости на 5%. Прокатило. Текст подтянул в промт и понеслось.
За пару часов у меня было треков 20 годного качества в разных стилях и жанрах, плюс пара фаворитов. Ими я и хотел поделиться.
С помощью легкой генерации сделал видеоряд для них (Миджорни плюс CapCut) и для удобства залил на ютубчик и в
тикток.
Первый - качовый клубный рэпчик
Второй - разухабистая панк-альтернатива (под этот прям хочется попрыгать и поорать).

В общем, эксперимент меня очень вдохновил. Надеюсь, в скором времени такие генерации будут прилагаться к треку прямо в приложении-плеере по умолчанию. А если прям очень хочется - целиком бесконечная радиостанция с вариациями понравившегося. Ощущение, что все инструменты для этого уже изобретены!


Источник

@cgevent
Ну и вот держите коллекцию рекламных ИИ-каверов.

Только это уже не каверы, а примеры того, как взрослые мальчики не играются с ИИ, а вовсю пользуют его в производстве.

В некоторых роликах чистый ИИ, от картинок и заканчивая звуком, обычно это Suno.
В других (как например мишки в бейсболках), есть композ и пост - это самый профессиональный ролик, наверное.
Некоторые ролики - работы с конкурсов.
У китайцев смешная реклама, да, иная.

Но суть в том, что пока мы тут рядимся, кто лучше Клинг или Минимакс, Суно или Удио, ребятки уже впахивают.

Ибо понимают, сколько бы это стоило сделать "по-старому". И если клиент доволен, то кого трясут ИИ-шные артефакты?

Если вам интересно, как это было сделано, то вот вам исходники:
1, 2, 3, 4, 5, 6, 7

@cgevent