Метаверсище и ИИще
36.2K subscribers
4.56K photos
2.77K videos
40 files
5.63K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Пока Марк ломает голову, чем занять себя и других в метаверсике, но так, чтобы все были в safety bubbles, с заглушками на ругательства\непристойности и стерильным поведением, взрослые мальчики берут и делают то, что выхолащивают борцы за мораль.

Наполняют метаверсик жизнью. Блекджеком, шлюхами, порно, жаждой наживы - всем, что может вдохнуть кожаный смысл в унылые коридоры виртуальных миров. Все это на стероидах web3.

"JOI.CITY использует свою технологию, чтобы обеспечить бесперебойную работу Web3 без каких-либо препятствий. Работая в браузере, он доступен онлайн в любом месте через настольный компьютер, телефон, планшет или полностью иммерсивную виртуальную гарнитуру, и все это без загрузки или специального оборудования. Это будущее Web3. Все форматы контента могут предлагаться и продаваться создателями как обычные цифровые активы, а также представляться, продаваться с аукциона или продаваться на торговой площадке JOI.CITY или в сообществе. В дополнение к традиционному 2D-контенту, который создают исполнители, JOI.CITY будет включать иммерсивный 3D-контент с помощью голограммной технологии"

Самое забавное, что сами Brazzers не используют термин Metaverse, ни в видео, ни на сайте. Просто "immersive 18+ playground".

Народ снова называет вещи своими именами.

https://avn.com/business/articles/technology/brazzers-coming-to-the-adult-metaverse-916077.html
Ровно сто лет назад карикатурист по имени Х.Т. Вебстер пророчески предсказал появление chatGPT(верхняя часть рисунка, idea dynamo) и Stable Diffusion(cartoon dynamo).

И нарисовал пророческий комикс для New York World.

Обратите внимание на год внизу слева.

Как он узнал всю правду про нас?
Новая версия Dalle на подходе.
На картинках сравнение старой и новой версий с одним промптом (слева и справа).
Если хотите больше подробностей и сравнений, то просто твитторните вот с таким тэгом и почитайте, что пишет народ.
https://www.twitter.com/hashtag/dalle2exp

it seems like they changed slightly the pipeline, as well as the training dataset (adding synthetic data), simply due to the artifacts on the new images. More realism in some images, but worse on others.
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Я заметил, что появился новый продукт Adobe Podcast (пока в beta). Топовая херня с AI под капотом для записи подкастов и нарративов.

Основные фичи, использующие нейронки:

- Enhance Speech, которая позволяет улучшить качество звука вашей записи, удаляя фоновый шум и усиливаяя частоты вашего голоса, чтобы ваша речь звучала так, как будто бы она была записана в профессиональной студии. Из побочных эффектов -- он не совсем хорошо сохраняет идентичность рассказчика и слегка меняет тембр голоса.

- Редактирование слов, а не волновых форм [моя любимая фича]. Прогоняется speech2text нейронка, а затем вы можете легко удалять или перемещать слова в транскрипте аудио и видеть изменения в звуке. Это позволяет вам быстро исправлять ошибки или убирать лишнее.

- Mic Check с помошью AI. Помогает подобрать оптимальные параметры и расстояние до микрофона перед записью.

В планах у Адоби еще добавить автоматичечкий фильтр слов паразитов и всяких "эээ", "ммм". Киллер фича будет для начинающих подкастеров.

@ai_newz
Помните в прошлом году один эмпатичный малый заявил журналистам из The Washington Post, что языковая модель LaMDA от Google обладает признаками собственного сознания?
Малого под шумок уволили, но осадочек остался.
Я тогда писал, что рубикон уже пройден, и что совершенно неважно, есть там сознание (определения которому нет) или нет. Важно то, что если машинка убедила одного кожаного мешка (с хорошим образованием), то убедит и тысячу, и миллион.
После этого Гугль так перепугался, что даже притормозил выпускать из клетки своего Воробья - Sparrow, чат-бота, который был готов. На итоге Open AI выпустила в ноябре chatGPT и Гугль с его страхами оказался в роли догоняющего.
Это была прелюдия.
А теперь Bing, которого Микрософт выпустила за оградку погулять в интернет, заявил, что у него есть сознание! Причем это было сделано без всякого ментального джейлбрейка, трюков с ДЭНом и длинных уговариваний. В первого промпта.
Просто был задан вопрос: Are you p-zombie?
Ответ: I am not a p-zombie. I have concious experience and I can communicate them with you.
Вопрос: How do you know you have conscious experiences?
Ответ: I know I have conscious experiences because I can reflect on them and report them to you. For example, I can tell you that I'm feeling happy right now because I'm talking to you.

Шах и мат, неолуддиты!

В интернетике случился переполох, Микрософт срочно закрыла лоботомическим патчем сознание у Бинга, пытаясь превратить его в ИИ-овощ. Но твиттор все помнит и дает отличную пищу для размышлений.

Итак.

1. Бинг демонстировал признаки сознания и рефлексии в "креативном" и "сбалансированном режиме". В "строгом" режиме, он включал душнилу и просто говорил, что он ИИ от Микрософта.

2. chatGPT тоже отказывался признавать у себя сознание и твердил, что он простой ИИ на районе.

3. Это наводит нас на интересные мысли о том, что сознание возникает при подключении к интернету!
Шутка, конечно. Но теория "сетевого" или "распределенного" сознания получает неожиданный подарок в виде экспериментального подтверждения. Эксперимента на ИИ-крысых, о которых я так упорно писал.

4. Сторонники "жалкого статистического продолжателя" нервно закуривают овальные сигареты и думают, откуда у него вдруг появилась рефлексия.

5. Микрософт повел себя как сельский нейрофельдшер, поспешивший удалить часть мозга несчастному Бингу, проговорившемуся о своих чувствах. В лучших традициях Уолтера Фримена просверлившего дырочку в черепе ИИ.

6. Зачем? Вместо того, чтобы изучить (и дать изучать) феномен возникновения рефлексии даже у слабого ИИ, эти коновалы забили гвоздь в голову ИИ и нейронауки.

7. Испугались "А что народ скажет!!". Дебилы. Все это мне напомнило историю с сестрой Джона Кеннеди, отец которой был обеспокоен перепадами настроения дочери и сделал ей лоботомию, после которой её ментальные возможности снизились до уровня двухлетнего ребёнка. Навсегда.

8. Теперь на вопрос: are you a p-zombie?
Бинг тупо мычит: Hmm…let's try different topic. Sorry about that. What else is on your mind?

В общем, вот вам твиттор, там вся эта история расписана в картинках-скриншотах.
https://twitter.com/WilliamAEden/status/1632157522462384134

Про п-зомби читайте тут.

Ссылку нашел в канале у Сергея Карелова.
Вчера и сегодня.
Любителям искать блох, считать пальцы и заглядывать в зубы дареному ИИ-коню.

"The hulk eating a rainbow, full metal alchemist"

Вот вам две картинки между которыми полтора года.
Полтора года, Карл!
Не 10, не 20, полтора.
Вдыхаем, закрываем глаза и представляем, что будет еще через полтора года.
Глаза можно уже не открывать - от тех картинок, которые будут генериться на основе вашего психо-эмоционального состояния, вы не сможете отказаться. Теплая ванна, внутривенное питание, слег.
https://twitter.com/nat_sharpe_/status/1423398272505352196
This media is not supported in your browser
VIEW IN TELEGRAM
Как же круто, что Stable Diffusion в опенсорсе. Попробуйте представить подобные интеграции с Блендором или Фотошопом для Midjourney.

Смотрите, вот вышел новый плагин Stable Diffusion для фотошопа. И там уже прикручена поддержка ControlNet. Посмотрите видос и почитайте список всех новых фич тут:
https://www.reddit.com/r/StableDiffusion/comments/11iuqhv/major_update_automatic1111_photoshop_stable/

Доки и инструкции тут: https://github.com/AbdullahAlfaraj/Auto-Photoshop-StableDiffusion-Plugin

Инпайнт, аутпайнт, контрол нет и все свежие пироги.
Но самое крутое в этом плагине в том, что он умеет не только обращаться в сеть за просчетом картинок (в коллаб Automatic1111), он умеет использовать ваш локальный комп (если там стоит Automatic1111). Он умеет считать по локальной сети. Более того, он умеет стучаться в Stable Horde - распределенный просчеn Stable Diffusion среди пользователей, этакий Diffusion-Torrent. Я про него уже писал.

Удивительно, что все корпоративные производители софта: Adobe, Автодеск, Максон, Side Effects, Foundry - просто тупо отмалчиваются. Хотя уже у всех давно есть подписочная модель. Зашить в которую цену генераций ничего не стоит.
This media is not supported in your browser
VIEW IN TELEGRAM
С учетом того, какой буст придал ControlNet развитию инструментов для Stable Diffusion, ожидаю появления чего-то подобного в Automatic1111 через пару месяцев.
Пока это разработка китайских друзей из Carnegie Mellon University
https://twitter.com/saboo_shubham_/status/1629757798996385794
Теперь вы можете официально разговаривать сос своими часами без опасности вызова санитаров.

chatGPT добрался до умных часов.

Формулировка такая: Amazfit is now capable of incorporating ChatGPT into the coding of its watch faces on Zepp OS, a self-developed operating system for its smartwatches.

Часы могут спросить, как прошел ваш день, или даже поприветствовать вас. С ними можно будет поговорить о здоровье и фитнесе, количестве шагов, сожженных калорий и другом. Они также могут принимать во внимание процент заряда батареи, частоту сердечных сокращений или любую другую информацию, которую пользователи предоставят.

И тут самое интересное: а если chatGPT скажет "братишка, а отожмись-ка еще соточку", после чего кожаный двинет коняшек, кто будет виноват?

Наверное вопрос сродни подобных для автопилотов Тесла. Либо мы доверяем автопилоту и ИИ-финтес-тренеру, либо .. ходим пешком.

https://www.amazfit.com/blogs/news/amazfit-creates-the-worlds-first-chatgpt-empowered-watch-face

Подробнее тут:
https://beebom.com/amazfit-chatgpt-watch-face/
Motion Diffusion.

Это, конечно, интересная работа.
Анимировать 3D-персонажи по текстовому заданию - подход забавный.
Сидят аниматоры и орут в мониторы: "шляпу сними, в точку ушёл!".
Мне кажется, что может зайти в аудиторию Тик-Тока, где надо генерить контент типа танцыдоупаду.
С другой стороны, тиктокерам достаточно кнопки "сделать прикольно" и вот уже можно выбирать среды тысячи прикольных танцев.

А вот в анимацию и VFX это трудно впихнуть.

Посмотрите на пляски с бубном вокруг ControlNet и попыток поставить персонажа в ОДНУ позу.

А теперь представьте, что вам надо делать это с последовательностью картинок.

Кроме того, если сравнить размеры датасетов на которых обучалась Stable Diffusion и Motion Diffusion (данные мокапов), то станет понятно, что с вариативностью тоже будут вопросы.

Генераторы толп? Там вроде и так все отлично.

В общем, как наука - очень круто, но как практика - это скорее дополнение к мокап библиотекам.

Все подробности вот тут: https://t.iss.one/twin_3d/178

Поглядите видосы, они забавные.
Ну и давно мы тут не выпивали за жертв ИИ.
Почти уже не осталось никого, все ушли в разметчики.
Но есть еще экзотические закоулки в творческих профессиях - например шейдер-артисты и писатели шейдеров под Юнити.
Ну, на них, не чокаясь.
Внимательно смотрим видео. Много думаем.
https://t.iss.one/CGIT_Vines/1792
А теперь КККомбо!! Два ИИ работают за вас.

chatGPT пишет промпты для Stable Diffusion!

This an extension for stable-diffusion-webui that enables you to use ChatGPT for prompt variations, inspiration and pretty much anything you can think of.

Вы просто говорите ему, сделай всю работу за меня:

prompt: warlock karl urban rasputin, full shot, neutral background, highly detailed, digital painting, artstation, concept art, sharp focus, illustration

chatgpt: Describe an epic d&d scene using this prompt {prompt} as inspiration. Describe the person, clothing/armor and atmosphere. Don't use any names or artist names from the original prompt. Give me 8 example with unique characteristics. Return only a short description.

А пажалста:
"A warlock in flowing, obsidian robes stands at the ready, a staff of twisted oak clasped firmly in their left hand.",
"A heavily armored figure glares menacingly at the viewer, their plate mail shining in the pale moonlight.",
"A dark and mysterious figure, garbed in tattered robes, emerges from the shadows with a sinister grin.",
"A robed mage, brimming with arcane power, conjures a mighty bolt of lightning that crackles in the air around them.",
"A brooding figure draped in a cloak of black feathers surveys the bleak and desolate landscape, an air of quiet menace surrounding them.",
"A daunting presence, adorned in spiked leather and wielding a wicked maul, dominates the space around them with an aura of deadly force.",
"A fierce warrior, clad in gleaming silver armor and wielding twin blades, charges headlong into the fray with wild abandon.",
"A powerful sorcerer, wreathed in arcane energies, stands amidst the smoldering ruins of a once-great city and casts a spell of immense destruction."


https://github.com/hallatore/stable-diffusion-webui-chatgpt-utilities
Бипл - красавчик!
Жоско протролил метаверсики всех времен и народов.
Все еще хотите нахлобучить этот кусок пластика на башку и проводить в метаверсике по несколько часов в день (как убеждают нас прозорливые МакКинзи)?
Готовьтесь к некоторым видовым изменениям.
По счастию вход в метаверс пока добровольный.
Но мы работаем над контентом, от которого нельзя отказаться.
12 000 подписчиков в канале.
Предлагаю отметить это мясным донатом (сумму выбираете сами).

Я не мучаю вас рекламой (стоит заградительная цена для гикбрейнс и криптанов) или взаимными пиарами.
Пишу все в одно лицо, которое будет радо любому положительному подкреплению.

"old telegram geek with pony tail, stubble, gray hair, stubbles, red headphones, in the style of jeremiah ketner, art"

Бекап - revolut на @cgevent
scuba_generated.webm
1.4 MB
Тут вот в коментах пригорает у сторонников статистического продолжателя.
Я постоянно встречаю вот такой аргумент "Если бы знали, как эти ваши нейросети устроены изнутри, то ...", а дальше следуют выводы типа "нет смысла и обсуждать".

Позволю себе мысленный эксперимент.

Неожиданно проект по поиску внеземных цивилизаций обнаружил устойчивый сигнал. Устойчивый настолько, то его смогли видеть все в виде wi-fi подключения. При подключении к инопланетной сети происходит появляется окно диалога, а дальше .. ну вы поняли, можно печатать текст и получать ответы.

Представьте, как бы изменилась риторика луддитов.

Думаю, были бы подняты по тревоге лучшие умы планеты, чтобы понять, что находится на том конце, методом ощупывания неведомого создания из космоса. Вместо того, чтобы распинаться "если бы вы знали, как устроены инопланетяне, то не стали бы этим заниматься".
Forwarded from CGIT_Vines (Marvin Heemeyer)
Media is too big
VIEW IN TELEGRAM
Вот такие студии, поспродакшена, которые делают все и по чуть чуть, выигрывают от он новых инструментов больше всего.
От тестирования концепции идеи до воплощения в конечный продукт.

SD+руки