Neural Shit
45.7K subscribers
3.17K photos
903 videos
20 files
1.59K links
Проклятые нейронные сети

Для связи: @krasniy_doshik

№ 4930992211
Download Telegram
Forwarded from эйай ньюз
🧠 Imagen Video
[Google Brain]

Ответ Гугла на Make-a-Video от Меты не заставил себя долго ждать. Результаты кайфовые. Но и супервижена эта модель потребовала больше. Make-a-scene использовала неразмеченные видео для обучения, а вот для Image Video индусам пришлось попотеть, размечая видео текстовыми описаниями.

В подробности архитектуры вдаваться смысла нет, это нужно читать в статье. Скажу только, что там сначала из текстового эмбеддинга энкодера T5 получается 16 фреймов в разрешении 48×24 с 3 fps, а затем это апскейлится целой серией диффузионных моделей в итоговое видео из 128 фреймов 1280×768 и 24 fps.

То есть на выходе – 5.4 сек видео в высоком разрешении!

Ваши ставки господа: когда мы будем генерировать ролики в диффузионном тиктоке по заказу? "Девочка танцует в стиле техно. Сделай чтобы было красиво. Пожалуйста."

❱❱ Сайт проекта

@ai_newz
Наткнулся на просторах интернетов на замечательную штуку: робот для геноцида тараканов с помощью лазера с нейросетями под капотом.

С помощью двух камер отслеживает территорию, а в случае обнаружения усатой нечисти испускает лазерный луч в цель. Я думал, что в 2022 у нас будут летающие машины, но это тоже пойдет.

А самое главное, что повторить этот девайс можно самому – исходники и схемы есть на гитхабе
Stable Diffusion снова делает проклятые вещи
Киберпанк, который мы не заслужили
Ого, смотрите, гуглоинженеры напили AudioLM — аналог Jukebox.


Только в отличие от него, эта штука генерирует сильно более качественные сэмплы + умеет работать с речью. Принимает на вход аудиофайл (от 3х секунд), после чего продолжает его.

Не требует транскрипции или маркировки. Вместо этого в программу загружаются звуковые базы данных, а машинное обучение используется для сжатия аудиофайлов в звуковые фрагменты, называемые «токенами», без потери слишком большого количества информации. Затем эти токенизированные обучающие данные передаются в модель машинного обучения, которая использует обработку естественного языка для изучения звуковых паттернов.

Примеры можно послушать тут

Источник тут
Forwarded from Denis Sexy IT 🤖
Давайте отвлечемся на какую-то глупую фигню, например – Ксеноморфов за ужином сгенерированных нейронкой

Автор
А вот это уже очень охуенно!

В самый первый раз как надел VR-шлем на голову подумал: "Вот бы сюда запиздошить разного наркоманского нейроговна, чтоб мозг к хуям выносило".

И вот оно! Вангую в скором времени приложения симуляторы трипа LSD, Псилоцибина и прочих интересных веществ. Я в первых рядах побегу покупать подобное