эйай ньюз
77.6K subscribers
1.73K photos
900 videos
7 files
2.04K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
Доброе утро, народ! Вот вам пять строк, как запустить Stable Diffusion у себя на коленке. Не перегрейтесь!

Тут более подробный туториал.

@ai_newz
👏69🔥30👍147❤‍🔥1
Сейчас в твиттере хайпует статья Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise. Авторы ставят под сомнение теорию, стоящую за диффузионными генеративными моделями, основной принцип которых строится на добавлении и удалении гауссовского шума. Ребята покумекали и показали, что вместо использования случайного гауссовского шума можно использовать и другие деструктивные операции над изображениями, например блюр, маскинг, даунсэмплинг, заснежение и др. Это довольно неожиданно, так как в этом случае нет теоретически гарантий. На практике работает тоже сносно, хоть и немного хуже чем гауссовскиц шум.

Я думаю, это довольно интересная рапира. Она проверяет насколько подогнанная теория строго выполняется на практике. Будем следить за дальнейшем развитием "обобщенной диффузии" в следующих статьях.

Кодяра
Папирус

@ai_newz
👍57🔥152
MoCapDeform: Monocular 3D Human Motion Capture in Deformable Scenes

Тут прикольную задачу решают - моделируют деформацию предметов под пятой точкой испытуемого. За счет этого получают более стабильные предсказания тела человека в 3D.

На вход принимается RGB картинка c кожаным человеком и меш сцены.

Paper
Project page

@ai_newz
👍17🤬21🤩1
Media is too big
VIEW IN TELEGRAM
Пошло в массы. Теперь уже появился плагин для Фотошопа со Stable Diffusion. Дизайнеры, вы там держитесь! И покупайте видеокарты побольше!

Getalpaca.io

@ai_newz
🔥141🤡14👍72😁2🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот вам пацанский подгон от Meta RL. Датасет с высококачественными лицами одновременно с нескольких ракурсов – Multiface. Он использовался для обучения энкодера для Codec Avatars [тут и тут]. Будет полезен для всякого рода работ с нейронным рендерингом лиц.

❱❱ Датасет
❱❱ Статья

@ai_newz
👍47
NSFW заказывали? Кто-то говорил, что у прон художников пока работа будет всегда. Я уже засомневался.

Тут уже зафайнтюнили модельку (похоже на Stable Diffusion) под это пикантное дело. Ух, как закукарекают в твиттере!

Фото постить не буду, сами посмотрите: https://pornpen.ai/
🔥73👍8👎76🤔5😱3
MultiNeRF: A Code Release for Mip-NeRF 360, Ref-NeRF, and RawNeRF

Если ищете SOTA метод по нейронному рендерингу сцены, то Гугл выложили репозиторий с реализацией трёх oral статей с CVPR 2022. Это топовые на сегодняшний день методы.

Oral - это значит, что статья попала в шорт-лист лучших работ на конференции.

Ссылка на репу

@ai_newz
🔥19👍6
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI добавили в DALLE-2 новую фичу – дорисовывание картинки наружу, или outpainting. Раньше это можно было делать только хаками с помощью уменьшения оригинальной картинки и добавления маски по краям. А теперь по-сути можно бесконечно увеличивать размер полотна.

https://openai.com/blog/dall-e-introducing-outpainting/

@ai_newz
97👍38🤩1
Lilian Weng обновила свой прошлогодний пост про диффузионные модели, включив туда обзор недавнего прогресса – classifier-free guidance, GLIDE, unCLIP, Imagen и Latent Diffusion.

Рекомендую, очень толковый пост.

Ссылочка

@ai_newz
🔥56👍111👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Diffusion теперь попал и в GIMP (это опен-соурс аналог Фотошопа). По вашему корявому скетчу сгенерирует что-то приятное бесплатно и без смс.

Круто! Плагин можно использовать даже если у вас нет GPU, но тогда придется запускать Гугл колаб на фоне.

@ai_newz
👍117🔥48❤‍🔥105👎2🌭2
This media is not supported in your browser
VIEW IN TELEGRAM
Автор генеративной обложки Cosmopolitan делится своим опытом и рассказывает по шагам, как генерировать такие видео с помощью DALLE-2, EbSynth и DAIN.

Инструментарий фешн дизайнеров тоже ждут большие перемены!

Про похожий эксперимент с дизайном одежды я писал тут.

@ai_newz
🔥81👍13🤡8
This media is not supported in your browser
VIEW IN TELEGRAM
Последние несколько недель большая часть моей ленты в твиттере заполнена поделками DALLE-2 и подобных генеративных сеток. А вот и очередной крышеснос (смотреть видео со звуком 🔊).

Тут использовали AI, чтобы трансформировать сразу и видео и аудио: Koe Recast + Stable Diffusion img2img + EbSynth.

И такие штуки можно делать без особо глубокого понимания внутренностей моделей. Это уже просто инструменты в руках дизайнеров и художников.

@ai_newz
👍78😱21🤯11🔥9
В капче (hcaptcha) кожаных мешков заставляют размечать картинки, сгенерированные нейросетями. Это новый виток!

Спасибо подписчику за перл.

@ai_newz
👍91😁34😱12👎52🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Такая магия делается в два счета. Релайтнинг фото прямо в браузере.

Сначала нейронкой предсказывается карта глубины и нормали к поверхности в каждом пикселе. Затем 2D изображение трансформируется в объемное 2.5D и с помощью threejs рендерится с дополнительным источником света в указанном месте. Всё.

@ai_newz
🤯92👍26🔥159❤‍🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Вот так выглядит промежуточный этап с представлением в 2.5D

@ai_newz
🔥69🤯10👍72👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Что будет если попробовать соединить известные картины Ван Гога, Моне, Мюнка и Хокусая?

Молитвами Dalle-2 outpainting получаем такой результат.

@ai_newz
🔥24011👍10👎7🤔2❤‍🔥1
Новый виток развития PyTorch как публичного проекта с открытым кодом!

PyTorch перейдет под контроль PyTorch Foundation как часть Linux Foundation. Теперь Фреймворк будут разрабатывать не только ученые из Meta. В PyTorch Foundation войдут люди из разных компаний, включая AMD, Amazon, Google, Microsoft, Nvidia и Meta.

@ai_newz
👍166🔥73😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Это то, как может выглядеть интерфейс для редактирования и монтажа видео в будущем. Когда диффузия будет быстрой, а видеокарты большими и дешёвыми. Просто печатаете своё желание в окошке, а нейронки делают за вас всю тяжёлую работу.

Так и до генерации разных сюжетных веток фильма на лету по запросу пользователя можем дожить. Но пока – это всего лишь промо-ролик продукта https://runwayml.com *. Уже можно запросить доступ к бете. Но люди, попробовавшие её, говорят что там ещё не близкий путь до результатов, показанных в видео.

* Disclaimer: В Runway работает мой бывший одногруппник и один из авторов Stable Diffusion.
🔥88👍13💯5😁32👎2👏2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Искусственный интеллект помогает людям решать всё больше сложных задач. Всё потому, что нейронные сети становятся жирнее и умнее, и обучаются сегодня на террабайтах данных.

В видео на канале DeepMind подробно рассказывается, как ИИ используют для ускорения научных открытий. Спикером выступает Демис Хассабис, соучредитель и генеральный директор DeepMind. Такие видео, как и многая другая современная и полезная информация о технологиях и разработке, на английском.

Теперь твист: видео можно перевести на русский с помощью фичи закадрового перевода видео в Яндекс Браузере (опять нейронки спасают!). Если у вас его нет, установить на смартфон можно по ссылке.

@ai_newz
👍31👎17😁5😱1