Сейчас в твиттере хайпует статья Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise. Авторы ставят под сомнение теорию, стоящую за диффузионными генеративными моделями, основной принцип которых строится на добавлении и удалении гауссовского шума. Ребята покумекали и показали, что вместо использования случайного гауссовского шума можно использовать и другие деструктивные операции над изображениями, например блюр, маскинг, даунсэмплинг, заснежение и др. Это довольно неожиданно, так как в этом случае нет теоретически гарантий. На практике работает тоже сносно, хоть и немного хуже чем гауссовскиц шум.
Я думаю, это довольно интересная рапира. Она проверяет насколько подогнанная теория строго выполняется на практике. Будем следить за дальнейшем развитием "обобщенной диффузии" в следующих статьях.
Кодяра
Папирус
@ai_newz
Я думаю, это довольно интересная рапира. Она проверяет насколько подогнанная теория строго выполняется на практике. Будем следить за дальнейшем развитием "обобщенной диффузии" в следующих статьях.
Кодяра
Папирус
@ai_newz
👍57🔥15❤2
MoCapDeform: Monocular 3D Human Motion Capture in Deformable Scenes
Тут прикольную задачу решают - моделируют деформацию предметов под пятой точкой испытуемого. За счет этого получают более стабильные предсказания тела человека в 3D.
На вход принимается RGB картинка c кожаным человеком и меш сцены.
Paper
Project page
@ai_newz
Тут прикольную задачу решают - моделируют деформацию предметов под пятой точкой испытуемого. За счет этого получают более стабильные предсказания тела человека в 3D.
На вход принимается RGB картинка c кожаным человеком и меш сцены.
Paper
Project page
@ai_newz
👍17🤬2❤1🤩1
Media is too big
VIEW IN TELEGRAM
Пошло в массы. Теперь уже появился плагин для Фотошопа со Stable Diffusion. Дизайнеры, вы там держитесь! И покупайте видеокарты побольше!
Getalpaca.io
@ai_newz
Getalpaca.io
@ai_newz
🔥141🤡14👍7❤2😁2🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот вам пацанский подгон от Meta RL. Датасет с высококачественными лицами одновременно с нескольких ракурсов – Multiface. Он использовался для обучения энкодера для Codec Avatars [тут и тут]. Будет полезен для всякого рода работ с нейронным рендерингом лиц.
❱❱ Датасет
❱❱ Статья
@ai_newz
❱❱ Датасет
❱❱ Статья
@ai_newz
👍47
NSFW заказывали? Кто-то говорил, что у прон художников пока работа будет всегда. Я уже засомневался.
Тут уже зафайнтюнили модельку (похоже на Stable Diffusion) под это пикантное дело. Ух, как закукарекают в твиттере!
Фото постить не буду, сами посмотрите: https://pornpen.ai/
Тут уже зафайнтюнили модельку (похоже на Stable Diffusion) под это пикантное дело. Ух, как закукарекают в твиттере!
Фото постить не буду, сами посмотрите: https://pornpen.ai/
🔥73👍8👎7❤6🤔5😱3
MultiNeRF: A Code Release for Mip-NeRF 360, Ref-NeRF, and RawNeRF
Если ищете SOTA метод по нейронному рендерингу сцены, то Гугл выложили репозиторий с реализацией трёх oral статей с CVPR 2022. Это топовые на сегодняшний день методы.
Oral - это значит, что статья попала в шорт-лист лучших работ на конференции.
Ссылка на репу
@ai_newz
Если ищете SOTA метод по нейронному рендерингу сцены, то Гугл выложили репозиторий с реализацией трёх oral статей с CVPR 2022. Это топовые на сегодняшний день методы.
Oral - это значит, что статья попала в шорт-лист лучших работ на конференции.
Ссылка на репу
@ai_newz
GitHub
GitHub - google-research/multinerf: A Code Release for Mip-NeRF 360, Ref-NeRF, and RawNeRF
A Code Release for Mip-NeRF 360, Ref-NeRF, and RawNeRF - google-research/multinerf
🔥19👍6
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAI добавили в DALLE-2 новую фичу – дорисовывание картинки наружу, или outpainting. Раньше это можно было делать только хаками с помощью уменьшения оригинальной картинки и добавления маски по краям. А теперь по-сути можно бесконечно увеличивать размер полотна.
https://openai.com/blog/dall-e-introducing-outpainting/
@ai_newz
https://openai.com/blog/dall-e-introducing-outpainting/
@ai_newz
❤97👍38🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Diffusion теперь попал и в GIMP (это опен-соурс аналог Фотошопа). По вашему корявому скетчу сгенерирует что-то приятное бесплатно и без смс.
Круто! Плагин можно использовать даже если у вас нет GPU, но тогда придется запускать Гугл колаб на фоне.
@ai_newz
Круто! Плагин можно использовать даже если у вас нет GPU, но тогда придется запускать Гугл колаб на фоне.
@ai_newz
👍117🔥48❤🔥10❤5👎2🌭2
This media is not supported in your browser
VIEW IN TELEGRAM
Автор генеративной обложки Cosmopolitan делится своим опытом и рассказывает по шагам, как генерировать такие видео с помощью DALLE-2, EbSynth и DAIN.
Инструментарий фешн дизайнеров тоже ждут большие перемены!
Про похожий эксперимент с дизайном одежды я писал тут.
@ai_newz
Инструментарий фешн дизайнеров тоже ждут большие перемены!
Про похожий эксперимент с дизайном одежды я писал тут.
@ai_newz
🔥81👍13🤡8
This media is not supported in your browser
VIEW IN TELEGRAM
Последние несколько недель большая часть моей ленты в твиттере заполнена поделками DALLE-2 и подобных генеративных сеток. А вот и очередной крышеснос (смотреть видео со звуком 🔊).
Тут использовали AI, чтобы трансформировать сразу и видео и аудио: Koe Recast + Stable Diffusion img2img + EbSynth.
И такие штуки можно делать без особо глубокого понимания внутренностей моделей. Это уже просто инструменты в руках дизайнеров и художников.
@ai_newz
Тут использовали AI, чтобы трансформировать сразу и видео и аудио: Koe Recast + Stable Diffusion img2img + EbSynth.
И такие штуки можно делать без особо глубокого понимания внутренностей моделей. Это уже просто инструменты в руках дизайнеров и художников.
@ai_newz
👍78😱21🤯11🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Такая магия делается в два счета. Релайтнинг фото прямо в браузере.
Сначала нейронкой предсказывается карта глубины и нормали к поверхности в каждом пикселе. Затем 2D изображение трансформируется в объемное 2.5D и с помощью threejs рендерится с дополнительным источником света в указанном месте. Всё.
@ai_newz
Сначала нейронкой предсказывается карта глубины и нормали к поверхности в каждом пикселе. Затем 2D изображение трансформируется в объемное 2.5D и с помощью threejs рендерится с дополнительным источником света в указанном месте. Всё.
@ai_newz
🤯92👍26🔥15❤9❤🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Что будет если попробовать соединить известные картины Ван Гога, Моне, Мюнка и Хокусая?
Молитвами Dalle-2 outpainting получаем такой результат.
@ai_newz
Молитвами Dalle-2 outpainting получаем такой результат.
@ai_newz
🔥240❤11👍10👎7🤔2❤🔥1
Новый виток развития PyTorch как публичного проекта с открытым кодом!
PyTorch перейдет под контроль PyTorch Foundation как часть Linux Foundation. Теперь Фреймворк будут разрабатывать не только ученые из Meta. В PyTorch Foundation войдут люди из разных компаний, включая AMD, Amazon, Google, Microsoft, Nvidia и Meta.
@ai_newz
PyTorch перейдет под контроль PyTorch Foundation как часть Linux Foundation. Теперь Фреймворк будут разрабатывать не только ученые из Meta. В PyTorch Foundation войдут люди из разных компаний, включая AMD, Amazon, Google, Microsoft, Nvidia и Meta.
@ai_newz
👍166🔥73😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Это то, как может выглядеть интерфейс для редактирования и монтажа видео в будущем. Когда диффузия будет быстрой, а видеокарты большими и дешёвыми. Просто печатаете своё желание в окошке, а нейронки делают за вас всю тяжёлую работу.
Так и до генерации разных сюжетных веток фильма на лету по запросу пользователя можем дожить. Но пока – это всего лишь промо-ролик продукта https://runwayml.com *. Уже можно запросить доступ к бете. Но люди, попробовавшие её, говорят что там ещё не близкий путь до результатов, показанных в видео.
* Disclaimer: В Runway работает мой бывший одногруппник и один из авторов Stable Diffusion.
Так и до генерации разных сюжетных веток фильма на лету по запросу пользователя можем дожить. Но пока – это всего лишь промо-ролик продукта https://runwayml.com *. Уже можно запросить доступ к бете. Но люди, попробовавшие её, говорят что там ещё не близкий путь до результатов, показанных в видео.
* Disclaimer: В Runway работает мой бывший одногруппник и один из авторов Stable Diffusion.
🔥88👍13💯5😁3❤2👎2👏2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
Искусственный интеллект помогает людям решать всё больше сложных задач. Всё потому, что нейронные сети становятся жирнее и умнее, и обучаются сегодня на террабайтах данных.
В видео на канале DeepMind подробно рассказывается, как ИИ используют для ускорения научных открытий. Спикером выступает Демис Хассабис, соучредитель и генеральный директор DeepMind. Такие видео, как и многая другая современная и полезная информация о технологиях и разработке, на английском.
Теперь твист: видео можно перевести на русский с помощью фичи закадрового перевода видео в Яндекс Браузере (опять нейронки спасают!). Если у вас его нет, установить на смартфон можно по ссылке.
@ai_newz
В видео на канале DeepMind подробно рассказывается, как ИИ используют для ускорения научных открытий. Спикером выступает Демис Хассабис, соучредитель и генеральный директор DeepMind. Такие видео, как и многая другая современная и полезная информация о технологиях и разработке, на английском.
Теперь твист: видео можно перевести на русский с помощью фичи закадрового перевода видео в Яндекс Браузере (опять нейронки спасают!). Если у вас его нет, установить на смартфон можно по ссылке.
@ai_newz
👍31👎17😁5😱1