эйай ньюз
72.7K subscribers
1.6K photos
858 videos
7 files
1.92K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
Вы, возможно, заметили, что у меня есть ещё один канал @gradientdude. Там я пишу о статьях на английском, и обычно с более подробными техническими деталями. Вот, например, более подробно про Neural 3D reconstruction in the wild из предыдущего поста.

Если вам такая бодяга нравится, то подписывайтесь туда тоже.
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn)
HairCLIP
Ну, за грумеров, не чокаясь.
Грумеры для бумеров - это те, кто стрижет кошек и собак.
Грумеры для зумеров - это странные люди, которые делают цифровые прически 3Д-моделям и аватарам.
Мое знакомство с Maya Fur и Maya Hair приводило меня в ужас, это был неуправляемый хаос из которого надо было слепить что-то хотя бы приблизительно похожее на референс. Я даже мастеркласс с испугу прочитал на Сигграфе по этому поводу.
Время шло, груминг стал обычной [под]профессией и частью пайплайна.
И тут подкрались нейросетки.
В общем вот вам еще одна работа в духе "This Hair does not exist".
Более того, там можно самому попробовать пририсовать усы, пардон, волосы, на голову любимой учительницы.
Ну и если метаверсить на будущее, то рынок цифровых причесок, похоже будет вторым после рынка цифровых шмоток. Ибо аватар не будет ходить в одном и том же два дня подряд.
https://huggingface.co/spaces/Gradio-Blocks/HairCLIP
Стать художником никогда не было так легко, как сейчас, с момента изобретения цифровой камеры

DALL-E 2, как и предыдущие системы преобразования текста в изображение, генерирует картинку из фрагмента текста. Aaron Hertzman написал на днях занятный пост, где он размышляет о text2image генерации, и о DALLE-2 в частности. Что модель может генерировать, что не может,
как устроен креативный процесс... В общем интересное чтиво, учитывая что Аарон имеет бекграунд как в CS, так и в искусстве.

Прикрепляю несколько интересных DALLE-2 картин от Аарона:
1. “Hip Indian computer scientist who enjoys art and calisthenics, in the style of Kehinde Wiley"
2. “Kehinde wiley artwork of a female asian scientist doing construction labor”
3. "Stanford bunny, 3d model"
4. "Homer Simpson in 3d on a grid surrounded by geometry"
5. “An IT-guy trying to fix hardware of a PC tower is being tangled by the PC cables like Laokoon. Marble, copy after Hellenistic original from ca. 200 BC. Found in the Baths of Trajan 1506”

@Artem Gradient
Друзья, есть кто-нибудь в Амстердаме сейчас? Можно организовать эйай-кофе в кофешопе, или ещё чего 😉.

Напишите в комментариях или в ЛС
This media is not supported in your browser
VIEW IN TELEGRAM
А это молодой Ян ЛеКун, друзья. Он тут понтуется своей CNN, которая распознает цифры. Это была первая в мире нейронная сеть с такими возможностями (1993 год).

Тогда ЛеКуну было 32 года. То есть не то, чтобы он был очень молодым, когда создал прорыв всей своей жизни. И после этого ещё минимум 15 лет он и его парни считались сумасшедшими аутсайдерами со своими ебучими нейронками, в которые никто не верил. Ну и где теперь те, кто смеялся над ним тогда?

В общем, работаем, мужики и мужичессы.
#мотивация

@Artem Gradient
Запрет на дипфейки в Google Colab

Появление Google Colab привело к популяризации и демократизации (модное словечко) глубокого обучения. В колабе любой желающий может получить бесплатный доступ к неплохой видеокарте и попробовать руками этот самый эйай.

Однако, сейчас наметился тренд на цензуру и контроль в сфере AI. Например, теперь в ноутбуках на Google Colab нельзя обучать и запускать модели, которые создают дипфейки - об этом написано в faq. Понятно, что коммерческая компания сама решает как будут использоваться ее ресурсы, но я противник цензуры, особенно если это касается научной сферы или технологий.

Не ясно только, как Гугл будет контролировать, что запускают в колабе. Придётся обучать какую-то языковую моделью чтобы она говорила «дипфейк или нет»? Проблема в том, что определение дипфейка можно трактовать довольно вольно.

В общем, ждём выстрела из пушки по воробьям и запрета любых нейронок, которые работают с лицами людей в каком-либо виде😤.

За новость спасибо
@vlad_pedro

@Artem Gradient
Привет, друзья! Пробую новый формат.

Подборка новостей из мира технологий (не только AI) за последнюю неделю:

- Amazon планирует избавиться от части складских помещений в США из-за снижения спроса в сфере электронной коммерции. bloomberg.com

- А также Amazon отменяет планы по строительству новых складских площадей и распределительных центров, чтобы сократить издержки. theinformation.com

- Spotify приступил к тестированию NFT. thefly.com

- У Spotify не работали подкасты в течение более 8 часов. Все из-за того, что кто-то забыл вовремя обновить SSL-сертификат в сервисе. theverge.com

- PayPal планирует интегрировать в систему все виды криптовалют и блокчейн. cointelegraph.com

- PayPal начинает сокращать персонал в целях сокращения расходов. thefly.com

- Акции Snap потеряли 43%, что является самым большим процентным снижением за всю историю (85% с максимума сентября 2021 г). wsj.com

- Nvidia говорит, что рынок игр замедляется. Компания фокусируется на сокращении расходов. reuters.com

- Apple повышает заработные платы из-за роста инфляции и конкуренции за рабочую силу. ft.com

- Alibaba, Tencent и JD com сообщили о самом медленном росте выручки за всю историю. cnbc.com

- У Baidu вышел удивительно сильный квартальный отчет. CEO Baidu: Наш облачный и интеллектуальный бизнес показал значительные результаты. Baidu AI Cloud сообщила об очередном квартале роста выручки: +45% YoY. baidu.com

- Краудсорсинговый трекер увольнений технологических стартапов Layoffs.fyi зафиксировал увольнения в 60 тех. компаниях за последний месяц, в которых было уволено более 16 000 сотрудников. protocol.com

- Илон Маск заставляет всех работников Tesla выйти в офис на работу либо увольняться. В публичном письме к работникам, он говорит, что каждый должен проводить в офисе минимум 40 часов, а все что свыше можно и из дома 😅.

@Artem Gradient
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Одна из причин, почему я считаю что Dalle 2 / Imagen сетки всё изменят когда попадут в массы, это то, что с ними можно очень быстро создать любой «ситуативный» арт, для любой коммерческой индустрии – от Power Point презентации, до геймдева.

Представим, что я сотрудник какой-то небольшой геймдев студии который выпускает три-в-ряд для телефонов – я теперь могу наклепать за минуту кучу персонажей, посредственно их анимировать, и вот, у меня теперь есть уникальный ролик, где хомяки-киборги готовятся сразится за будущее нашей вселенной. Серьезно, Dalle 2 генерирует по 8 уникальных картинок разрешением 1024 х 1024 в минуту.

Я попросил нагенерировать мне хомяков-киборгов автора канала «Нейросети и Блендер», которому уже дали доступ к Dalle 2, так что доступы постепенно дают всем кто в списке ожидания – скоро все будем генерировать 🔥
This media is not supported in your browser
VIEW IN TELEGRAM
Zoox* представила свой новый прототип автономного роботакси: вышло интересно

- Прямоугольная форма машины без водительского места и руля. В США как раз недавно разрешили делать беспилотные машины без возможности ручного управления.
- Датчики на каждом углу роботакси, что позволяет аппарату видеть практически все, включая слепые зоны.
- Каждый из этих датчиков имеет поле зрения 270 градусов. Поскольку они стоят на каждом углу и имеют пересекающиеся углы обзора, то мы можем не только видеть все на 360 градусов, но и как бы заглянуть за объекты.
- Салон нафарширован дисплеями, внутри можно даже заряжать свой лэптоп.
- По словам тестировщика, ехать в этой бричке скучно. Что есть хорошо, ведь мы хотим заняться своими делами (чтение, работа, общение) во время комьюта.

*Дочка Амазона.

@Artem
Я: потратил 3 года чтобы выучить дизайн и Фотошоп
@
DALLE-2: Бомжур!


Дизайнеры и иллюстраторы начинают волноваться за свою работу, и не без причины! AI постепенно и беспощадно отбирает у них кусок хлеба. Потому что нейронный дизайн дешевле и быстрее, а качество растет каждый месяц. Я думаю всем творческим кожаным мешкам следует осваивать современные инструменты на базе AI. Во многих профессиях сейчас (не только в IT) нужно следить за новыми технологиями и постоянно развиваться, чтобы не проиграть машинам остаться без работы.

Так что поделитесь моим каналом со своим творческими друзьями, пусть не отстают 😉. Научим их сеточкам и колабам.

@Artem Gradient
This media is not supported in your browser
VIEW IN TELEGRAM
Принес вам демку на huggingface для реконструкции 3D модели человека по одному фото.

Под капотом бегает PIFU. Метод уже не новый (2020), но работает! Моделька выезжает с RGB текстурой.

Для наилучшего результата загружайте фото в полный рост с минимальным наклоном камеры.

https://huggingface.co/spaces/radames/PIFu-Clothed-Human-Digitization

@Artem Gradient
This media is not supported in your browser
VIEW IN TELEGRAM
Photorealistic Monocular 3D Reconstruction of Humans Wearing Clothing

А вот и свежак от Гугла (CVPR2022). Тоже выдает текстурированную 3D модель кожаного мешка по одному фото.

Отличие от PIFu из предыдущего поста в основном в том как тут предсказывается цвет текстуры. Эта модель уже предсказывает Альбедо и тени, учитываю геометрию поверхности.

Да, на видео - реконструкция, результат работы метода.

Кода нет и скорее всего, со слов автора, пока не будет 😐

❱❱ https://phorhum.github.io/

@Artem Gradient
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, друзья! Каждому в хозяйстве метаверсе нужна хорошая сетка для удаления бэкграунда.

U-2-Net, кажется, одна из расхайпованых* сетей, которая удаляет фон, и ещё в неплохой image-2-image транслейшен умеет. Эта моделька разлетелась по куче приложений не просто так.

Есть код и веса на гитабе. Там же куча ссылок на всевозможные приложения, использующие U-2-NET.

* 5.7к звёзд на гитабе.

@Artem Gradient
This media is not supported in your browser
VIEW IN TELEGRAM
В снэпчате новый фильтр. И это полный кринж 😂

Все так же удивляюсь, из какого правильного места растут руки у инженеров в Снэпе. Очень качественная трансформация, да ещё и угарная.

Принцип работы таких фильтров строится на генеративных нейронных сетях и предсказании 3д геометрии лица.

@Artem Gradient
Forwarded from Denis Sexy IT 🤖
This media is not supported in your browser
VIEW IN TELEGRAM
Очередное путешествие в зазеркалье с помощью нейронки Instant Nerf. Автор.

Напомню, что работает как-то так: скармливаете ей 50 фотографий, ждете пол дня (instant 🌚) и потом можете «летать» внутри этого пространства которое воссоздала нейронка.

Прошлое путешествие в зазеркалье – тут
Привет, друзья! 37 минут назад началась Apple’s Worldwide Developers Conference (WWDC). Традиционно на ней показывают новые финтифлюшки в операционных системах Apple, но иногда и балуют новыми продуктами.

Было несколько прикольных моментов, но пока ничего особенно удивительного.

https://youtu.be/q5D55G7Ejs8
Пока больше всего мне понравилось на WWDC22:

- Apple Watch стали более умными: теперь с помощью ML часы выдают более детальный анализ бега и других активностей, отслеживая как сильно осциллирует ваше тело и руки.
- Встроенная в фото-галлерею фича для удаления фона. Просто тыкаешь на объект и можно его скопировать без бэкграунда.
- Новые 3Д карты и обновления в MapKit для разработчиков.
- Прокачанный CarPlay, особенно актуальный для новых авто, где есть огромный дисплей (как в Тесле).

А вам что понравилось?

@Artem Gradient