Салют! Прямо сейчас я лечу в Майами, а оттуда в Новый Орлеан, где проходит топовое событие в мире AI -- конференция NeurIPS. Это как ежегодное вручение Оскара, только для исследователей, занимающихся AI и около-AI темами. Да, и там тоже вручают премию за лучшие фильмы статьи года и десятилетия. На конфе в в свое время были презентованы такие влиятельные работы как, например, AlexNet (2012), Attention is all you need (2017), GPT-3 (2020).
Кстати, статья про архитектуру AlexNet (см. картинку) как раз в этом году получила премию "Test of Time Award" за огромный вклад в развитие области, проверенный временем.
Впервые я побывал на конференции NeurIPS (тогда она еще называлась NIPS) в 2016 году в Барселоне со своей статьёй CliqueCNN про self-supervised обучение на неразмеченных датасетах с картинками. В этом году мне посчастливилось во второй раз презентовать статью на NeurIPS -- ViscoGrids. На этот раз про реконструкцию 3D поверхностей с помощью гридов и явных геометрических праеров (скоро будет подробный пост).
#карьера #конфа
@ai_newz
Кстати, статья про архитектуру AlexNet (см. картинку) как раз в этом году получила премию "Test of Time Award" за огромный вклад в развитие области, проверенный временем.
Впервые я побывал на конференции NeurIPS (тогда она еще называлась NIPS) в 2016 году в Барселоне со своей статьёй CliqueCNN про self-supervised обучение на неразмеченных датасетах с картинками. В этом году мне посчастливилось во второй раз презентовать статью на NeurIPS -- ViscoGrids. На этот раз про реконструкцию 3D поверхностей с помощью гридов и явных геометрических праеров (скоро будет подробный пост).
#карьера #конфа
@ai_newz
Идет уже второй день NeurIPS. Первый день я пропустил, но Влад неплохо о нем написал в своем посте.
Я пока не очень много успел увидеть, только пообщался с людьми в секции с булками от разных компаний, да получил приглос на ужин с Waymo. Организовано все не очень, очень трудно ориентироваться в огромном конферен центре, когда куча вещей проходит параллельно.
Я создал чатик для встречи, все кто сейчас в Новом Орлеане – присоединяйтесь. Постараюсь организовать ужин для знакомства и нетворкинга.
#конфа
@ai_newz
Я пока не очень много успел увидеть, только пообщался с людьми в секции с булками от разных компаний, да получил приглос на ужин с Waymo. Организовано все не очень, очень трудно ориентироваться в огромном конферен центре, когда куча вещей проходит параллельно.
Я создал чатик для встречи, все кто сейчас в Новом Орлеане – присоединяйтесь. Постараюсь организовать ужин для знакомства и нетворкинга.
#конфа
@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
В четверг на NeurIPS 2022 я презентовал нашу работу VisCo Grids (Meta AI).
В статье мы представляем метод для реконструкции 3д поверхностей по облаку точек, использую гриды. Да, вы не ослышались, там нет никаких нейронных сетей. За счёт этого обучение идет быстрее, и проще интерпретировать результаты обучения модели.
Мы оптимизируем значения SDF (signed distance function) напрямую в узлах дискретной 3D сетки. Но чтобы это работало нужны хорошие праеры, потому что оптимизировать SDF на дискретной сетке в лоб не выйдет.
Первый праер Viscosity Loss – позволяет учить SDF на дискретной сетке, оптимизируя "сглаженный" Eikonal loss, и предотвращая вырожденные решения.
Второй праер – Coarea Loss минимизирует площадь полученной поверхности. Это также позволяет получить желаемые поверхности и избавится от всевозможных отростков, пепяк и дырок.
Оба лосса считаются в любой локации с помощью интерполяции между узлами сетки.
❱❱ Более развернуто в моем посте на английском.
❱❱ Либо в самой статье.
#конфа
@ai_newz
В статье мы представляем метод для реконструкции 3д поверхностей по облаку точек, использую гриды. Да, вы не ослышались, там нет никаких нейронных сетей. За счёт этого обучение идет быстрее, и проще интерпретировать результаты обучения модели.
Мы оптимизируем значения SDF (signed distance function) напрямую в узлах дискретной 3D сетки. Но чтобы это работало нужны хорошие праеры, потому что оптимизировать SDF на дискретной сетке в лоб не выйдет.
Первый праер Viscosity Loss – позволяет учить SDF на дискретной сетке, оптимизируя "сглаженный" Eikonal loss, и предотвращая вырожденные решения.
Второй праер – Coarea Loss минимизирует площадь полученной поверхности. Это также позволяет получить желаемые поверхности и избавится от всевозможных отростков, пепяк и дырок.
Оба лосса считаются в любой локации с помощью интерполяции между узлами сетки.
❱❱ Более развернуто в моем посте на английском.
❱❱ Либо в самой статье.
#конфа
@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
CVPR День первый: воркшопы и туториалы
Держу вас в курсе. Начался первый день конфы.
Я уже посетил Efficient Neutral Network воркшоп от Снепа. Послушал про эффективные архитектуры трансформеров для мобилок и про SnapFusion — ускоренную Stable Diffusion для мобил. Ребята достигли скорости 1.9 сек 🔥 за картинку на iPhone 14.
Сейчас зашёл на туториал по диффузионным моделям. Это по сути развитие туториала с CVPR 2022, о котором я много раз писал. Очень классная штука, советую. Надеюсь, они выложат записи на ютуб.
#конфа
@ai_newz
Держу вас в курсе. Начался первый день конфы.
Я уже посетил Efficient Neutral Network воркшоп от Снепа. Послушал про эффективные архитектуры трансформеров для мобилок и про SnapFusion — ускоренную Stable Diffusion для мобил. Ребята достигли скорости 1.9 сек 🔥 за картинку на iPhone 14.
Сейчас зашёл на туториал по диффузионным моделям. Это по сути развитие туториала с CVPR 2022, о котором я много раз писал. Очень классная штука, советую. Надеюсь, они выложат записи на ютуб.
#конфа
@ai_newz
А вот несколько слайдов с доклада "Efficient Text-to-Image Generation", где Снэп рассказывал про свою работу по ускорению Stable Diffusion.
Плюс демка, где они запускали генерации на телефоне.
Модель уменьшили, ускорили, дистиллировали и сконвертировали в Apple CoreML. Во время инференса использовали 8 шагов с DDIM семплером. Скорость генерации 1.9—2.0 сек / картинка на iPhone 14.
Представьте только. На GPU 50 шагов DDIM оригинальной Stable Diffusion в разрешении 512×512 работает примерно 1.7 сек. А тут сделали на мобиле почти за такое же время и без потери в качестве!
Сайт проекта SnapFusion
#конфа
@ai_newz
Плюс демка, где они запускали генерации на телефоне.
Модель уменьшили, ускорили, дистиллировали и сконвертировали в Apple CoreML. Во время инференса использовали 8 шагов с DDIM семплером. Скорость генерации 1.9—2.0 сек / картинка на iPhone 14.
Представьте только. На GPU 50 шагов DDIM оригинальной Stable Diffusion в разрешении 512×512 работает примерно 1.7 сек. А тут сделали на мобиле почти за такое же время и без потери в качестве!
Сайт проекта SnapFusion
#конфа
@ai_newz