Варшава x ai_newz!
Друзья, я еду Варшаву на несколько дней! Хочется поотдыхать и поработать в новой обстановке, и, конечно, поесть белорусской, украинской и польской вкуснятины (кстати, посоветуйте хорошие места)!
Я знаю, что там должно быть очень большое комьюнити наших ребят. Было бы круто сделать сходку, познакомиться. В этом году я так уже делал в Сан-Франциско и Тбилиси – это были всегда очень классные встречи.
Если вы сейчас в Варшаве, вступайте в чат, там договоримся, когда и где организуем митап:
https://t.iss.one/+XZX3N3B-DP9mZjUy
#personal
@ai_newz
Друзья, я еду Варшаву на несколько дней! Хочется поотдыхать и поработать в новой обстановке, и, конечно, поесть белорусской, украинской и польской вкуснятины (кстати, посоветуйте хорошие места)!
Я знаю, что там должно быть очень большое комьюнити наших ребят. Было бы круто сделать сходку, познакомиться. В этом году я так уже делал в Сан-Франциско и Тбилиси – это были всегда очень классные встречи.
Если вы сейчас в Варшаве, вступайте в чат, там договоримся, когда и где организуем митап:
https://t.iss.one/+XZX3N3B-DP9mZjUy
#personal
@ai_newz
Я вернулся из поездки в Варшаву! Город очень живой и активный, особенно сильно это ощущается на контрасте с размеренным Цюрихом. И, конечно, огромное русскоговорящее комьюнити технарей.
Я провел целых две тусовки с подписчиками – одной оказалось мало, и меня попросили организовать еще одну. Сразу скажу, что обе прошли просто шикарно! Спасибо всем, кто пришел – вы все очень крутые!
Для первой забронировал целиком беларусский бар "Банки-Бутылки" (он же раньше был в Минске на Зыбицкой). Я приятно офигел от того, что на тусу пришло более 50 человек. Это пока рекордная по размеру тусовка "эйай ньюз". Получилось прям круто! Тут было, как мне кажется, три составляющие успеха:
➡️ Много интересных людей. Кроме ребят, кто работает в AI и ML (из FAANG-а, фирм поменьше и стартапов), были артисты, фотографы и маркетологи, которые активно используют AI в своей работе.
➡️ Вкусные коктейли, в том числе и безалкогольные (респект барменам!).
➡️ Хорошая музыка и обстановка. Так как место было зарезервировано чисто под нас, была очень уютная и непринужденная атмосфера.
➡️ Для самых стойких мы организовали афтерпати на шикарной террасе с видом на реку (кудос моему другу Андрею!). Разошлись в 3 часа ночи только 🎵 .
Вторую тусу поменьше на 15 человек провели через два дня после первой на берегу реки Вислы за комфортабельными деревянными столами, где можно было приносить свои напитки. Тут было более спокойно, но не менее кайфово, смогли хорошо пообщаться и выпить пива с ребятами, наблюдая красивые виды вокруг.
Кроме того, меня пригласили на локальный Data Breakfast, который ребята проводили в Гугле. У Гугла оказалось прям крупное представительство в Варшаве, и есть даже команды из Waymo (где пилят self-driving).
Еще позвали в гости в офис Pinterest, где я познакомился с командой, вышедшей из белорусского стартапа Vochi, который был куплен Пинтерестом в 2021. Ну, и конечно, поработал из нашего Метовского офиса с классным видом на центр Варшавы.
Поездку в Варшаву объявляю очень удачной, приеду еще раз как-нибудь!
#personal
@ai_newz
Я провел целых две тусовки с подписчиками – одной оказалось мало, и меня попросили организовать еще одну. Сразу скажу, что обе прошли просто шикарно! Спасибо всем, кто пришел – вы все очень крутые!
Для первой забронировал целиком беларусский бар "Банки-Бутылки" (он же раньше был в Минске на Зыбицкой). Я приятно офигел от того, что на тусу пришло более 50 человек. Это пока рекордная по размеру тусовка "эйай ньюз". Получилось прям круто! Тут было, как мне кажется, три составляющие успеха:
Вторую тусу поменьше на 15 человек провели через два дня после первой на берегу реки Вислы за комфортабельными деревянными столами, где можно было приносить свои напитки. Тут было более спокойно, но не менее кайфово, смогли хорошо пообщаться и выпить пива с ребятами, наблюдая красивые виды вокруг.
Кроме того, меня пригласили на локальный Data Breakfast, который ребята проводили в Гугле. У Гугла оказалось прям крупное представительство в Варшаве, и есть даже команды из Waymo (где пилят self-driving).
Еще позвали в гости в офис Pinterest, где я познакомился с командой, вышедшей из белорусского стартапа Vochi, который был куплен Пинтерестом в 2021. Ну, и конечно, поработал из нашего Метовского офиса с классным видом на центр Варшавы.
Поездку в Варшаву объявляю очень удачной, приеду еще раз как-нибудь!
#personal
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Я раньше вам уже рассказывал, что у нас в Мете есть возможность коллаборировать с университетами и супервайзить научные работы студентов. Так вот я этим и продолжаю заниматься.
В этом году я супервайзил еще одну магистерскую работу в ETH Zurich. Это работет так, что у студента формально есть супервайзер и в ETH и в Мете. Но так как это коллаб, то тему работы задавали мы из Меты (я и еще одна моя коллега).
Мы еженедельно встречались и обсуждали прогрес по проекту, я накидывал идеи и помогал решать проблемы если были блокеры.
За основу проекта была взята моя статья Avatars Grow Legs, но на этот раз мы хотели сделать что-то с анимацией лиц.
Около месяца назад моя студентка-магистрантка добила этот проект и успешно защитила свою Магистерскую работу в ETH Zurich!
Работа называется "OccluFaceDiff: Multimodal-Conditioned Occlusion-Aware 3D Facial Animation Using Diffusion". Если коротко, то мы научили (я говорю мы, но на самом деле всю работу, конечно, сделала студентка) мультимодальную диффузионную модель восстанавливать 3D shape лица человека по видео и аудио, если оно есть. То есть на вход видеоряд - на выходе последовательность 3D шейпов лица, соответствующая каждому кадру. Фишка работы была в том, чтобы восстанавливать все лицо даже если часть его закрыта чем-то (например маской или рукой). Если часть лица не видна, но есть аудио, то по звуку и эмоциям можно предсказать, как выглядело лицо человека. Самое сложное тут это мимика.
Ну, а после защиты счастливая студентка уехала на стажировку в Amazon в Люксембург :) Как вернется, возможно, будем готовить статью.
Так что, если вы толковый студент (желательно PhD) и есть амбиции и желание написать со мной статью, то можете написать в лс или в комментах. Возможно, сможем поработать вместе.
#personal
@ai_newz
В этом году я супервайзил еще одну магистерскую работу в ETH Zurich. Это работет так, что у студента формально есть супервайзер и в ETH и в Мете. Но так как это коллаб, то тему работы задавали мы из Меты (я и еще одна моя коллега).
Мы еженедельно встречались и обсуждали прогрес по проекту, я накидывал идеи и помогал решать проблемы если были блокеры.
За основу проекта была взята моя статья Avatars Grow Legs, но на этот раз мы хотели сделать что-то с анимацией лиц.
Около месяца назад моя студентка-магистрантка добила этот проект и успешно защитила свою Магистерскую работу в ETH Zurich!
Работа называется "OccluFaceDiff: Multimodal-Conditioned Occlusion-Aware 3D Facial Animation Using Diffusion". Если коротко, то мы научили (я говорю мы, но на самом деле всю работу, конечно, сделала студентка) мультимодальную диффузионную модель восстанавливать 3D shape лица человека по видео и аудио, если оно есть. То есть на вход видеоряд - на выходе последовательность 3D шейпов лица, соответствующая каждому кадру. Фишка работы была в том, чтобы восстанавливать все лицо даже если часть его закрыта чем-то (например маской или рукой). Если часть лица не видна, но есть аудио, то по звуку и эмоциям можно предсказать, как выглядело лицо человека. Самое сложное тут это мимика.
Ну, а после защиты счастливая студентка уехала на стажировку в Amazon в Люксембург :) Как вернется, возможно, будем готовить статью.
Так что, если вы толковый студент (желательно PhD) и есть амбиции и желание написать со мной статью, то можете написать в лс или в комментах. Возможно, сможем поработать вместе.
#personal
@ai_newz
Только что собеседовал чела по кодингу на SWE (Software Engineer) позицию в инфру. Таких сильных парней попадается меньше чем 1/10. Язык программирования для решения двух кодинг задачек он выбрал Java.
Это тот случай, когда, я как интервьюер, получаю удовольствие от общения с кандидатом. Чел на зубок тебе рассказывает, какая сложность итерации по map в Java, и как контейнер реализован на уровне примитивов, как происходит разбивка на бакеты, какого размера бакеты, как и с какой сложностью происходит поиск внутри бакета, если есть коллизии, что если бакеты маленького размера, что если большого, и т.д. То есть, даже не начав кодить, кандидат дал мне понять, что он очень хорошо сечет в том, что делает, внимателен к деталям, и что ему эти вещи интересны. После такого интро, даже небольшие помарки в коде (типа поставил <= вместо <) уже не имеют значения.
В итоге две задачи решены сильно раньше времени (то есть и код он писал быстро) и без багов, и мысли излагал структурированно. В конце интервью и у меня хорошее настроение, и у кандидата (т.к. я сказал, что он красавец, справился сильно раньше времени). Ну, это 100% зачет!
#interviews #personal
@ai_newz
Это тот случай, когда, я как интервьюер, получаю удовольствие от общения с кандидатом. Чел на зубок тебе рассказывает, какая сложность итерации по map в Java, и как контейнер реализован на уровне примитивов, как происходит разбивка на бакеты, какого размера бакеты, как и с какой сложностью происходит поиск внутри бакета, если есть коллизии, что если бакеты маленького размера, что если большого, и т.д. То есть, даже не начав кодить, кандидат дал мне понять, что он очень хорошо сечет в том, что делает, внимателен к деталям, и что ему эти вещи интересны. После такого интро, даже небольшие помарки в коде (типа поставил <= вместо <) уже не имеют значения.
В итоге две задачи решены сильно раньше времени (то есть и код он писал быстро) и без багов, и мысли излагал структурированно. В конце интервью и у меня хорошее настроение, и у кандидата (т.к. я сказал, что он красавец, справился сильно раньше времени). Ну, это 100% зачет!
#interviews #personal
@ai_newz
Запись большого стрима про карьеру и собесы в БигТех
Так как все спрашивали про запись недавнего стрима с коллегами из FAANG, мы все-таки ее выложили:)
Вот таймкоды, на интересные моменты:
2:00 - Интро
10:27 - Интро со мной, про мои походы в горы
11:49 - Чем я занимаюсь по работе
12:30 - Emu Flash - риалтайм генерация картинок в meta-ai, и как наша демка дошла до Цукерберга
20:40 - Кто спал днем, а кто всю ночь работал
21:45 - Как выглядят собесы на ресерч менеджера в Мету
33:20 - Про Behavioral интервью
45:22 - Какие собесы на research позиции?
48:27 - Коротко про AI Research Design интервью
49:17 - Почему нужно PhD на ресерч роли, какие скилы применяются в работе
51:05 - Будут ли умирать роли в Applied Research с приходом LLM? (нет)
55:54 - Про менторство, как это помогает расти, как найти ментора.
1:11:13 - Какая мотивация работать в БигТехе.
1:49:24 - Заключение. Финальные советы по прохождению собесов и по карьере в целом.
Как и обещал на стриме ( 1:02:25 ), я анонсировал закрытое комьюнити по подготовке к собеседованиям на AI/ML роли в FAANG и не-FAANG. Подробности и как записаться – в посте.
#personal #career #interviews
@ai_newz
Так как все спрашивали про запись недавнего стрима с коллегами из FAANG, мы все-таки ее выложили:)
Вот таймкоды, на интересные моменты:
2:00 - Интро
10:27 - Интро со мной, про мои походы в горы
11:49 - Чем я занимаюсь по работе
12:30 - Emu Flash - риалтайм генерация картинок в meta-ai, и как наша демка дошла до Цукерберга
20:40 - Кто спал днем, а кто всю ночь работал
21:45 - Как выглядят собесы на ресерч менеджера в Мету
33:20 - Про Behavioral интервью
45:22 - Какие собесы на research позиции?
48:27 - Коротко про AI Research Design интервью
49:17 - Почему нужно PhD на ресерч роли, какие скилы применяются в работе
51:05 - Будут ли умирать роли в Applied Research с приходом LLM? (нет)
55:54 - Про менторство, как это помогает расти, как найти ментора.
1:11:13 - Какая мотивация работать в БигТехе.
1:49:24 - Заключение. Финальные советы по прохождению собесов и по карьере в целом.
Как и обещал на стриме ( 1:02:25 ), я анонсировал закрытое комьюнити по подготовке к собеседованиям на AI/ML роли в FAANG и не-FAANG. Подробности и как записаться – в посте.
#personal #career #interviews
@ai_newz
YouTube
Про карьеру и бигтех: Кали Новская, Артем Градиент, Сергей Иванов, Юрий Кашницкий и Борис Цейтлин
Стрим про карьеру, собеседования и бигтех
- Кали Новская – Research Scientist Manager в команде LLama-4, авторка телеграм канала t.iss.one/rybolos_channel.
- Артем Градиент – Staff Research Scientist в Meta, GenAI, автор канала t.iss.one/ai_newz.
- Сергей Иванов…
- Кали Новская – Research Scientist Manager в команде LLama-4, авторка телеграм канала t.iss.one/rybolos_channel.
- Артем Градиент – Staff Research Scientist в Meta, GenAI, автор канала t.iss.one/ai_newz.
- Сергей Иванов…
This media is not supported in your browser
VIEW IN TELEGRAM
Уже мчусь на поезде в Милан, чтобы завтра пойти на конференцию ECCV24. Впереди много классных докладов и нетворкинга!
И уже создал чат, буду организовывать тусы - это то, что я особенно люблю во время конференций. Залетайте: https://t.iss.one/+ovvnxsSwBXkzMzky
---
На завтра я для себя выбрал следующие туториалы и воркшопы.
Туториалы:
- Large Multimodal Foundation Models - на доклады Джитендры и Тревора Дарела грех не пойти
- Efficient Text-to-Image and Text-to-3D modeling - будет интересный доклад про Parallel decoding for token-based image generation 11:30-12:00
Воркшопы:
- AI for Visual Arts Workshop and Challenges - Мне это близко, так как много над этой темой работал во время PhD. А в 09:30 будет выступать мой доктор-батя Бьёрн Оммер, надо сходить.
- The Second Perception Test Challenge - В 10:15-10:45 выступает Abhinav Gupta из CMU, всегда нравятся его доклады.
- 50SFM:Half-century of Structure-from-Motion - SFM алгоритму уже почти пол века, хочу пойти на доклад "A historical review of SfM - 300 years and counting" (14:30 - 15:00) или "My 30-year journey with SfM" (16:00 - 16:30) от Марка Полифейса.
- Self-Supervised Learning - What is next? - организует мой товарищ Миша Доркенвальд, и тема из моего PhD. "Vision Foundation Models (with academic compute)" 11:55-12:30
- Efficient Deep Learning for Foundation Models - очень класный лайнап докладов (14:10-5:40) по интересной мне теме.
- 3rd edition of Computer Vision for Metaverse - наша команда ко-организует.
- Autonomous Vehicles meet Multimodal Foundation Models - заскочить посмотреть, как VLLM пытаются использовать в автономном вождении и как справляются с длинном хвостом распределения редких объектов.
- Workshop on Unlearning and Model Editing - интересный докдлад про контроль генерации диффузией "Prompt Sliders for Fine-Grained Control, Editing and Erasing of Concepts in Diffusion Models" в 15:10-15:30
#personal #конфа
@ai_newz
И уже создал чат, буду организовывать тусы - это то, что я особенно люблю во время конференций. Залетайте: https://t.iss.one/+ovvnxsSwBXkzMzky
---
На завтра я для себя выбрал следующие туториалы и воркшопы.
Туториалы:
- Large Multimodal Foundation Models - на доклады Джитендры и Тревора Дарела грех не пойти
- Efficient Text-to-Image and Text-to-3D modeling - будет интересный доклад про Parallel decoding for token-based image generation 11:30-12:00
Воркшопы:
- AI for Visual Arts Workshop and Challenges - Мне это близко, так как много над этой темой работал во время PhD. А в 09:30 будет выступать мой доктор-батя Бьёрн Оммер, надо сходить.
- The Second Perception Test Challenge - В 10:15-10:45 выступает Abhinav Gupta из CMU, всегда нравятся его доклады.
- 50SFM:Half-century of Structure-from-Motion - SFM алгоритму уже почти пол века, хочу пойти на доклад "A historical review of SfM - 300 years and counting" (14:30 - 15:00) или "My 30-year journey with SfM" (16:00 - 16:30) от Марка Полифейса.
- Self-Supervised Learning - What is next? - организует мой товарищ Миша Доркенвальд, и тема из моего PhD. "Vision Foundation Models (with academic compute)" 11:55-12:30
- Efficient Deep Learning for Foundation Models - очень класный лайнап докладов (14:10-5:40) по интересной мне теме.
- 3rd edition of Computer Vision for Metaverse - наша команда ко-организует.
- Autonomous Vehicles meet Multimodal Foundation Models - заскочить посмотреть, как VLLM пытаются использовать в автономном вождении и как справляются с длинном хвостом распределения редких объектов.
- Workshop on Unlearning and Model Editing - интересный докдлад про контроль генерации диффузией "Prompt Sliders for Fine-Grained Control, Editing and Erasing of Concepts in Diffusion Models" в 15:10-15:30
#personal #конфа
@ai_newz
На этой неделе происходило так много всего, что я не успевал обо всем постить. Навёрстываем.
В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.
Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.
Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.
Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).
А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.
Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)
Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.
#personal #конфа
@ai_newz
В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.
Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.
Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.
Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).
А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.
Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)
Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.
#personal #конфа
@ai_newz
Media is too big
VIEW IN TELEGRAM
А у меня активная неделя продолжается. Вчера отдохнул денёк, теперь едем дальше.
Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.
Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.
Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.
Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.
Ссылка на чат ai_newz x Bay Area: тык.
#personal #карьера
@ai_newz
Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.
Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.
Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.
Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.
Ссылка на чат ai_newz x Bay Area: тык.
#personal #карьера
@ai_newz
Мой доклад про Imagine Flash
На прошлой неделе я делал доклад на Цюрихском AI+X саммите про модель Imagine Flash (пост). Выкладываю запись доклада.
Если вам давно хотелось узнать, как мы ускоряли диффузионные модели, то вот повод глянуть.
Youtube: тык
#personal
@ai_newz
На прошлой неделе я делал доклад на Цюрихском AI+X саммите про модель Imagine Flash (пост). Выкладываю запись доклада.
Если вам давно хотелось узнать, как мы ускоряли диффузионные модели, то вот повод глянуть.
Youtube: тык
#personal
@ai_newz
YouTube
Imagine Flash: A real-time text-to-image synthesis
Recording of my talk from AI+X Summit, Zurich, 04 Oct 2024.
X: twitter: x.com/artsiom_s
Imagine Flash paper (work done at Meta): https://ai.meta.com/research/publications/imagine-flash-accelerating-emu-diffusion-models-with-backward-distillation/
Abstract:…
X: twitter: x.com/artsiom_s
Imagine Flash paper (work done at Meta): https://ai.meta.com/research/publications/imagine-flash-accelerating-emu-diffusion-models-with-backward-distillation/
Abstract:…