эйай ньюз
57.8K subscribers
1.39K photos
728 videos
7 files
1.71K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @kander426
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Movie Gen: A Cast of Media Foundation Models

Мы наконец выкатили нашу 30B модель для генерации видео! И я очень рад, что являюсь одним из контрибьютеров в этот грандиозный проект.

Bye-bye SORA. Movie Gen – это новая SOTA в генерации видео по тексту!

Модель генерит 16-секундные видео в 1080p, 16FPS.

Общая длина контекста - 73к видео токенов (256 кадров).

Выкатываем ещё:
- 13B модель для генерации видео одновременно со звуком в 48kHz.
- И ещё тюны для редактирования видео и генерации персонализированных видосов с вашим лицом по заданному фото.

В статье мы описываем много новых штук по части архитектуры, рецептов тренировки больших видео-моделей, параллелизации, увеличения скорости инференса, оценки качества, курирования данных и других трюков. В статье очень много деталей!

Сайт
Блогпост
Подробная статья (92 стр)

Скоро ждите ещё дополнительный пост с разбором.

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
А вот ещё примеры генерации нашей Movie Gen модели вам на обозрение.

Те примеры, где показано маленькое фото в правом верхнем углу – это результат персонализированной генерации с заданным лицом (Personalized Movie Gen).

Переходим на качественно новый уровень!

@ai_newz
На этой неделе происходило так много всего, что я не успевал обо всем постить. Навёрстываем.

В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.

Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.

Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.

Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).

А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.

Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)

Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.

#personal #конфа
@ai_newz
Media is too big
VIEW IN TELEGRAM
А у меня активная неделя продолжается. Вчера отдохнул денёк, теперь едем дальше.

Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.

Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.

Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.

Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.

Ссылка на чат ai_newz x Bay Area: тык.

#personal #карьера
@ai_newz
Нейродайджест за неделю (#38)

Генеративные модели
- Movie Gen. SOTA видео-модель от Meta! Горжусь, что являюсь одним из авторов.
- Вот примеры. Ну что, пока Сора?
- Blueberry 🫐 = Flux 1.1 pro. Теперь ясно, кто скрывался под маской на арене txt2img. Это хитрая оптимизация версии 1.0 без потери качества. Официальный релиз.
- Генерим на Flux pro бесплатно. Лавочка на Freepik без цензуры прикрылась, но все еще есть альтернатива tost.ai.

О канале и авторе
-
Отчет по сходке ECCV чата. Наметили ресерч по изучению вкусовых характеристик окрошки с квасом или кефиром.
- Закрываем Early Bird. Но до 14 октября еще можно записаться на интенсив по собеседованиям в FAANG.
- С ECCV на бал, а точнее на AI+X саммит. Бесконечные перелеты и конференции. И история про моего научного деда.
- Лечу в Калифорнию. Планирую встретиться с командой, поболтать о Movie Gen и понетворкать.

ClosedAI

- OpenAI => ClosedAI. Компания переходит в статус for-profit.
- И сразу после этого OpenAI подняла $6,6 млрд. Ждем подорожания подписки.

Прочее
- Cerebras ту зе мун! Стартап с сверхбыстрым инференсом выходит на IPO.
- Unitree — зверь на 4-х ного-колесах. На ECCV собаки только из алюминия. Даже людей не прочь покатать. Видео здесь.

> Читать дайджест #37

#дайджест
@ai_newz
Нобелевка за нейронки

Нобелевскую премию по физике выиграли Джеффри Хинтон и Джон Хопфилд. Премию присудили за "Фундаментальные открытия и изобретения, которые способствуют машинному обучению с искусственными нейронными сетями". При чём здесь физика - сложно понять. Похоже, комитет просто пытался хоть куда-то приткнуть нейронки, а физика тут ближе всего. Хотя, по-моему, тут больше бы подошла даже медицина - там хотя бы AlphaFold совершил прорыв в чём-то, а с открытиями в области физики из-за нейронок как-то негусто.

Возможно, причина в том, что Хопфилд всё-таки по образованию физик. Хотя его основной вклад в науку - изобретение сетей Хопфилда, рекуррентных сетей, которые во многом положили начало возрождению нейронных сетей в 80-х и 90-х.

Хинтон применил метод обратного распространения ошибки для тренировки нейронок, это позволило тренировать многослойные сети. Кроме того Хинтон изобрел машину Больцмана – архитектура для unsupervised обучения, генеративный стохастический вариант сети Хопфилда. А студенты Хинтона - Илья Суцкевер и Алекс Крижевский, создали AlexNet. Именно она начала всю эту гонку нейронок, показав, что их можно масштабировать через тренировку на GPU.

В общем, хайп по нейросетям теперь проник и в Нобелевский комитет.

@ai_newz
🎓 Уже вторая Нобелевская премия за AI — на этот раз по химии. Половина премии за предсказание структуры белков» нейросетью Alpha Fold (от DeepMind)

Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».