эйай ньюз
66.1K subscribers
1.49K photos
793 videos
7 files
1.81K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

В свободное время работаю как Staff Research Scientist в Meta Generative AI в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
На этой неделе происходило так много всего, что я не успевал обо всем постить. Навёрстываем.

В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.

Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.

Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.

Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).

А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.

Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)

Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.

#personal #конфа
@ai_newz
Media is too big
VIEW IN TELEGRAM
А у меня активная неделя продолжается. Вчера отдохнул денёк, теперь едем дальше.

Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.

Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.

Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.

Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.

Ссылка на чат ai_newz x Bay Area: тык.

#personal #карьера
@ai_newz
Нейродайджест за неделю (#38)

Генеративные модели
- Movie Gen. SOTA видео-модель от Meta! Горжусь, что являюсь одним из авторов.
- Вот примеры. Ну что, пока Сора?
- Blueberry 🫐 = Flux 1.1 pro. Теперь ясно, кто скрывался под маской на арене txt2img. Это хитрая оптимизация версии 1.0 без потери качества. Официальный релиз.
- Генерим на Flux pro бесплатно. Лавочка на Freepik без цензуры прикрылась, но все еще есть альтернатива tost.ai.

О канале и авторе
-
Отчет по сходке ECCV чата. Наметили ресерч по изучению вкусовых характеристик окрошки с квасом или кефиром.
- Закрываем Early Bird. Но до 14 октября еще можно записаться на интенсив по собеседованиям в FAANG.
- С ECCV на бал, а точнее на AI+X саммит. Бесконечные перелеты и конференции. И история про моего научного деда.
- Лечу в Калифорнию. Планирую встретиться с командой, поболтать о Movie Gen и понетворкать.

ClosedAI

- OpenAI => ClosedAI. Компания переходит в статус for-profit.
- И сразу после этого OpenAI подняла $6,6 млрд. Ждем подорожания подписки.

Прочее
- Cerebras ту зе мун! Стартап с сверхбыстрым инференсом выходит на IPO.
- Unitree — зверь на 4-х ного-колесах. На ECCV собаки только из алюминия. Даже людей не прочь покатать. Видео здесь.

> Читать дайджест #37

#дайджест
@ai_newz
Нобелевка за нейронки

Нобелевскую премию по физике выиграли Джеффри Хинтон и Джон Хопфилд. Премию присудили за "Фундаментальные открытия и изобретения, которые способствуют машинному обучению с искусственными нейронными сетями". При чём здесь физика - сложно понять. Похоже, комитет просто пытался хоть куда-то приткнуть нейронки, а физика тут ближе всего. Хотя, по-моему, тут больше бы подошла даже медицина - там хотя бы AlphaFold совершил прорыв в чём-то, а с открытиями в области физики из-за нейронок как-то негусто.

Возможно, причина в том, что Хопфилд всё-таки по образованию физик. Хотя его основной вклад в науку - изобретение сетей Хопфилда, рекуррентных сетей, которые во многом положили начало возрождению нейронных сетей в 80-х и 90-х.

Хинтон применил метод обратного распространения ошибки для тренировки нейронок, это позволило тренировать многослойные сети. Кроме того Хинтон изобрел машину Больцмана – архитектура для unsupervised обучения, генеративный стохастический вариант сети Хопфилда. А студенты Хинтона - Илья Суцкевер и Алекс Крижевский, создали AlexNet. Именно она начала всю эту гонку нейронок, показав, что их можно масштабировать через тренировку на GPU.

В общем, хайп по нейросетям теперь проник и в Нобелевский комитет.

@ai_newz
🎓 Уже вторая Нобелевская премия за AI — на этот раз по химии. Половина премии за предсказание структуры белков» нейросетью Alpha Fold (от DeepMind)

Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».
Pixtral-12B: тех-репорт

Месяц назад выкатили модель (пост был тут). А сейчас вышел тех-репорт про Pixtral-12B с кучей деталей про мультимодальную архитектуру и эвал, но без описания тренировки. Полезное чтиво!

По бенчам бьют Llama-3.2 11B & Qwen-2-VL 7B.

Статья
Webpage
Inference code
Evaluation code

@ai_newz
Если вы активно пользовались MidJourney, возможно, заметили, что галерея на сайте в последнее время состоит из картинок с очень коротким промптом и каким-то рандомным sref-кодом.

Мало того, что это просто неинтересно, так ещё и повторить результат совершенно не получается без конкретного сида, так как такой короткий промпт оставляет модели слишком много свободы и не содержит конкретного описания, что грустно, если хочешь сделать что-то похожее.

Вот если проблема со стилем кое-как решается через местный ip-adapter (--sref), то с содержимым придётся помучиться, и это я не говорю о том, что злоупотребление аргументами cref, sref и personalization чревато артефактами и непослушным промптом.

Крутой штукой была команда /describe. Это одна из команд бота в Дискорде: отправляешь ему картинку, а MidJourney Vision выдаёт тебе описание в четырёх вариантах. Собственно, так они и размечают датасеты для тренировки, судя по всему. Но сейчас как-то даже стремно заходить в Дис, когда есть сайт, но там такой команды так и не появилось.

Зато недавно я обнаружил вот такую иконку (см. картинку 1). Кликаем — и вуаля, полное описание картинки по категориям. Берём и лепим свой собственный промпт. Метод, скажем так, для ленивых или тех, кто не обладает широким искусствоведческим вокабуляром. Пользуемся!

Кстати, художники, я знаю, вы тут есть. Как там вообще MidJourney поживает? Не съел его еще Flux?

@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Добро пожаловать в киберпанк - Маск провёл презентацию Tesla

Показал пару прототипов новых тачек в стилистике Cybertruck вообще без водительских мест - Cybercab (робо-такси) и Robovan (робо-маршрутка). Когда выйдут - непонятно, обещает "до 2027", но с дедлайнами у Маска так себе.

Но вы только посмотрите на этих танцующих роботов Optimus! Они ещё стояли у бара, играли в камень-ножницы-бумагу и вообще всячески взаимодействовали с посетителями. Правда, скорее всего, ими управляли живые люди удалённо.

@ai_newz
Как найти ментора по карьере и AI - Стрим в субботу

Многие наверное слышали про такое явления как менторинг. Кроме постоянного самообразование в нашей сфере очень помогает иметь старшего товарища, который может направить в правильную сторону и подскажет советом как поступать в той или иной ситуации. Это действительно дорогого стоит, ведь не все актуальные знания изложены где-то на бумаге или в лекциях, плюс личное общение с человеком, который заинтересован помочь развиваться дает тебе гораздо более сильный толчок.

Про менторство мы по чуть-чуть поговорили на недавнем большом стриме. Но я хотел бы по-подробнее обсудить эту тему.

Позтому в субботу в 19:00-19:30 CET проведу небольшой стрим, где поговорим именно про менторинг:
- Почему это полезная штука для роста по карьере как для ресерчеров так и для инженеров. Какие преимущества вам это принесет.
- Советы как получить наибольшую пользу от работы с ментором.
- Где и как можно искать подходящих менторов.
- В чем интерес для ментора прокачивать других людей.
- Еще расскажу про свой опыт менторинга ребят, и как я сам учусь и где нахожу менторов для себя, которые дальше меня по карьере.

Жду вас на стриме завтра в 18:30 19:00 CET! (передвинул на 30 минут)
Добавляйте в календарь: ссылка

@ai_newz
Live stream scheduled for
Live stream scheduled for
Live stream started
Пост для чата стрима про менторинг.

@ai_newz
Live stream finished (44 minutes)