На этой неделе происходило так много всего, что я не успевал обо всем постить. Навёрстываем.
В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.
Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.
Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.
Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).
А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.
Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)
Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.
#personal #конфа
@ai_newz
В четверг я уехал с ECCV, на день раньше официального окончания. Я спешил на другой ивент.
Как только вернулся из Милана назад в Цюрих, сразу нужно было идти выступать на другую крупную конференцию – AI+X саммит. Это конфа, которую организует ETH AI Center, и где представлены ведущие Цюрихское научные AI лабы, стартапы и компании.
Было много про Computer Vision и Robotics (чем Цюрих особенно славится), а также AI в медицине и финансах.
Я выступал с докладом "Imagine Flash": Meta's real-time text-to-image synthesis diffusion model (пост про модель).
А затем меня пригласили на панельную дискуссию в треке Human-Centric Computing in the Age of AI Track. На панели также был Federico Tombari, Senior Staff Research Scientist из Цюрихского Гугла, и местные профессора.
Забавно что на панельной дискуссии со мной также сидел мой научный дед – Prof. Joachim Buhmann из ETH. В немецкоязычном научном мире есть такое понятие как Doktorvater (рус. Научный Отец) - это научник, у которого вы написали PhD. Так вот мой научник Björn Ommer писал диссер у Joachim Buhmann, поэтому Joachim получается моим научным дедом. Когда это выяснилось во время дискуссии, мы здорово посмеялись, что на конфе собралось наших 3 научных поколения, тем более Бьёрн в это время выступал в соседнем зале)
Но на этом насыщенная неделя не закончилась. Продолжение в следующем посте.
#personal #конфа
@ai_newz
Media is too big
VIEW IN TELEGRAM
А у меня активная неделя продолжается. Вчера отдохнул денёк, теперь едем дальше.
Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.
Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.
Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.
Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.
Ссылка на чат ai_newz x Bay Area: тык.
#personal #карьера
@ai_newz
Я лечу в главный офис Meta в Menlo Park, California. Мы с командой будем отмечать успешный релиз Movie Gen и обсуждать дальнейшие планы. Как всегда я забил встречи с важными людьми. Пока есть шанс встретиться лично, нужно пользоваться – это гораздо более эффективно чем говорить по видео.
Тренировать новые модели и фигачить код важно и полезно, но не менее важно для карьеры быть на виду и регулярно напоминать топам о себе.
Ну, а кроме всего этого я ещё недельку понаслаждаюсь теплом и солнцем в Калифорнии, а то в Швейцарии уже во всю бушует осень.
Ещё возможно соберём митап в Бэй Эриа в конце недели (пост с апрельской тусовки). Так что если вы тут, вступайте в чатик, но не забудьте представиться как зайдёте.
Ссылка на чат ai_newz x Bay Area: тык.
#personal #карьера
@ai_newz
Нейродайджест за неделю (#38)
Генеративные модели
- Movie Gen. SOTA видео-модель от Meta! Горжусь, что являюсь одним из авторов.
- Вот примеры. Ну что, пока Сора?
- Blueberry 🫐 = Flux 1.1 pro. Теперь ясно, кто скрывался под маской на арене txt2img. Это хитрая оптимизация версии 1.0 без потери качества. Официальный релиз.
- Генерим на Flux pro бесплатно. Лавочка на Freepik без цензуры прикрылась, но все еще есть альтернатива tost.ai.
О канале и авторе
- Отчет по сходке ECCV чата. Наметили ресерч по изучению вкусовых характеристик окрошки с квасом или кефиром.
- Закрываем Early Bird. Но до 14 октября еще можно записаться на интенсив по собеседованиям в FAANG.
- С ECCV на бал, а точнее на AI+X саммит. Бесконечные перелеты и конференции. И история про моего научного деда.
- Лечу в Калифорнию. Планирую встретиться с командой, поболтать о Movie Gen и понетворкать.
ClosedAI
- OpenAI => ClosedAI. Компания переходит в статус for-profit.
- И сразу после этого OpenAI подняла $6,6 млрд. Ждем подорожания подписки.
Прочее
- Cerebras ту зе мун! Стартап с сверхбыстрым инференсом выходит на IPO.
- Unitree — зверь на 4-х ного-колесах. На ECCV собаки только из алюминия. Даже людей не прочь покатать. Видео здесь.
> Читать дайджест #37
#дайджест
@ai_newz
Генеративные модели
- Movie Gen. SOTA видео-модель от Meta! Горжусь, что являюсь одним из авторов.
- Вот примеры. Ну что, пока Сора?
- Blueberry 🫐 = Flux 1.1 pro. Теперь ясно, кто скрывался под маской на арене txt2img. Это хитрая оптимизация версии 1.0 без потери качества. Официальный релиз.
- Генерим на Flux pro бесплатно. Лавочка на Freepik без цензуры прикрылась, но все еще есть альтернатива tost.ai.
О канале и авторе
- Отчет по сходке ECCV чата. Наметили ресерч по изучению вкусовых характеристик окрошки с квасом или кефиром.
- Закрываем Early Bird. Но до 14 октября еще можно записаться на интенсив по собеседованиям в FAANG.
- С ECCV на бал, а точнее на AI+X саммит. Бесконечные перелеты и конференции. И история про моего научного деда.
- Лечу в Калифорнию. Планирую встретиться с командой, поболтать о Movie Gen и понетворкать.
ClosedAI
- OpenAI => ClosedAI. Компания переходит в статус for-profit.
- И сразу после этого OpenAI подняла $6,6 млрд. Ждем подорожания подписки.
Прочее
- Cerebras ту зе мун! Стартап с сверхбыстрым инференсом выходит на IPO.
- Unitree — зверь на 4-х ного-колесах. На ECCV собаки только из алюминия. Даже людей не прочь покатать. Видео здесь.
> Читать дайджест #37
#дайджест
@ai_newz
Нобелевка за нейронки
Нобелевскую премию по физике выиграли Джеффри Хинтон и Джон Хопфилд. Премию присудили за "Фундаментальные открытия и изобретения, которые способствуют машинному обучению с искусственными нейронными сетями". При чём здесь физика - сложно понять. Похоже, комитет просто пытался хоть куда-то приткнуть нейронки, а физика тут ближе всего. Хотя, по-моему, тут больше бы подошла даже медицина - там хотя бы AlphaFold совершил прорыв в чём-то, а с открытиями в области физики из-за нейронок как-то негусто.
Возможно, причина в том, что Хопфилд всё-таки по образованию физик. Хотя его основной вклад в науку - изобретение сетей Хопфилда, рекуррентных сетей, которые во многом положили начало возрождению нейронных сетей в 80-х и 90-х.
Хинтон применил метод обратного распространения ошибки для тренировки нейронок, это позволило тренировать многослойные сети. Кроме того Хинтон изобрел машину Больцмана – архитектура для unsupervised обучения, генеративный стохастический вариант сети Хопфилда. А студенты Хинтона - Илья Суцкевер и Алекс Крижевский, создали AlexNet. Именно она начала всю эту гонку нейронок, показав, что их можно масштабировать через тренировку на GPU.
В общем, хайп по нейросетям теперь проник и в Нобелевский комитет.
@ai_newz
Нобелевскую премию по физике выиграли Джеффри Хинтон и Джон Хопфилд. Премию присудили за "Фундаментальные открытия и изобретения, которые способствуют машинному обучению с искусственными нейронными сетями". При чём здесь физика - сложно понять. Похоже, комитет просто пытался хоть куда-то приткнуть нейронки, а физика тут ближе всего. Хотя, по-моему, тут больше бы подошла даже медицина - там хотя бы AlphaFold совершил прорыв в чём-то, а с открытиями в области физики из-за нейронок как-то негусто.
Возможно, причина в том, что Хопфилд всё-таки по образованию физик. Хотя его основной вклад в науку - изобретение сетей Хопфилда, рекуррентных сетей, которые во многом положили начало возрождению нейронных сетей в 80-х и 90-х.
Хинтон применил метод обратного распространения ошибки для тренировки нейронок, это позволило тренировать многослойные сети. Кроме того Хинтон изобрел машину Больцмана – архитектура для unsupervised обучения, генеративный стохастический вариант сети Хопфилда. А студенты Хинтона - Илья Суцкевер и Алекс Крижевский, создали AlexNet. Именно она начала всю эту гонку нейронок, показав, что их можно масштабировать через тренировку на GPU.
В общем, хайп по нейросетям теперь проник и в Нобелевский комитет.
@ai_newz
Forwarded from Мишин Лернинг 🇺🇦🇮🇱
🎓 Уже вторая Нобелевская премия за AI — на этот раз по химии. Половина премии за предсказание структуры белков» нейросетью Alpha Fold (от DeepMind)
Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».
Нобелевскую премию по химии 2024 года: одну половину — Дэвиду Бейкеру «за вычислительный дизайн белков», а другую половину — совместно Демису Хассабису и Джону М. Джамперу «за предсказание структуры белков».
Pixtral-12B: тех-репорт
Месяц назад выкатили модель (пост был тут). А сейчас вышел тех-репорт про Pixtral-12B с кучей деталей про мультимодальную архитектуру и эвал, но без описания тренировки. Полезное чтиво!
По бенчам бьют Llama-3.2 11B & Qwen-2-VL 7B.
Статья
Webpage
Inference code
Evaluation code
@ai_newz
Месяц назад выкатили модель (пост был тут). А сейчас вышел тех-репорт про Pixtral-12B с кучей деталей про мультимодальную архитектуру и эвал, но без описания тренировки. Полезное чтиво!
По бенчам бьют Llama-3.2 11B & Qwen-2-VL 7B.
Статья
Webpage
Inference code
Evaluation code
@ai_newz
Если вы активно пользовались MidJourney, возможно, заметили, что галерея на сайте в последнее время состоит из картинок с очень коротким промптом и каким-то рандомным sref-кодом.
Мало того, что это просто неинтересно, так ещё и повторить результат совершенно не получается без конкретного сида, так как такой короткий промпт оставляет модели слишком много свободы и не содержит конкретного описания, что грустно, если хочешь сделать что-то похожее.
Вот если проблема со стилем кое-как решается через местный ip-adapter (--sref), то с содержимым придётся помучиться, и это я не говорю о том, что злоупотребление аргументами cref, sref и personalization чревато артефактами и непослушным промптом.
Крутой штукой была команда /describe. Это одна из команд бота в Дискорде: отправляешь ему картинку, а MidJourney Vision выдаёт тебе описание в четырёх вариантах. Собственно, так они и размечают датасеты для тренировки, судя по всему. Но сейчас как-то даже стремно заходить в Дис, когда есть сайт, но там такой команды так и не появилось.
Зато недавно я обнаружил вот такую иконку (см. картинку 1). Кликаем — и вуаля, полное описание картинки по категориям. Берём и лепим свой собственный промпт. Метод, скажем так, для ленивых или тех, кто не обладает широким искусствоведческим вокабуляром. Пользуемся!
Кстати, художники, я знаю, вы тут есть. Как там вообще MidJourney поживает? Не съел его еще Flux?
@ai_newz
Мало того, что это просто неинтересно, так ещё и повторить результат совершенно не получается без конкретного сида, так как такой короткий промпт оставляет модели слишком много свободы и не содержит конкретного описания, что грустно, если хочешь сделать что-то похожее.
Вот если проблема со стилем кое-как решается через местный ip-adapter (--sref), то с содержимым придётся помучиться, и это я не говорю о том, что злоупотребление аргументами cref, sref и personalization чревато артефактами и непослушным промптом.
Крутой штукой была команда /describe. Это одна из команд бота в Дискорде: отправляешь ему картинку, а MidJourney Vision выдаёт тебе описание в четырёх вариантах. Собственно, так они и размечают датасеты для тренировки, судя по всему. Но сейчас как-то даже стремно заходить в Дис, когда есть сайт, но там такой команды так и не появилось.
Зато недавно я обнаружил вот такую иконку (см. картинку 1). Кликаем — и вуаля, полное описание картинки по категориям. Берём и лепим свой собственный промпт. Метод, скажем так, для ленивых или тех, кто не обладает широким искусствоведческим вокабуляром. Пользуемся!
Кстати, художники, я знаю, вы тут есть. Как там вообще MidJourney поживает? Не съел его еще Flux?
@ai_newz
This media is not supported in your browser
VIEW IN TELEGRAM
Добро пожаловать в киберпанк - Маск провёл презентацию Tesla
Показал пару прототипов новых тачек в стилистике Cybertruck вообще без водительских мест - Cybercab (робо-такси) и Robovan (робо-маршрутка). Когда выйдут - непонятно, обещает "до 2027", но с дедлайнами у Маска так себе.
Но вы только посмотрите на этих танцующих роботов Optimus! Они ещё стояли у бара, играли в камень-ножницы-бумагу и вообще всячески взаимодействовали с посетителями. Правда, скорее всего, ими управляли живые люди удалённо.
@ai_newz
Показал пару прототипов новых тачек в стилистике Cybertruck вообще без водительских мест - Cybercab (робо-такси) и Robovan (робо-маршрутка). Когда выйдут - непонятно, обещает "до 2027", но с дедлайнами у Маска так себе.
Но вы только посмотрите на этих танцующих роботов Optimus! Они ещё стояли у бара, играли в камень-ножницы-бумагу и вообще всячески взаимодействовали с посетителями. Правда, скорее всего, ими управляли живые люди удалённо.
@ai_newz
Как найти ментора по карьере и AI - Стрим в субботу
Многие наверное слышали про такое явления как менторинг. Кроме постоянного самообразование в нашей сфере очень помогает иметь старшего товарища, который может направить в правильную сторону и подскажет советом как поступать в той или иной ситуации. Это действительно дорогого стоит, ведь не все актуальные знания изложены где-то на бумаге или в лекциях, плюс личное общение с человеком, который заинтересован помочь развиваться дает тебе гораздо более сильный толчок.
Про менторство мы по чуть-чуть поговорили на недавнем большом стриме. Но я хотел бы по-подробнее обсудить эту тему.
Позтому в субботу в 19:00-19:30 CET проведу небольшой стрим, где поговорим именно про менторинг:
- Почему это полезная штука для роста по карьере как для ресерчеров так и для инженеров. Какие преимущества вам это принесет.
- Советы как получить наибольшую пользу от работы с ментором.
- Где и как можно искать подходящих менторов.
- В чем интерес для ментора прокачивать других людей.
- Еще расскажу про свой опыт менторинга ребят, и как я сам учусь и где нахожу менторов для себя, которые дальше меня по карьере.
Жду вас на стриме завтра в18:30 19:00 CET! (передвинул на 30 минут)
Добавляйте в календарь: ссылка
@ai_newz
Многие наверное слышали про такое явления как менторинг. Кроме постоянного самообразование в нашей сфере очень помогает иметь старшего товарища, который может направить в правильную сторону и подскажет советом как поступать в той или иной ситуации. Это действительно дорогого стоит, ведь не все актуальные знания изложены где-то на бумаге или в лекциях, плюс личное общение с человеком, который заинтересован помочь развиваться дает тебе гораздо более сильный толчок.
Про менторство мы по чуть-чуть поговорили на недавнем большом стриме. Но я хотел бы по-подробнее обсудить эту тему.
Позтому в субботу в 19:00-19:30 CET проведу небольшой стрим, где поговорим именно про менторинг:
- Почему это полезная штука для роста по карьере как для ресерчеров так и для инженеров. Какие преимущества вам это принесет.
- Советы как получить наибольшую пользу от работы с ментором.
- Где и как можно искать подходящих менторов.
- В чем интерес для ментора прокачивать других людей.
- Еще расскажу про свой опыт менторинга ребят, и как я сам учусь и где нахожу менторов для себя, которые дальше меня по карьере.
Жду вас на стриме завтра в
Добавляйте в календарь: ссылка
@ai_newz
Telegram
эйай ньюз
Запись большого стрима про карьеру и собесы в БигТех
Так как все спрашивали про запись недавнего стрима с коллегами из FAANG, мы все-таки ее выложили:)
Вот таймкоды, на интересные моменты:
2:00 - Интро
10:27 - Интро со мной, про мои походы в горы
11:49…
Так как все спрашивали про запись недавнего стрима с коллегами из FAANG, мы все-таки ее выложили:)
Вот таймкоды, на интересные моменты:
2:00 - Интро
10:27 - Интро со мной, про мои походы в горы
11:49…