Complete AI
7.81K subscribers
495 photos
35 videos
10 files
270 links
Меня зовут Андрей Кузнецов

Директор FusionBrain Lab в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML
Download Telegram
Вчера мы в AIRI запустили флешмоб, в рамках которого учёные рассказывают про свои первые публикации. Вот и я решил окунуться в прошлое и вспомнить, с чего начал я свой путь в науке и компьютерном зрении.

Первая моя статья вышла в 2008 году в Вестнике Самарского государственного аэрокосмического университета и была посвящена анализу изображений радужки с использованием преобразования Радона. Я был на 3м курсе и незадолго до написания статьи был увлечён рассказом своего первого научного руководителя Александра Викторовича Куприянова (ныне д.т.н., директор Института информатики и кибернетики Самарского университета) о проводимых исследованиях в области анализа цифровых изображений. Я стал понемногу погружаться в мир цифровой обработки сигналов, узнал о возможных применения таких разработок в разных доменах, в том числе медицинском, и достаточно быстро втянулся в исследования. Хотелось найти в области анализа радужных оболочек что-то очень интересное, ведь их структура при ближайшем рассмотрении выглядит завораживающе.

Читая сейчас свою первую работу, я, конечно, гляжу на неё совсем другим взглядом, но в памяти всплывают моменты, как я строил графики и генерировал к ней иллюстрации. Довольно приятные и ностальгически-душевные воспоминания)

В статье я исследовал различные механизмы извлечения признаков в полярной развёртке радужек с помощью преобразования Радона и искал способы эффективного признакового представления в различных цветовых пространствах.

Дальше мои исследования в этой области далеко не пошли, медицинский домен в то время меня вероятно не сильно интересовал. Следующим этапом в карьере в компьютерном зрении стали данные дистанционного зондирования Земли, и вот задачи их анализа захватили меня на 10+ лет🗺️ — но это уже совсем другая история)

P.S. Ещё раз хотел бы поблагодарить своего первого научного наставника Куприянова А.В. за этот стартовый "научный капитал"🤝

#AIRI_вдохновляет
🔥58👌9👍7💯4❤‍🔥3👎1🏆1
Media is too big
VIEW IN TELEGRAM
OpenAI снова всех удивляет

Выпустили модель text2video под названием Sora. Качество потрясающее - фотореалистичность в полной мере. В основе комбо из диффузии и трансформера.

Ждём статью, но интуитивно есть представление, как добились такого.

https://openai.com/sora

@complete_ai
🔥50❤‍🔥14💯6
Mistral-next на подходе
Link

Затаились в ожидании
🔥16👍7💯3
Вот и Review статья про Sora пожаловала "от OpenAI"
(А точнее от Lehigh University и Microsoft Research)

Сделать разбор статьи о том, что внутри?

PDF
В рамках уточнения: авторы статьи не являются авторами модели Sora — так бывает:)

@complete_ai
🙏69👍14👏11👎54❤‍🔥2🔥2💯2🏆1
Anthropic сегодня анонсировал новую линейку мультимодальных моделей Claude 3

https://www.anthropic.com/news/claude-3-family

По дефолту длина контекста 200K токенов, но может быть 1М для "особых случаев"

Всего 3 модели:
1) Haiku — самая быстрая и компактная
2) Sonnet — сбалансированная модель, для энтерпрайза
3) Opus — самая умная, human-like understanding

@complete_ai
🔥19👍3🎉2👏1
А что если SORA - это в первую очередь не синтез видео по тексту, а синтез трёхмерных сцен, которые потом просто превращены в облёт камерой?

Небольшую заметку тут нашёл
https://arxiv.org/abs/2402.17403

Что думаете?
💯25👍115🔥4❤‍🔥1
Stability AI зарелизили модель синтеза 3D на базе своей же модели синтеза видео — Stable Video 3D

- умеет синтезировать orbital 3D по картинке объекта
- может генерировать произвольные пролёты камеры вокруг объектов (camera path conditioning)
- на выходе может создавать меши объектов

Итого сценарий: входная картинка -> видео (синтез новых положений объекта, novel view synthesis) -> 3D mesh (3D оптимизация)

Тех репорт
GitHub

@complete_ai
🔥20👍10🎉4👌2
Forwarded from Институт AIRI
Ведем прямой репортаж с конференции EACL 2024, которая проходит сейчас на Мальте ⤵️

⚫️Кандидат технических наук, руководитель группы FusionBrain Андрей Кузнецов и научный сотрудник Антон Разжигав приехали на конференцию со статьей "The Shape of Learning: Anisotropy and Intrinsic Dimensions
in Transformer-Based Models",
которую подготовили с коллегами из Сколтеха, Сбера, МГУ, ВШЭ и Самарского университета. Краткий обзор можно посмотреть в канале у Антона.

⚫️Вчера прошел интересный пленарный доклад от Hongning Wang из Tsinghua University "Human vs Generative AI in Content Creation Competition: Symbiosis or Conflict" о проблеме «борьбы» человека и генеративного ИИ. Делимся кратким обзором от Андрея Кузнецова: исследователи в команде разработали фреймворк для симуляции различных соревнований в области креативного искусства. Они моделировали поведение человека, который использует нейросети при участии в творческих соревнованиях. Например, таких как конкурс художников "State Fair Fine Arts Competition", на котором в 2023 году победила созданная нейросетью картина. В симуляционных экспериментах показано, как креаторы ведут себя во время разных типов соревнований. Такие эксперименты в целом дают понять, что в недалёком будущем использование генеративного контента может преобладать над ручным творчеством, а желание адаптироваться и учиться применять генеративные модели будет только расти.

Скоро расскажем про исследование на Хабре,
подписывайтесь, чтобы не пропустить 🔖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥21🔥18👍5🎉51👏1
Моё знакомство с South HUB началось в 2022 году, когда коллеги из Сбера предложили выступить на новой конференции для CTO и рассказать о генеративном ИИ. Без особых раздумий я согласился, потому что очень хотелось нести в мир то, чем занимается команда, какие исследования мы проводим и в чём видим прикладное значение этого направления. Именно тогда я считаю, что начал открывать перед Kandinsky двери и знакомить всех с нашей технологией синтез изображений по тексту.

Второй опыт участия в конференции был в 2023 году, где я с коллегой проводил воркшоп по тому, как понять и где найти место для генеративного ИИ в своей сфере работы. Интересный опыт, который позволил понять, что хочет бизнес, в какие направления смотрят коллеги и где генеративные мультимедийные данные могут однозначно быть полезными и усилить креатив в компаниях. На тот момент, кстати говоря, у нас уже было пару успешных коллабораций с Кофеманией, генерацией юбилейной монеты к году дракона, а за плечами было изрядное количество пиар проектов для решения задач визуалзиации в разных отраслях.

Почему же я так тепло отношусь к этой линейке конференций? Это действительно крутое место для знакомства со смежными отраслями в IT, огромный потенциал для нетворкинга, мегакрутые знакомства и в целом автоматическое попадание в топ комьюнити инженерно-технического мира в РФ. С 2022 года благодаря знакомствам на South HUB я тесно сотрудничаю с ребятами из Skillbox, Yandex, Geekbrains и др. компаний, мы устраиваем митапы, записываем подкасты, делимся идеями в части построения и развития RnD процессов - за всё это я благодарен организаторам этоу крутой тусовки.

А ещё там бомбические локации для проведения конфы на Красной Поляне, мероприятия для развития духа и тела (спорт турнир по стритболу - это пушка). В общем, что хочу сказать - желаю всем испытывать такие тёплые воспоминания со всех мероприятий, где принимаете участие, а если считаете, что в вашем личном рейтинге пьедестал уже занят каким-то ивентов, съездите на South HUB и первое место ему обеспечено)
🎉21🔥16❤‍🔥9👍2
🙏130
🕯️Друзья, вчера случилась большая трагедия!

Нападение террористов на Крокус привело к большому числу жертв и пострадавших.

Сбер не остался в стороне и вместе с Российским красным крестом запустил благотворительный фонд. Прошу не оставаться в стороне, помощь каждого из вас безмерно важна🙏

➡️По ссылке сразу перейдёте в Сбербанк Онлайн и сможете внести пожертвование.

Берегите себя🙏
🙏60👍19❤‍🔥13👎11🔥3👌1
Forwarded from Igrek.log
Сегодня вышла моя первая статья на Хабр про использование процессов в python!

⚙️Как работает multiprocessing в Python под капотом🔧

Многим разработчикам на python, в том числе DS/ML/DE специалистам, нужно ускорять обработку данных или распараллеливать CPU-bound вычисления. Потоки для этой задачи не подходят, так как в питоне есть GIL, поэтому часто используют процессы. Но чтобы мастерски овладеть каким-то инструментом, необходимо понимать как он устроен. Поэтому я подробно разобрал детали реализации пакета multiprocessing.
В статье вы узнаете:
- Как создаются процессы в ОС
- Как устроен внутри пакет multiprocessing
- Как работает пул процессов

P.S. Если получится дать обратную связь или поставить upvote на хабре - буду рад))
P.P.S. Перезалил пост, чтобы были доступны комментарии
❤‍🔥29👍13🔥11
😁38❤‍🔥7😱5