Complete AI
7.81K subscribers
495 photos
35 videos
10 files
270 links
Меня зовут Андрей Кузнецов

Директор FusionBrain Lab в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML
Download Telegram
🎉🎄2023 год подходит к своему завершению, и я считаю его супер успешным как для команды в целом, так и для себя лично. За год было больше 50 различных мероприятий, где я принимал участие в роли спикера, было много релизов, 5 из которых, на мой взгляд, были очень громкими:
Kandinsky 2.1, Kandinsky 2.2, Kandinsky 3.0, Kandinsky Video, OmniFusion.

Мы опубликовали больше 10 научных статей, среди которых есть и статья в Q1, и публикация в Core A* конференции. Сформировали новые направления исследований и уже получили в рамках них определённые значимые результаты, провели несколько соревнований, организовали стабильное партнёрство с зарубежными и российскими командами.

Все эти и многие другие достижения — результат упорного труда всей команды, каждого её участника. Хочу выразить благодарность каждому персонально и пожелать новых прорывных результатов в 2024 году, задел для этого уже есть достаточно большой.

Результат этого года уже можно назвать вызовом для следующего, потому что планку снижать точно нельзя, а для роста ещё есть огромный потенциал.

Всем ещё раз спасибо и всех благ в 2024м году!

P.S. Спасибо и тебе, 2023й — ты был крут🏆🔥

@complete_ai
❤‍🔥39🔥26🏆7👍62👏21💯1
🎉🎉🎉С Новым годом, дорогие подписчики! Спасибо, тем, кто уже был со мной в 2023 и тем, кто присоединился)

Буду дальше радовать вас новым контентом, будет ещё интереснее!

Здоровья вам и успехов во всём! Пусть все желания сбудутся!

Стартуем!🐉
❤‍🔥29🎉13👍6🔥2👏1🏆1
🐉С Новым 2024м годом!!!
By Kandinsky

📌Давайте в комментариях к сообщению добавлять самые лучшие ваши генерации на новогоднюю тематику. Очень люблю ваше творчество!
🔥27❤‍🔥94🎉3🏆1
☕️Первая коллаборация в 2024 году

Императорский Фарфоровый Завод создал коллекцию кружек с рисунками, сгенерированными Kandinsky.

Теперь можно пить чай и держать в руках кусочек AI

Новость

P.S. Скоро вернусь с большими апдейтами и новыми обзорами😉
🔥38👍12🏆5❤‍🔥3
Добавлю немного научного вдохновения вам на выходные) Делюсь отчетом нашего Института AIRI за 2023 год.

За прошедший год в нашем портфолио сформировался целый ряд крупных научных результатов по фундаментальным и прикладным аспектам AI.

От себя еще хочу добавить, что в этом году мы продолжаем активно развивать партнерства и стремиться к лидерству по числу публикаций на конференциях A/A*.
👍30🔥197🏆2
Вчера мы в AIRI запустили флешмоб, в рамках которого учёные рассказывают про свои первые публикации. Вот и я решил окунуться в прошлое и вспомнить, с чего начал я свой путь в науке и компьютерном зрении.

Первая моя статья вышла в 2008 году в Вестнике Самарского государственного аэрокосмического университета и была посвящена анализу изображений радужки с использованием преобразования Радона. Я был на 3м курсе и незадолго до написания статьи был увлечён рассказом своего первого научного руководителя Александра Викторовича Куприянова (ныне д.т.н., директор Института информатики и кибернетики Самарского университета) о проводимых исследованиях в области анализа цифровых изображений. Я стал понемногу погружаться в мир цифровой обработки сигналов, узнал о возможных применения таких разработок в разных доменах, в том числе медицинском, и достаточно быстро втянулся в исследования. Хотелось найти в области анализа радужных оболочек что-то очень интересное, ведь их структура при ближайшем рассмотрении выглядит завораживающе.

Читая сейчас свою первую работу, я, конечно, гляжу на неё совсем другим взглядом, но в памяти всплывают моменты, как я строил графики и генерировал к ней иллюстрации. Довольно приятные и ностальгически-душевные воспоминания)

В статье я исследовал различные механизмы извлечения признаков в полярной развёртке радужек с помощью преобразования Радона и искал способы эффективного признакового представления в различных цветовых пространствах.

Дальше мои исследования в этой области далеко не пошли, медицинский домен в то время меня вероятно не сильно интересовал. Следующим этапом в карьере в компьютерном зрении стали данные дистанционного зондирования Земли, и вот задачи их анализа захватили меня на 10+ лет🗺️ — но это уже совсем другая история)

P.S. Ещё раз хотел бы поблагодарить своего первого научного наставника Куприянова А.В. за этот стартовый "научный капитал"🤝

#AIRI_вдохновляет
🔥58👌9👍7💯4❤‍🔥3👎1🏆1
Media is too big
VIEW IN TELEGRAM
OpenAI снова всех удивляет

Выпустили модель text2video под названием Sora. Качество потрясающее - фотореалистичность в полной мере. В основе комбо из диффузии и трансформера.

Ждём статью, но интуитивно есть представление, как добились такого.

https://openai.com/sora

@complete_ai
🔥50❤‍🔥14💯6
Mistral-next на подходе
Link

Затаились в ожидании
🔥16👍7💯3
Вот и Review статья про Sora пожаловала "от OpenAI"
(А точнее от Lehigh University и Microsoft Research)

Сделать разбор статьи о том, что внутри?

PDF
В рамках уточнения: авторы статьи не являются авторами модели Sora — так бывает:)

@complete_ai
🙏69👍14👏11👎54❤‍🔥2🔥2💯2🏆1
Anthropic сегодня анонсировал новую линейку мультимодальных моделей Claude 3

https://www.anthropic.com/news/claude-3-family

По дефолту длина контекста 200K токенов, но может быть 1М для "особых случаев"

Всего 3 модели:
1) Haiku — самая быстрая и компактная
2) Sonnet — сбалансированная модель, для энтерпрайза
3) Opus — самая умная, human-like understanding

@complete_ai
🔥19👍3🎉2👏1
А что если SORA - это в первую очередь не синтез видео по тексту, а синтез трёхмерных сцен, которые потом просто превращены в облёт камерой?

Небольшую заметку тут нашёл
https://arxiv.org/abs/2402.17403

Что думаете?
💯25👍115🔥4❤‍🔥1
Stability AI зарелизили модель синтеза 3D на базе своей же модели синтеза видео — Stable Video 3D

- умеет синтезировать orbital 3D по картинке объекта
- может генерировать произвольные пролёты камеры вокруг объектов (camera path conditioning)
- на выходе может создавать меши объектов

Итого сценарий: входная картинка -> видео (синтез новых положений объекта, novel view synthesis) -> 3D mesh (3D оптимизация)

Тех репорт
GitHub

@complete_ai
🔥20👍10🎉4👌2
Forwarded from Институт AIRI
Ведем прямой репортаж с конференции EACL 2024, которая проходит сейчас на Мальте ⤵️

⚫️Кандидат технических наук, руководитель группы FusionBrain Андрей Кузнецов и научный сотрудник Антон Разжигав приехали на конференцию со статьей "The Shape of Learning: Anisotropy and Intrinsic Dimensions
in Transformer-Based Models",
которую подготовили с коллегами из Сколтеха, Сбера, МГУ, ВШЭ и Самарского университета. Краткий обзор можно посмотреть в канале у Антона.

⚫️Вчера прошел интересный пленарный доклад от Hongning Wang из Tsinghua University "Human vs Generative AI in Content Creation Competition: Symbiosis or Conflict" о проблеме «борьбы» человека и генеративного ИИ. Делимся кратким обзором от Андрея Кузнецова: исследователи в команде разработали фреймворк для симуляции различных соревнований в области креативного искусства. Они моделировали поведение человека, который использует нейросети при участии в творческих соревнованиях. Например, таких как конкурс художников "State Fair Fine Arts Competition", на котором в 2023 году победила созданная нейросетью картина. В симуляционных экспериментах показано, как креаторы ведут себя во время разных типов соревнований. Такие эксперименты в целом дают понять, что в недалёком будущем использование генеративного контента может преобладать над ручным творчеством, а желание адаптироваться и учиться применять генеративные модели будет только расти.

Скоро расскажем про исследование на Хабре,
подписывайтесь, чтобы не пропустить 🔖
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥21🔥18👍5🎉51👏1
Моё знакомство с South HUB началось в 2022 году, когда коллеги из Сбера предложили выступить на новой конференции для CTO и рассказать о генеративном ИИ. Без особых раздумий я согласился, потому что очень хотелось нести в мир то, чем занимается команда, какие исследования мы проводим и в чём видим прикладное значение этого направления. Именно тогда я считаю, что начал открывать перед Kandinsky двери и знакомить всех с нашей технологией синтез изображений по тексту.

Второй опыт участия в конференции был в 2023 году, где я с коллегой проводил воркшоп по тому, как понять и где найти место для генеративного ИИ в своей сфере работы. Интересный опыт, который позволил понять, что хочет бизнес, в какие направления смотрят коллеги и где генеративные мультимедийные данные могут однозначно быть полезными и усилить креатив в компаниях. На тот момент, кстати говоря, у нас уже было пару успешных коллабораций с Кофеманией, генерацией юбилейной монеты к году дракона, а за плечами было изрядное количество пиар проектов для решения задач визуалзиации в разных отраслях.

Почему же я так тепло отношусь к этой линейке конференций? Это действительно крутое место для знакомства со смежными отраслями в IT, огромный потенциал для нетворкинга, мегакрутые знакомства и в целом автоматическое попадание в топ комьюнити инженерно-технического мира в РФ. С 2022 года благодаря знакомствам на South HUB я тесно сотрудничаю с ребятами из Skillbox, Yandex, Geekbrains и др. компаний, мы устраиваем митапы, записываем подкасты, делимся идеями в части построения и развития RnD процессов - за всё это я благодарен организаторам этоу крутой тусовки.

А ещё там бомбические локации для проведения конфы на Красной Поляне, мероприятия для развития духа и тела (спорт турнир по стритболу - это пушка). В общем, что хочу сказать - желаю всем испытывать такие тёплые воспоминания со всех мероприятий, где принимаете участие, а если считаете, что в вашем личном рейтинге пьедестал уже занят каким-то ивентов, съездите на South HUB и первое место ему обеспечено)
🎉21🔥16❤‍🔥9👍2