AiConf Channel
809 subscribers
226 photos
22 videos
222 links
Официальный канал профессиональной конференции по Data Science — AiConf

Конференция пройдёт 26 сентября 2025 г. в Москве.

Чат: https://t.iss.one/UseDataConfTalks
Download Telegram
Друзья, в 14:40 приходите на следующие доклады:

🔹Зал «Сфера». Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)

Доклад охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.

🔹Зал «Полусфера». Вместо зеленого экрана: гармонизация портрета с помощью нейросети. Елизавета Петрова (SberDevices)

Оказывается, поместить себя на произвольный фон не так-то просто. Что-то всё время выдаёт Штирлица! То ли звёздочка на фуражке, то ли парашют... Приходите на доклад, чтобы узнать, какой именно ансамбль нейросетей справляется с задачей хорошо.

🔹Зал «Аудитория 1». Фреймворк прикладных инструментов для анализа данных на основе каузальных моделей и байесовских сетей. Ирина Деева (Университет ИТМО)

Causal ML — сложная тема, под которую необходимы специальные библиотеки для моделирования и анализа данных. Ребята из ИТМО расскажут про свою новую библиотеку, где они собрали все необходимые инструменты в одном месте, и как эта библиотека работает по сравнению с существующими решениями.

🔹 Зал «Пресс-центр». Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)

Герман рассмотрит новую концепцию приложения LLM к разметке данных, приведет подходы с указанием их плюсов и минусов, а также степени вовлеченности LLM. Опишет бизнес-процессы для новой концепции, а также затронет аспекты использования ML-моделей для специфических задач разметки (OCR, CV, ASR).
Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних.

Валерия Дымбицкая из Upgini рассказала, как при помощи ML и эвристик можно сократить количество потенциальных фич еще ДО их расчета.

#AiConf2024
В 15:50 встречаемся на следующих докладах:

🔹Зал «Сфера». Как ML помогает производить лекарства? Владислав Маслов и Василий Вологдин (BIOCAD)

Устали от докладов про RecSys и NLP? Приходите послушать, как машинное обучение трансформирует сферу фармацевтики и ускоряет разработку лекарств! Доклад особенно хорош обзором разных направлений: это и лабораторные исследования, и производство, клинические и доклинические исследования, бэк-офис…

🔹Зал «Полусфера». LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)

Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.

🔹Зал «Аудитория 1». Увеличиваем число обнаружений в задачах Object Detection и Instance Segmentation. Дмитрий Колесников (Цифровые технологии и платформы)

Ваши модели распознают только несколько объектов, а дальше безбожно разваливаются? Приходите послушать доклад на тему обнаружения большого числа объектов, вы узнаете про трюки и вызовы, а также сможете попробовать фреймворк сами, ведь он доступен в open source!

🔹 Зал «Пресс-центр». Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)

Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.
💥 Участвуйте в нашем Data Science-квизе, проверьте свои знания и навыки!

Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎

Регистрируйтесь, пожалуйста, заранее около демо-сцены и зоны обедов у хэлптим.

Участвуют 10 команд по 6 человек.

Начало сегодня в 18:00
This media is not supported in your browser
VIEW IN TELEGRAM
😁1
This media is not supported in your browser
VIEW IN TELEGRAM
😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Оказывается, поместить себя на произвольный фон не так-то просто. Что-то всё время выдаёт Штирлица! То ли звёздочка на фуражке, то ли парашют...

Елизавета Петрова из SberDevices в своём докладе рассказала о том, какой именно ансамбль нейросетей справляется с задачей хорошо.
Друзья, в 17:00 приходите на заключительный поток программы первого дня AiConf:

🔹Зал «Сфера». Панельная дискуссия о будущем искусственного интеллекта. Ван Хачатрян (Ozon), Роман Поборчий (Независимый эксперт), Александр Абрамов (SberDevices), Никита Зелинский (МТС), Александр Самойлов (Wildberries)

Это возможность вместе с лидерами индустрии придумать, как продолжить в будущее текущие тренды развития нашей отрасли. Эта возможность выдаётся слишком редко, чтобы её проигнорировать!

🔹Зал «Полусфера». Генеративные модели для работы с кодом. Как мы из 0 сделали 1. Евгений Колесников (Yandex Infrastructure)

Доклад посвящен подходам к обучению больших языковых моделей для работы с кодом, а также сбору данных, анализу результатов и оценке качества генерируемых подсказок для inline code completion.

🔹Зал «Аудитория 1». Мягкая модерация изображений: скрыть нельзя блокировать. Юрий Батраков (Авито)

Модерация UGC-контента — огромная головная боль для бизнеса и огромный простор для ML-решений. Постоянное желание пользователей обойти автоматические проверки и высокая нагрузка рождают элегантные инженерные системы, о которых вы узнаете из доклада Авито.

🔹 Зал «Пресс-центр». Жестовый язык: особенности сбора данных, опыт и результаты. Петр Суровцев (SberDevices)

Рассматриваются особенности сбора open source-датасета SLOVO, представляющего собой маппинг Русского Жестового Языка на текст. Спикер расскажет о компонентах РЖЯ в сравнении с другими жестовыми языками, нетривиальных особенностях сбора такого датасета, допущенных ошибках, полном пайплайне решения.
This media is not supported in your browser
VIEW IN TELEGRAM
1
This media is not supported in your browser
VIEW IN TELEGRAM
Прямо сейчас в рамках панельной дискуссии вместе с лидерами индустрии обсуждаем фундаментальные проблемы, связанные с нашей бурно развивающейся отраслью и её местом в мире. 

Придумываем, как продолжить в будущее текущие тренды развития нашей отрасли 😎
Завтра приглашаем вас на мастер-класс по работе с геоданными «Кто хочет стать геосайентистом» от Артема Каледина и Дениса Афанасьева (билайн)

Это прекрасная возможность не только получить полезные знания, но и отработать их. В программе: практическая работа с реальными данными, кейсами и топовыми библиотеками. Освойте геоаналитику для телекома, финтеха, доставки и маркетинга!

Что вас ждёт на мастер-классе:

■ работа с распространенными форматами данных;
□ способы визуализации данных на карте;
■ пространственные выборки;
□ построение регулярных сеток;
■ расчет изохрон;
□ обход графов;
■ создание геопризнаков.

Все пререквизиты мастер-класса доступны по ссылке

Переходите заранее и устанавливайте библиотеки!


🕙 Место проведения и время:

27 сентября, 11:10, Зал «Пресс-центр»

Стоит ли прийти, если не работали с геоданными/у нас нет на работе геоданных?

Определенно стоит — в рамках мастер-класса мы расскажем про основные геоданных, а также порешаем практико-ориентированные кейсы (в том числе на открытых данных) и покажем, что гео — круто!
🔥3👍1
💥 Уже ждем вас для участия в нашем Data Science-квизе!

Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎

Регистрируйтесь около демо-сцены и зоны обедов у хэлптим.

Участвуют 10 команд по 6 человек.

Начало в 18:15
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
👍1
Доброе утро! Готовы ко второму дню AiConf? Будет не менее интересно 🙌

А пока мы предлагаем выпить чашечку ароматного кофе и полистать расписание
👍1🔥1
Друзья, в 10:00 начинаются первые доклады второго дня AiConf:


🔹Зал «Сфера». Мультимодальные рекомендации в Wildberries. Степан Евстифеев (Wildberries)

Wildberries — один из крупнейших маркетплейсов в России. Обучить «академический» SASRec на реальных данных уже не выйдет. Что делать тогда? Доклад про внутренний трансформер для рекомендаций и почему он лучше, чем SASRec. В нем нет item-id, нетривиальный поход за кандидатами. Детально в докладе.

🔹Зал «Полусфера». Нейросети в рекомендациях: от идеи до продакшна. Любовь Куприянова (Ozon)

Любовь расскажет о том, как интегрировать нейросетевые подходы в рекомендательные пайплайны, с какими проблемами можно столкнуться и как их избежать. Данный доклад, основанный на реальном опыте — это гайд для тех, кто хочет использовать нейронные сети для задач рекомендаций.

🔹Зал «Аудитория 1». Что такое ML-платформа на базе K8s, и как в ней решены разнородные требования к квотированию и шедулингу. Тимофей Разумов (Т-Банк)

ML-платформа все чаще становится обязательной частью инфраструктуры для крупных big-tech-компаний. В докладе коллеги расскажут, какие фреймворки помогают оркестрации и квотированию железа под обучение и инференс и почему из коробки оно не всегда оптимально.

🔹 Зал «Пресс-центр». Физически обоснованное машинное обучение — что можно и что нужно. Александр Хватов (Университет ИТМО)

Промтинжиниринг, LLM, RAG, BERT, агентные системы, GPT — НЕТ!
Дифуры, операторы Фурье, PINN, вариационное исчисление, рой роботов, моделирование поведения плазмы — ДА!
Возможно, самый «альтернативный» доклад на AiConf!
Вы узнаете о физически обоснованном МО и о том, как оно облегчает жизнь физиков.
👍1
🙌 Активности сегодня продолжаются:


🖌️ Онтико AI Искусство. Внесите свой вклад в создание коллективного масштабного бесконечного полотна с помощью нейросети Kandinsky на интерактивном стенде.

🎶 Онтико AI Музыка. Посоревнуйтесь с искусственным интеллектом в таких активностях, как: генерация музыки с помощью ИИ; отличите сгенерированную музыку от созданной человеком; переводите аудио в ноты с помощью ИИ (следуя инструкции, вы можете трансформировать свой аудио-файл в ноты).

Random ML Coffee. Крутой шанс завести полезные знакомства — пишите участникам конференции и организовывайте совместную встречу. Не стесняйтесь, стучитесь в личку в нашем боте

🏓 Пинг-понг. Для любителей активного отдыха — здесь у вас будет возможность «разгрузить» мозг после технических докладов и пообщаться с другими участниками.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥2👍1