Следующие доклады ждут вас в 12:20
🔹Зал «Сфера». MERA.Text.v.1.2.0. Что под капотом нового релиза? Алена Феногенова (SberDevices)
Разработка метрик качества для продукта, где используется машинное обучение, всегда была интересной и непростой задачей. Разработка бенчмарка для LLM — задача особенно сложная из-за сложности измеряемого объекта. Алёна поделится тем, как эту задачу решили в MERA.
🔹Зал «Полусфера». Система управления процессом окомкования железорудных окатышей. Андрей Голов (Северсталь Диджитал)
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики...
Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад от сталелитейной компании окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😎
🔹Зал «Аудитория 1». AutoFE-сапёр: укрощаем взрыв размерности в автоматической генерации признаков. Валерия Дымбицкая (Upgini)
Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних. Приходите узнать, как при помощи ML и эвристик можно сократить количество потенциальных фич еще ДО их расчета.
🔹 Зал «Пресс-центр». Продолжение мастер-класса «Получение высококачественных данных для обучения ИИ-моделей». Олег Секачев (Яндекс)
Если вам предстоит собирать много данных с помощью людей, а раньше вы такую разметку не организовывали, то воркшоп строго рекомендован к посещению. Там вы узнаете, как разметчики косячат, как они жульничают и что со всем этим делать вам как заказчику разметки.
🔹Зал «Сфера». MERA.Text.v.1.2.0. Что под капотом нового релиза? Алена Феногенова (SberDevices)
Разработка метрик качества для продукта, где используется машинное обучение, всегда была интересной и непростой задачей. Разработка бенчмарка для LLM — задача особенно сложная из-за сложности измеряемого объекта. Алёна поделится тем, как эту задачу решили в MERA.
🔹Зал «Полусфера». Система управления процессом окомкования железорудных окатышей. Андрей Голов (Северсталь Диджитал)
Чугун, бентонит, шихта, окатыш... Технологи, операторы, датчики...
Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Доклад от сталелитейной компании окунает в нюансы реальных физических процессов. И знакомит с парой новых слов 😎
🔹Зал «Аудитория 1». AutoFE-сапёр: укрощаем взрыв размерности в автоматической генерации признаков. Валерия Дымбицкая (Upgini)
Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних. Приходите узнать, как при помощи ML и эвристик можно сократить количество потенциальных фич еще ДО их расчета.
🔹 Зал «Пресс-центр». Продолжение мастер-класса «Получение высококачественных данных для обучения ИИ-моделей». Олег Секачев (Яндекс)
Если вам предстоит собирать много данных с помощью людей, а раньше вы такую разметку не организовывали, то воркшоп строго рекомендован к посещению. Там вы узнаете, как разметчики косячат, как они жульничают и что со всем этим делать вам как заказчику разметки.
Дорогие участники конференции, каждый из вас может заработать уникальный приз — кастомную матрешку. Этот приз будет символизировать ваш личный вклад в развитие AiConf 🔥
Как участник влияет на конференцию? Он дополняет выступление спикера своими вопросами. Задавайте вопросы после докладов, и за самый интересный вопрос мы и подарим одну из наших матрёшек. Выбирая самый интересный, учтем вопросы и от онлайн-участников.
Для каждой конференции мы будем готовить новый дизайн матрешки. Так что вы сможете собрать целую коллекцию!
Будьте активны, задавайте вопросы спикерам и получайте сувениры для своей коллекции 😎
Как участник влияет на конференцию? Он дополняет выступление спикера своими вопросами. Задавайте вопросы после докладов, и за самый интересный вопрос мы и подарим одну из наших матрёшек. Выбирая самый интересный, учтем вопросы и от онлайн-участников.
Для каждой конференции мы будем готовить новый дизайн матрешки. Так что вы сможете собрать целую коллекцию!
Будьте активны, задавайте вопросы спикерам и получайте сувениры для своей коллекции 😎
На случай, если вам нужно будет поработать в спокойной обстановке, на площадке есть коворкинг 🙌
💥 Участвуйте в нашем Data Science-квизе, проверьте свои знания и навыки!
Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎
✅ Регистрируйтесь, пожалуйста, заранее около демо-сцены и зоны обедов у хэлптим.
Участвуют 10 команд по 6 человек.
Начало сегодня в 18:00
Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎
✅ Регистрируйтесь, пожалуйста, заранее около демо-сцены и зоны обедов у хэлптим.
Участвуют 10 команд по 6 человек.
Начало сегодня в 18:00
👍2
Программа докладов, которые стартуют в 13:30
🔹Зал «Сфера». Обзор уязвимостей и техник защиты для LLM. Евгений Кокуйкин (Raft)
LLM активно захватывают нашу жизнь, но все еще подвержены разным атакам. Евгений расскажет о способах атак на LLM, а также про техники защиты от этих атак. После доклада слушатели смогут повысить навыки защиты ИИ-приложений перед выводом в прод.
🔹Зал «Полусфера». Эволюция отбора кандидатов в системе товарных рекомендаций Ozon. Александр Краснов (Ozon)
Оzon — один из крупнейших развивающихся маркетплейсов. Как устроены рекомендации там? Докладчики расскажут подробно про свой подход segment2item, который обобщает подходы к генерации кандидатов. Это не user2item или item2item, а именно segment2item. Это работает, будут примеры и результаты А/В.
🔹Зал «Аудитория 1». Как мы делаем прагматичный поиск и Q&A без LLM. Вадим Захаров (билайн)
Без LLM, но с LLM. Приходите узнать, как билайн улучшил self-service-процесс решения IТ-проблем с помощью Extractive QA: теперь в ответ на поисковый запрос сотрудники получают не только список релевантных шаблонов IТ-обращений, но и конкретные решения из базы знаний.
🔹 Зал «Пресс-центр». Продолжение мастер-класса «Получение высококачественных данных для обучения ИИ-моделей». Олег Секачев (Яндекс)
Если вам предстоит собирать много данных с помощью людей, а раньше вы такую разметку не организовывали, то воркшоп строго рекомендован к посещению. Там вы узнаете, как разметчики косячат, как они жульничают и что со всем этим делать вам как заказчику разметки.
🔹Зал «Сфера». Обзор уязвимостей и техник защиты для LLM. Евгений Кокуйкин (Raft)
LLM активно захватывают нашу жизнь, но все еще подвержены разным атакам. Евгений расскажет о способах атак на LLM, а также про техники защиты от этих атак. После доклада слушатели смогут повысить навыки защиты ИИ-приложений перед выводом в прод.
🔹Зал «Полусфера». Эволюция отбора кандидатов в системе товарных рекомендаций Ozon. Александр Краснов (Ozon)
Оzon — один из крупнейших развивающихся маркетплейсов. Как устроены рекомендации там? Докладчики расскажут подробно про свой подход segment2item, который обобщает подходы к генерации кандидатов. Это не user2item или item2item, а именно segment2item. Это работает, будут примеры и результаты А/В.
🔹Зал «Аудитория 1». Как мы делаем прагматичный поиск и Q&A без LLM. Вадим Захаров (билайн)
Без LLM, но с LLM. Приходите узнать, как билайн улучшил self-service-процесс решения IТ-проблем с помощью Extractive QA: теперь в ответ на поисковый запрос сотрудники получают не только список релевантных шаблонов IТ-обращений, но и конкретные решения из базы знаний.
🔹 Зал «Пресс-центр». Продолжение мастер-класса «Получение высококачественных данных для обучения ИИ-моделей». Олег Секачев (Яндекс)
Если вам предстоит собирать много данных с помощью людей, а раньше вы такую разметку не организовывали, то воркшоп строго рекомендован к посещению. Там вы узнаете, как разметчики косячат, как они жульничают и что со всем этим делать вам как заказчику разметки.
Онтико AI Музыка — это уникальная активность, где посоревнуются искусственный и естественный интеллект.
👤 Разве робот может написать симфонию?!
🤖 А ты можешь?
На выбор участников можно будет выбрать несколько активностей:
- генерация музыки с помощью ИИ, лучшие треки будут играть на афтепати
- отличить сгенерированную музыку от созданной человеком
- перевод аудио в ноты с помощью ИИ (следуя инструкции, вы можете трансформировать свой аудио-файл в ноты)
На стенде Онтико AI Музыка участников будет ждать Захар @varfolomeefff — разработчик ИИ в музыке. На работе делает модель для генерации музыки, а в своем стартапе делает модель для извлечения нот из аудио. Также Захар выступает на конференциях и в вузах.
Обязательно приходите, будет интересно!
👤 Разве робот может написать симфонию?!
🤖 А ты можешь?
На выбор участников можно будет выбрать несколько активностей:
- генерация музыки с помощью ИИ, лучшие треки будут играть на афтепати
- отличить сгенерированную музыку от созданной человеком
- перевод аудио в ноты с помощью ИИ (следуя инструкции, вы можете трансформировать свой аудио-файл в ноты)
На стенде Онтико AI Музыка участников будет ждать Захар @varfolomeefff — разработчик ИИ в музыке. На работе делает модель для генерации музыки, а в своем стартапе делает модель для извлечения нот из аудио. Также Захар выступает на конференциях и в вузах.
Обязательно приходите, будет интересно!
Друзья, в 14:40 приходите на следующие доклады:
🔹Зал «Сфера». Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)
Доклад охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.
🔹Зал «Полусфера». Вместо зеленого экрана: гармонизация портрета с помощью нейросети. Елизавета Петрова (SberDevices)
Оказывается, поместить себя на произвольный фон не так-то просто. Что-то всё время выдаёт Штирлица! То ли звёздочка на фуражке, то ли парашют... Приходите на доклад, чтобы узнать, какой именно ансамбль нейросетей справляется с задачей хорошо.
🔹Зал «Аудитория 1». Фреймворк прикладных инструментов для анализа данных на основе каузальных моделей и байесовских сетей. Ирина Деева (Университет ИТМО)
Causal ML — сложная тема, под которую необходимы специальные библиотеки для моделирования и анализа данных. Ребята из ИТМО расскажут про свою новую библиотеку, где они собрали все необходимые инструменты в одном месте, и как эта библиотека работает по сравнению с существующими решениями.
🔹 Зал «Пресс-центр». Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)
Герман рассмотрит новую концепцию приложения LLM к разметке данных, приведет подходы с указанием их плюсов и минусов, а также степени вовлеченности LLM. Опишет бизнес-процессы для новой концепции, а также затронет аспекты использования ML-моделей для специфических задач разметки (OCR, CV, ASR).
🔹Зал «Сфера». Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)
Доклад охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.
🔹Зал «Полусфера». Вместо зеленого экрана: гармонизация портрета с помощью нейросети. Елизавета Петрова (SberDevices)
Оказывается, поместить себя на произвольный фон не так-то просто. Что-то всё время выдаёт Штирлица! То ли звёздочка на фуражке, то ли парашют... Приходите на доклад, чтобы узнать, какой именно ансамбль нейросетей справляется с задачей хорошо.
🔹Зал «Аудитория 1». Фреймворк прикладных инструментов для анализа данных на основе каузальных моделей и байесовских сетей. Ирина Деева (Университет ИТМО)
Causal ML — сложная тема, под которую необходимы специальные библиотеки для моделирования и анализа данных. Ребята из ИТМО расскажут про свою новую библиотеку, где они собрали все необходимые инструменты в одном месте, и как эта библиотека работает по сравнению с существующими решениями.
🔹 Зал «Пресс-центр». Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)
Герман рассмотрит новую концепцию приложения LLM к разметке данных, приведет подходы с указанием их плюсов и минусов, а также степени вовлеченности LLM. Опишет бизнес-процессы для новой концепции, а также затронет аспекты использования ML-моделей для специфических задач разметки (OCR, CV, ASR).
Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних.
Валерия Дымбицкая из Upgini рассказала, как при помощи ML и эвристик можно сократить количество потенциальных фич еще ДО их расчета.
#AiConf2024
Валерия Дымбицкая из Upgini рассказала, как при помощи ML и эвристик можно сократить количество потенциальных фич еще ДО их расчета.
#AiConf2024
В 15:50 встречаемся на следующих докладах:
🔹Зал «Сфера». Как ML помогает производить лекарства? Владислав Маслов и Василий Вологдин (BIOCAD)
Устали от докладов про RecSys и NLP? Приходите послушать, как машинное обучение трансформирует сферу фармацевтики и ускоряет разработку лекарств! Доклад особенно хорош обзором разных направлений: это и лабораторные исследования, и производство, клинические и доклинические исследования, бэк-офис…
🔹Зал «Полусфера». LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)
Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.
🔹Зал «Аудитория 1». Увеличиваем число обнаружений в задачах Object Detection и Instance Segmentation. Дмитрий Колесников (Цифровые технологии и платформы)
Ваши модели распознают только несколько объектов, а дальше безбожно разваливаются? Приходите послушать доклад на тему обнаружения большого числа объектов, вы узнаете про трюки и вызовы, а также сможете попробовать фреймворк сами, ведь он доступен в open source!
🔹 Зал «Пресс-центр». Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)
Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.
🔹Зал «Сфера». Как ML помогает производить лекарства? Владислав Маслов и Василий Вологдин (BIOCAD)
Устали от докладов про RecSys и NLP? Приходите послушать, как машинное обучение трансформирует сферу фармацевтики и ускоряет разработку лекарств! Доклад особенно хорош обзором разных направлений: это и лабораторные исследования, и производство, клинические и доклинические исследования, бэк-офис…
🔹Зал «Полусфера». LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)
Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.
🔹Зал «Аудитория 1». Увеличиваем число обнаружений в задачах Object Detection и Instance Segmentation. Дмитрий Колесников (Цифровые технологии и платформы)
Ваши модели распознают только несколько объектов, а дальше безбожно разваливаются? Приходите послушать доклад на тему обнаружения большого числа объектов, вы узнаете про трюки и вызовы, а также сможете попробовать фреймворк сами, ведь он доступен в open source!
🔹 Зал «Пресс-центр». Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)
Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.
💥 Участвуйте в нашем Data Science-квизе, проверьте свои знания и навыки!
Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎
✅ Регистрируйтесь, пожалуйста, заранее около демо-сцены и зоны обедов у хэлптим.
Участвуют 10 команд по 6 человек.
Начало сегодня в 18:00
Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя 😎
✅ Регистрируйтесь, пожалуйста, заранее около демо-сцены и зоны обедов у хэлптим.
Участвуют 10 команд по 6 человек.
Начало сегодня в 18:00