AiConf Channel
809 subscribers
233 photos
22 videos
224 links
Официальный канал профессиональной конференции по Data Science — AiConf

Конференция пройдёт 26 сентября 2025 г. в Москве.

Чат: https://t.iss.one/UseDataConfTalks
Download Telegram
Оптимизация использования железа — важная задача для data-science инфраструктуры, которая позволяет:

- снизить расходы на оборудование и его обслуживание;
- увеличить производительность;
- снизить потребление энергии;
- увеличить скорость разработки;
- улучшить масштабируемость;
- укрепить устойчивость к сбоям.

В программе AiConf вас ждут два классных доклада с реализованными задачами ⤵️

1) Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)

Доклад Виталия охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.

2) Что такое ML-платформа на базе K8s? и как в ней решены разнородные требования к квотированию и шедулингу. Тимофей Разумов (Т-Банк)

ML-платформа все чаще становится обязательной частью инфраструктуры для крупных big-tech-компаний. Тимофей расскажет, какие фреймворки помогают оркестрации и квотированию железа под обучение и инференс и почему из коробки оно не всегда оптимально.


До встречи 26 и 27 сентября в Москве на AiConf 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Привет, друзья! Знакомим вас со следующей подборкой докладов AiConf, в которых эксперты поделятся актуальными темами в области Data Science и AutoML.

Узнайте о проблемах feature engineering и решениях Upgini, создании AutoML-сервисов, важности качественной разметки данных для мультимодальных моделей и о том, как LLM трансформируют поисковые алгоритмы.

1) AutoFE-сапёр: укрощаем взрыв размерности в автоматической генерации признаков. Валерия Дымбицкая (Upgini)

Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних. Приходите узнать, как при помощи ML и эвристик можно сократить количество потенциальных фич еще до их расчета.

2) Как AutoML- и AutoDL-сервисы улучшают реальную разработку. Евгений Смирнов (Альфа-Банк)

AutoML, как мёд у Винни-Пуха, теоретически вроде есть, а на практике обычно нет. Евгений расскажет, как удалось добиться практической применимости AutoML-инструментов в Альфа-Банке.

3) Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения. Дмитрий Антипов (Сбер / абт)

Дмитрий проведет слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.

4) Где и как использовать LLM в задачах поиска. Валерия Гурьянова (SberDevices)

Казалось бы, что может быть более проработано и изучено, чем задача поиска? Но вот появились LLM, и пришло время освежать свои знания в этой области. Доклад от Валерии покажет, как большие модели улучшают классические области поиска — разметку, ранжирование, индексы и семантический поиск.

До скорой встречи на AiConf — прикладной конференции по Data Science 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥3
Даже у самых полезных вещей есть свои тёмные стороны. Большие языковые модели — не исключение.

Последнее время про нейросети пишут постоянно, но помимо полезных свойств сообщается и об атаках хакеров, утечках данных. И с новыми видами атак и уязвимостей ещё предстоит научиться бороться. Никита Беляевский из лаборатории LLM Security AI Talent Hub покажет один из инструментов для выявления угроз в системах на основе LLM. Расскажет о настройках open-source сканера Garak и его применении.

Подробности в новой статье: https://habr.com/ru/companies/oleg-bunin/articles/843644/
Media is too big
VIEW IN TELEGRAM
В этом видео Роман Поборчий (self-employed), руководитель программного комитета AiConf, поделился почему он участвует в организации конференции.

Роман работал в разработке в Intel, в поиске Яндекса, в маркетинге JetBrains, занимался аналитикой пользовательского поведения и метриками качества ВКонтакте. Сейчас основная деятельность — помогать докладчикам конференций выступать интересно и полезно.

Встречаемся 26 и 27 сентября в Москве на AiConf, у вас ещё есть возможность к нам присоединиться 🖐️

Посмотреть программу конференции и купить билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Как сделать поиск с помощью картинок?

Есть хороший подход, предложенный OpenAI к задаче классификации картинок с помощью модели CLIP. Использование мультимодальных моделей позволяет сделать шаг к пониманию более широкого класса запросов и контента в сервисе, что недоступно моделям с одной модальностью.

Дмитрий Огурцов из Okko подробнее разберет, как обучать сеть, чтобы искать изображения через текстовые описания: https://habr.com/ru/companies/oleg-bunin/articles/
2👍1
Какие возможности есть у LLM-архитектур в аудиодомене? Что за «зверь» такой «Писец» и как он создавался?

Об этом два доклада из секции «Работа со звуком» в программе AiConf:


1) LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)

Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.

2) Как «Писец» на «Тотальный диктант» ходил, или Пара слов о робастном распознавании речи. Иван Бондаренко (НГУ)

Иван коснётся современных методов распознавания речи (для русского языка в том числе) и сделает это на симпатичном практическом примере. Как современная модель сравнится с людьми в тотальном диктанте?

До конференции осталась неделя, но ещё можете к нам присоединиться 🙌

Программа AiConf , расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Сегодня рассказываем о двух докладах из секции «Умные механизмы», которые вдохновляют переосмыслить привычные процессы производства и разметки данных, делая их более точными, быстрыми и экономичными.


1) Система управления процессом окомкования железорудных окатышей. Андрей Голов (Северсталь Диджитал)

Чугун, бентонит, шихта, окатыш… Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Андрей расскажет, как в условиях сурового производства умные алгоритмы работают в тандеме с технологами и операторами, повышая производительность линии окомкования «Карельского окатыш» на 11% с сохранением качества продукции. Доклад окунает в нюансы реальных физических процессов. А еще знакомит с парой новых слов 😎


2) Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)

Герман предлагает взглянуть на будущее разметки данных с помощью GPT. Он расскажет о том, как крупные языковые модели преобразуют подходы к разметке данных, делая их более эффективными и менее затратными. Будут представлены различные стратегии, описывая их преимущества и ограничения, а также продемонстрировано, как искусственный интеллект может решать сложные задачи в таких областях, как оптическое распознавание символов (OCR), компьютерное зрение (CV) и автоматическое распознавание речи (ASR).

🖐️ До скорой встречи на AiConf — прикладной конференции по Data Science.

Присоединиться к нам ещё можно, билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Интервью с управляющим директором, начальником Управления экспериментальных систем машинного обучения Дивизиона общих сервисов «Салют» Сергеем Марковым.

Поговорим про развитие DS в России, нехватку ресурсов, развитие специалистов, нейрострашилки и правила использования нейросетей.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/844504/
2👍1
Ловите следующую часть докладов из секции «Рекомендательные системы и поиск», на которых вы узнаете:

- о замене разметки запросов и объявлений на LLM, их качестве и влиянии на метрики;
- о внедрении трансформера для обработки событий интерфейса оператора и его тестировании в бою;
- о трансформации BERT4Rec в WildBERT для персонализации на Wildberries и его оптимизации;
- о методах офлайн-валидации рекомендательных моделей, коррелирующих с продуктовыми метриками.

1) Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)

Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.

2) Как мы развернули трансформер на событиях интерфейса операторов поддержки. Артем Карасюк (Т-Банк)

Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. В докладе Артем расскажет, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.

3) WildBERT — развитие трансформерных архитектур для персонализации Wildberries. Евгений Иванов (Wildberries)

Рекомендации Wildberries уже 2 года успешно применяют модели из семейства BERT. Будут практические советы по тому, что можно улучшить на всех этапах жизни рекомендательной системы — от методов оптимизации до diversity выдачи.

4) Валидация в RecSys для корреляции с А/В: что работает в контентных рекомендациях. Дарья Тихонович (МТС Диджитал)

Вы обучили новую модель рекомендаций. Офлайн-метрики растут, а А/В-тест опять красный. Знакомо? Тогда этот доклад для вас. Дарья расскажет про причины возникновения этой проблемы и предложит подходы к решению, которые были протестированы в реальных сервисах экосистемы МТС.

До скорой встречи на AiConf 🙌

Программа конференции и расписание на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
Пятничные мемы
@UseDataConfChannel
👍2😁2🤔1
Не пропустите уникальный мастер-класс по работе с геоданными «Кто хочет стать геосайентистом» от Артема Каледина и Дениса Афанасьева (билайн)

Это прекрасная возможность не только получить полезные знания, но и отработать их. В программе: практическая работа с реальными данными, кейсами и топовыми библиотеками. Освойте геоаналитику для телекома, финтеха, доставки и маркетинга!

До AiConf осталось 3 дня, с нетерпением ждём встречи с вами!

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2
Панельная дискуссия о будущем искусственного интеллекта — это возможность вместе с лидерами индустрии придумать, как продолжить в будущее текущие тренды развития нашей отрасли. Эта возможность выдаётся слишком редко, чтобы её проигнорировать!

Вас ждёт обсуждение фундаментальных проблем, связанных с нашей бурно развивающейся отраслью и её местом в мире.

Мы поговорим на следующие темы:

1. Как LLM и другие мощные генеративные модели меняют рынок труда? Что происходит сейчас, и как продолжить тренд в будущее?

2. Какая кривая растёт быстрее: требования к железу для обучения или возможности, обусловленные законом Мура?

3. Станут ли вопросы этики и авторских прав серьёзными ограничителями в ближайшем будущем?

4. Кажется, уже давно пора встраивать в модели механизмы безопасности в плане защиты от атак и злоупотреблений. Как это будет происходить?

Вспомним свежайшие новости, наложим на них немного математики и проведём параллели с древней историей. Приходите, будет познавательно!

Ждём вас на AiConf 🙌

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Media is too big
VIEW IN TELEGRAM
В этом видео участник программного комитета AiConf Андрей Кузнецов (AIRI) поделился тем, почему он участвует в организации конференции, почему стоит посетить AiConf и чем она интересна 🔥

Ждём вас на Красном Октябре 26 и 27 сентября 🙌

Посмотреть программу конференции и присоединиться к нам можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2👎1
Где применять LLM, а где это оверкилл?

Сейчас все хотят применять LLM для решения своих задач, но не всегда это самый подходящий инструмент. Валентин Малых из ИТМО в своём докладе напомнит слушателям о более простых методах решения NLP-задач и расскажет, как оценить целесообразность применения больших языковых моделей на практике.

Два дня до AiConf

У вас ещё есть возможность к нам присоединиться 🙌
5👍2🔥2
Панельная дискуссия «AI в производственном процессе»

Главная ценность панели — разнообразие компетенций и ролей участников. Это позволит покрутить хайповую проблематику LLM-автоматизации под разными проекциями бизнеса/техники и показать zoom in/out, что хайп здесь уже трансформируется в реальную пользу для компаний и их сотрудников.

Ждём вас на AiConf 🙌

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1
Объединение рекомендательных сценариев с другими — очень актуальная задача.

Дана Злочевская из Lamoda Tech в своём докладе «Новый уровень ML-персонализации Lamoda: как мы усилили ее в каталоге и перенесли в другие продукты» расскажет про опыт персонализации каталога и создание универсальной архитектуры персонализации для интеграции в различные продукты.

Встречаемся уже завтра на AiConf 💥

📋 Расписание конференции
🔥1
Участники AiConf, внимание

Территория острова Балчуг, на котором располагается комплекс Красный Октябрь, находится в зоне нестабильной работы интернет-соединения и GPS.

Пожалуйста, заранее планируйте свой маршрут и время 🕘

Подробная информация о том, как добраться до места проведения конференции здесь

🧭 Я.Карта: Старт Хаб (ex. Digital October) на Красном Октябре

До встречи 🙌
🖐️ Если вы захотите отдохнуть от насыщенных докладов, приходите на активности от Онтико:

🔴Квиз по data science. Интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science.

🔴Онтико AI Искусство. Интерактивный стенд с созданием большого нейрогенеративного произведения искусства.

🔴Онтико AI Музыка. Вы сможете сделать собственные произведения с помощью ИИ.

🔴Пинг-понг. Для любителей активного отдыха — здесь у вас будет возможность завести полезные знакомства.

Все подробности расскажем завтра 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
2
🚀 Доброе утро, друзья! Мы рады объявить о старте прикладной конференции по Data Science — AiConf, которая пройдет сегодня и завтра в Москве!

Как это будет?

🔹Сегодня регистрация открывается в 8:30. Завтра в 9:00

🔹Продолжительность мероприятия — два полных дня. Первый доклад начинается ежедневно в 10:00, а последний заканчивается в 17:50. Сегодня после окончания основной программы состоится afterparty 🎉

🔹Длительность докладов 40-50 минут + перерыв на 10-20 минут для проветривания залов.

📋 Расписание на два дня здесь: https://aiconf.ru/2024/schedule

🖐️ Ждём вас! Открытие конференции в 9:30 в главном зале Сфера
This media is not supported in your browser
VIEW IN TELEGRAM
Дорогие участники конференции!

Сегодня вам предстоит путь на 4-й этаж. Да, именно туда, где воздух немного разряжен, а идеи, как правило, взлетают 🚀
Но ведь это всего лишь 4-й этаж, не Эверест 😉

Сделав первый шаг, помните: сильное желание чего-то достичь — это уже 50% успеха.

Так что вперед, к вершине вдохновения, новых идей, знакомств и крутого времяпрепровождения 🙌
3
Регистрация уже началась

Для того, чтобы пройти её подготовьте, пожалуйста, любой документ, удостоверяющий личность, или заранее распечатанный билет.

☕️ После регистрации вы сможете выпить чашечку бодрящего кофе (или чая, на выбор), чтобы зарядиться энергией и окончательно проснуться.