AiConf Channel
810 subscribers
226 photos
22 videos
222 links
Официальный канал профессиональной конференции по Data Science — AiConf

Конференция пройдёт 26 сентября 2025 г. в Москве.

Чат: https://t.iss.one/UseDataConfTalks
Download Telegram
Какие возможности есть у LLM-архитектур в аудиодомене? Что за «зверь» такой «Писец» и как он создавался?

Об этом два доклада из секции «Работа со звуком» в программе AiConf:


1) LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)

Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.

2) Как «Писец» на «Тотальный диктант» ходил, или Пара слов о робастном распознавании речи. Иван Бондаренко (НГУ)

Иван коснётся современных методов распознавания речи (для русского языка в том числе) и сделает это на симпатичном практическом примере. Как современная модель сравнится с людьми в тотальном диктанте?

До конференции осталась неделя, но ещё можете к нам присоединиться 🙌

Программа AiConf , расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Сегодня рассказываем о двух докладах из секции «Умные механизмы», которые вдохновляют переосмыслить привычные процессы производства и разметки данных, делая их более точными, быстрыми и экономичными.


1) Система управления процессом окомкования железорудных окатышей. Андрей Голов (Северсталь Диджитал)

Чугун, бентонит, шихта, окатыш… Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Андрей расскажет, как в условиях сурового производства умные алгоритмы работают в тандеме с технологами и операторами, повышая производительность линии окомкования «Карельского окатыш» на 11% с сохранением качества продукции. Доклад окунает в нюансы реальных физических процессов. А еще знакомит с парой новых слов 😎


2) Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)

Герман предлагает взглянуть на будущее разметки данных с помощью GPT. Он расскажет о том, как крупные языковые модели преобразуют подходы к разметке данных, делая их более эффективными и менее затратными. Будут представлены различные стратегии, описывая их преимущества и ограничения, а также продемонстрировано, как искусственный интеллект может решать сложные задачи в таких областях, как оптическое распознавание символов (OCR), компьютерное зрение (CV) и автоматическое распознавание речи (ASR).

🖐️ До скорой встречи на AiConf — прикладной конференции по Data Science.

Присоединиться к нам ещё можно, билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Интервью с управляющим директором, начальником Управления экспериментальных систем машинного обучения Дивизиона общих сервисов «Салют» Сергеем Марковым.

Поговорим про развитие DS в России, нехватку ресурсов, развитие специалистов, нейрострашилки и правила использования нейросетей.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/844504/
2👍1
Ловите следующую часть докладов из секции «Рекомендательные системы и поиск», на которых вы узнаете:

- о замене разметки запросов и объявлений на LLM, их качестве и влиянии на метрики;
- о внедрении трансформера для обработки событий интерфейса оператора и его тестировании в бою;
- о трансформации BERT4Rec в WildBERT для персонализации на Wildberries и его оптимизации;
- о методах офлайн-валидации рекомендательных моделей, коррелирующих с продуктовыми метриками.

1) Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)

Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.

2) Как мы развернули трансформер на событиях интерфейса операторов поддержки. Артем Карасюк (Т-Банк)

Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. В докладе Артем расскажет, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.

3) WildBERT — развитие трансформерных архитектур для персонализации Wildberries. Евгений Иванов (Wildberries)

Рекомендации Wildberries уже 2 года успешно применяют модели из семейства BERT. Будут практические советы по тому, что можно улучшить на всех этапах жизни рекомендательной системы — от методов оптимизации до diversity выдачи.

4) Валидация в RecSys для корреляции с А/В: что работает в контентных рекомендациях. Дарья Тихонович (МТС Диджитал)

Вы обучили новую модель рекомендаций. Офлайн-метрики растут, а А/В-тест опять красный. Знакомо? Тогда этот доклад для вас. Дарья расскажет про причины возникновения этой проблемы и предложит подходы к решению, которые были протестированы в реальных сервисах экосистемы МТС.

До скорой встречи на AiConf 🙌

Программа конференции и расписание на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
Пятничные мемы
@UseDataConfChannel
👍2😁2🤔1
Не пропустите уникальный мастер-класс по работе с геоданными «Кто хочет стать геосайентистом» от Артема Каледина и Дениса Афанасьева (билайн)

Это прекрасная возможность не только получить полезные знания, но и отработать их. В программе: практическая работа с реальными данными, кейсами и топовыми библиотеками. Освойте геоаналитику для телекома, финтеха, доставки и маркетинга!

До AiConf осталось 3 дня, с нетерпением ждём встречи с вами!

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2
Панельная дискуссия о будущем искусственного интеллекта — это возможность вместе с лидерами индустрии придумать, как продолжить в будущее текущие тренды развития нашей отрасли. Эта возможность выдаётся слишком редко, чтобы её проигнорировать!

Вас ждёт обсуждение фундаментальных проблем, связанных с нашей бурно развивающейся отраслью и её местом в мире.

Мы поговорим на следующие темы:

1. Как LLM и другие мощные генеративные модели меняют рынок труда? Что происходит сейчас, и как продолжить тренд в будущее?

2. Какая кривая растёт быстрее: требования к железу для обучения или возможности, обусловленные законом Мура?

3. Станут ли вопросы этики и авторских прав серьёзными ограничителями в ближайшем будущем?

4. Кажется, уже давно пора встраивать в модели механизмы безопасности в плане защиты от атак и злоупотреблений. Как это будет происходить?

Вспомним свежайшие новости, наложим на них немного математики и проведём параллели с древней историей. Приходите, будет познавательно!

Ждём вас на AiConf 🙌

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Media is too big
VIEW IN TELEGRAM
В этом видео участник программного комитета AiConf Андрей Кузнецов (AIRI) поделился тем, почему он участвует в организации конференции, почему стоит посетить AiConf и чем она интересна 🔥

Ждём вас на Красном Октябре 26 и 27 сентября 🙌

Посмотреть программу конференции и присоединиться к нам можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2👎1
Где применять LLM, а где это оверкилл?

Сейчас все хотят применять LLM для решения своих задач, но не всегда это самый подходящий инструмент. Валентин Малых из ИТМО в своём докладе напомнит слушателям о более простых методах решения NLP-задач и расскажет, как оценить целесообразность применения больших языковых моделей на практике.

Два дня до AiConf

У вас ещё есть возможность к нам присоединиться 🙌
5👍2🔥2
Панельная дискуссия «AI в производственном процессе»

Главная ценность панели — разнообразие компетенций и ролей участников. Это позволит покрутить хайповую проблематику LLM-автоматизации под разными проекциями бизнеса/техники и показать zoom in/out, что хайп здесь уже трансформируется в реальную пользу для компаний и их сотрудников.

Ждём вас на AiConf 🙌

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥1
Объединение рекомендательных сценариев с другими — очень актуальная задача.

Дана Злочевская из Lamoda Tech в своём докладе «Новый уровень ML-персонализации Lamoda: как мы усилили ее в каталоге и перенесли в другие продукты» расскажет про опыт персонализации каталога и создание универсальной архитектуры персонализации для интеграции в различные продукты.

Встречаемся уже завтра на AiConf 💥

📋 Расписание конференции
🔥1
Участники AiConf, внимание

Территория острова Балчуг, на котором располагается комплекс Красный Октябрь, находится в зоне нестабильной работы интернет-соединения и GPS.

Пожалуйста, заранее планируйте свой маршрут и время 🕘

Подробная информация о том, как добраться до места проведения конференции здесь

🧭 Я.Карта: Старт Хаб (ex. Digital October) на Красном Октябре

До встречи 🙌
🖐️ Если вы захотите отдохнуть от насыщенных докладов, приходите на активности от Онтико:

🔴Квиз по data science. Интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science.

🔴Онтико AI Искусство. Интерактивный стенд с созданием большого нейрогенеративного произведения искусства.

🔴Онтико AI Музыка. Вы сможете сделать собственные произведения с помощью ИИ.

🔴Пинг-понг. Для любителей активного отдыха — здесь у вас будет возможность завести полезные знакомства.

Все подробности расскажем завтра 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
2
🚀 Доброе утро, друзья! Мы рады объявить о старте прикладной конференции по Data Science — AiConf, которая пройдет сегодня и завтра в Москве!

Как это будет?

🔹Сегодня регистрация открывается в 8:30. Завтра в 9:00

🔹Продолжительность мероприятия — два полных дня. Первый доклад начинается ежедневно в 10:00, а последний заканчивается в 17:50. Сегодня после окончания основной программы состоится afterparty 🎉

🔹Длительность докладов 40-50 минут + перерыв на 10-20 минут для проветривания залов.

📋 Расписание на два дня здесь: https://aiconf.ru/2024/schedule

🖐️ Ждём вас! Открытие конференции в 9:30 в главном зале Сфера
This media is not supported in your browser
VIEW IN TELEGRAM
Дорогие участники конференции!

Сегодня вам предстоит путь на 4-й этаж. Да, именно туда, где воздух немного разряжен, а идеи, как правило, взлетают 🚀
Но ведь это всего лишь 4-й этаж, не Эверест 😉

Сделав первый шаг, помните: сильное желание чего-то достичь — это уже 50% успеха.

Так что вперед, к вершине вдохновения, новых идей, знакомств и крутого времяпрепровождения 🙌
3
Регистрация уже началась

Для того, чтобы пройти её подготовьте, пожалуйста, любой документ, удостоверяющий личность, или заранее распечатанный билет.

☕️ После регистрации вы сможете выпить чашечку бодрящего кофе (или чая, на выбор), чтобы зарядиться энергией и окончательно проснуться.
Ловите расписание конференции на два дня

https://aiconf.ru/2024/schedule
Онтико AI Искусство на AiConf

Холст Кандинского — интерактивный стенд, на котором участники конференции смогут создать большое нейрогенеративное произведение искусства и создать масштабное бесконечное полотно с помощью нейросети Kandinsky.

Участники будут ограничены лишь выбором цветов — для того, чтобы полотно смотрелось связанным высказыванием-впечатлением. У стенда вас встретят и подскажут что и как генерировать и проследят за тем, чтобы ваш результат стал частью единого полотна. Чем больше будет участников, тем интереснее и полнее получится общий визуальный дух конференции AiConf 2024, в результате чего получится провести некое художественное исследование.

Коллективный перформанс будет подытожен уникальным мерчем — печатью коллажей совместных генераций.

🖐️ В создании единого полотна участникам поможет Валерия Титова
3
Друзья, в 10:00 начинаются первые доклады AiConf 2024:

🔹Зал «Сфера». За рамками сценария: непрерывное тестирование для адаптивных и безопасных LLM-систем. Эмели Драль (Evidently AI)

Эмели расскажет про failure cases LLM, дообученных на свой домен, ограничения на безопасность и надежность в продакшне. Рассмотрит стратегии повышения робастности, базирующиеся на концепциях LLM judge, а также непрерывном тестировании и мониторинге.

🔹Зал «Полусфера». Визуальные языковые модели: от разбора архитектуры до запуска. Эмиль Шакиров (SberDevices)

LLM обрастает разными модальностями, одной из которых является зрение. Эмиль расскажет об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Будет интересно!

🔹Зал «Аудитория 1». Превращаем нейросети в SOTA и для табличных задач. Олег Сидоршин (Альфа-Банк)

Градиентный бустинг — SOTA для работы с табличными данными. Олег расскажет, какие архитектуры нейронных сетей использовать и как именно их обучать, чтобы догнать по качеству бустинг и впоследствии в режиме end-to-end строить модели одновременно на структурированных и слабоструктурированных данных.

🔹 Зал «Пресс-центр». Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения. Дмитрий Антипов (Сбер / абт)

Дмитрий проведет слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.
🔥 Хотите проверить свои знания и навыки в области Data Science? Тогда участвуйте в нашем квизе!

Это интеллектуальное соревнование, где вы сможете продемонстрировать свои знания в области анализа данных, машинного обучения, статистики и других аспектов Data Science. Вас ждут интересные вопросы, увлекательные задачи и возможность проявить себя.

Записывайтесь в список на площадке конференции.
Участвуют 10 команд по 6 человек.

Начало сегодня в 18:00
3