AiConf Channel
810 subscribers
233 photos
22 videos
224 links
Официальный канал профессиональной конференции по Data Science — AiConf

Конференция пройдёт 26 сентября 2025 г. в Москве.

Чат: https://t.iss.one/UseDataConfTalks
Download Telegram
Будущее уже почти наступило? Ai агенты создают программы за нас!

И это не шутка. Новый Replit Agent — AI Copilot показал себя на тестировании во всей красе. Руководитель AI продуктов компании Raft Евгений Кокуйкин сделал на нём прототип своего рабочего продукта быстрее, чем написал его обзор. Причём быстро получился не только кодинг, но и отладка. А именно за отладку больше всего критиковали агентные системы, которые генерируют код по промпту от пользователя. Так что изменения в работе агента значительные.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/841808/
👍1
Ozon едет на AiConf

В новом выпуске «Рандомных дров» обсудили доклады и сделали такие спойлеры, что теперь их ещё больше хочется послушать.

⭐️ Иван Антипов пояснил за трёхэтапный пайплайн матчинга, при котором находятся не пары, а целые группы товаров. Этого удалось добиться за счёт внедрения подхода кластеризации на графах. Такой алгоритм может быть полезен не только в матчинге, но и, например, в задачах антифрода.

⭐️ Алексей Гурьянов рассказал, как команда перешла на нейросетевые модели в рантайме сервисов товарных рекомендаций и добавила туда тяжёлые трансформенные сетки.

⭐️ Также Лёша поделился идеей, как среди миллионов товаров уложиться в ограничения рантайма при подборе кандидатов.

Про трансформеры, графы, кластеризацию и рекомендации за миллисекунды Ozon Tech like
— слушайте на удобной платформе:

Яндекс Музыка
Apple Podcasts
Castbox
Mave

#ozontech_podcast #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Понимание обработки естественного языка становится все более важным для дата-сантистов, особенно с учетом растущего объема текстовых данных и потребности в их анализе. Будем погружаться в тему на докладах из секции «Обработка естественного языка». Ловите вторую часть, первая здесь

1) От промпта к агентной системе: как превратить LLM в высококачественный сервис. Никита Венедиктов (Raft)

Агентные LLM-фреймворки выглядят сейчас тем инструментом, который способен продвинуть генеративные сценарии до нужных SLI в проде. В отечественном сегменте подтверждений этому пока не так много. Тем ценнее реальный кейс на примере задачи анализа Q&A в СМБ. Результаты подтверждены метриками.

2) Визуальные языковые модели: от разбора архитектуры до запуска. Эмиль Шакиров (SberDevices)

LLM обрастает разными модальностями, одной из которых является зрение. Эмиль расскажет об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Будет интересно!

3) Генеративные модели для работы с кодом. Как мы из 0 сделали 1. Евгений Колесников (Yandex Infrastructure)

Доклад посвящен подходам к обучению больших языковых моделей для работы с кодом, а также сбору данных, анализу результатов и оценке качества генерируемых подсказок для inline code completion.


Встречаемся 26 и 27 сентября на AiConf — независимой крупнейшей офлайн-конференции по Data Science, присоединяйтесь 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
Стать более ценными дата-сантистами на рынке труда и прокачаться в решении реальных задач бизнеса поможет погружение в тему рекомендательных систем и поиска 😎. И у вас будет такая возможность на докладах секции «Рекомендательные системы и поиск».

Знакомим вас со второй частью докладов секции, первая здесь

1) Нейросети в рекомендациях: от идеи до продакшна. Любовь Куприянова (Ozon)

Любовь расскажет о том, как интегрировать нейросетевые подходы в рекомендательные пайплайны, с какими проблемами можно столкнуться и как их избежать. Данный доклад, основанный на реальном опыте — это гайд для тех, кто хочет использовать нейронные сети для задач рекомендаций.

2) Less is more: как уменьшить отправку пушей и вырастить DAU. Дарья Никанорова (VK, Одноклассники)

В своем докладе Дарья делится трудностями работы с рассылками, про сложность оценки изменений и тем, как перейти от наивного подхода к более продвинутому. Даша расскажет про то, как получилось преодолеть эти челленджи в Одноклассниках и улучшить бизнес-метрики.

3) ML на графах в e-commerce: как эффективно собирать группы на миллионах товаров. Иван Антипов (Ozon)

Community Detection — нечастый гость в бизнес-задачах. Однако в Ozon он улучшил качество склейки похожих товаров, да еще и вычисляется распределенно на графе из многих миллионов вершин. Доклад будет интересен тем, кто устал от засилья нейросетей и ностальгирует по старым добрым графовым алгоритмам.


Встречаемся уже совсем скоро на AiConf, у вас ещё есть возможность к нам присоединиться в Москве или онлайн по всему миру 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Media is too big
VIEW IN TELEGRAM
В этом видео участник программного комитета AiConf Иван Бондаренко рассказал о том, что значит для него конференция и какие секции, доклады он ждёт больше всего.

Иван — старший преподаватель и научный сотрудник Новосибирского государственного университета. Вместе со своими учениками является сооснователем стартапа «Сибирские нейросети». С 2006 до 2013 года преподавал и занимался научными исследованиями в Донецком национальном техническом университете, затем перешел в IT-индустрию и работал на различных должностях — от инженера-разработчика до специалиста по машинному обучению — в ряде компаний и университетов, таких как 2ГИС, Huawei, Global Logic, Data Monsters, МФТИ (DeepPavlov)

До AiConf осталось всего две недели. Если вы планируете к нам присоединиться, но ещё не купили билет, поторопитесь 😉

Программа конференции, расписание и билеты на сайте
👍2
Развитие нейросетей способствует шквальному развитию инструментов для них и даже появлению новых языков программирования.

Давайте посмотрим, чем Mojo отличается от Python, какие у них преимущества и недостатки. И сделаем всё это с помощью экспериментов на основе стандартных наборов данных: MNIST и Housing Prices Dataset. Обучим простую сверточную нейронную сеть, а заодно разберём один из методов машинного обучения — линейную регрессию.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/843044/
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🎉 Поздравляем победителя розыгрыша офлайн-билета на AiConf, который проходил в канале Нескучный Data Science

Дмитрий @dimm_day, до встречи 🙌
🔥41
Оптимизация использования железа — важная задача для data-science инфраструктуры, которая позволяет:

- снизить расходы на оборудование и его обслуживание;
- увеличить производительность;
- снизить потребление энергии;
- увеличить скорость разработки;
- улучшить масштабируемость;
- укрепить устойчивость к сбоям.

В программе AiConf вас ждут два классных доклада с реализованными задачами ⤵️

1) Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)

Доклад Виталия охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.

2) Что такое ML-платформа на базе K8s? и как в ней решены разнородные требования к квотированию и шедулингу. Тимофей Разумов (Т-Банк)

ML-платформа все чаще становится обязательной частью инфраструктуры для крупных big-tech-компаний. Тимофей расскажет, какие фреймворки помогают оркестрации и квотированию железа под обучение и инференс и почему из коробки оно не всегда оптимально.


До встречи 26 и 27 сентября в Москве на AiConf 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Привет, друзья! Знакомим вас со следующей подборкой докладов AiConf, в которых эксперты поделятся актуальными темами в области Data Science и AutoML.

Узнайте о проблемах feature engineering и решениях Upgini, создании AutoML-сервисов, важности качественной разметки данных для мультимодальных моделей и о том, как LLM трансформируют поисковые алгоритмы.

1) AutoFE-сапёр: укрощаем взрыв размерности в автоматической генерации признаков. Валерия Дымбицкая (Upgini)

Есть проблемы модные, а есть постоянные. Генерация и отбор признаков на табличных данных — одна из последних. Приходите узнать, как при помощи ML и эвристик можно сократить количество потенциальных фич еще до их расчета.

2) Как AutoML- и AutoDL-сервисы улучшают реальную разработку. Евгений Смирнов (Альфа-Банк)

AutoML, как мёд у Винни-Пуха, теоретически вроде есть, а на практике обычно нет. Евгений расскажет, как удалось добиться практической применимости AutoML-инструментов в Альфа-Банке.

3) Разметка датасетов в эпоху мультимодальности: проблемы, вызовы, решения. Дмитрий Антипов (Сбер / абт)

Дмитрий проведет слушателей через систему подготовки размеченных мультимодальных данных. От парсинга интернета через кейсы мультимодальной разметки; через использование вспомогательных моделей, в том числе LLM; через бизнес-процессы и контроль качества разметки к финальным метрикам моделей.

4) Где и как использовать LLM в задачах поиска. Валерия Гурьянова (SberDevices)

Казалось бы, что может быть более проработано и изучено, чем задача поиска? Но вот появились LLM, и пришло время освежать свои знания в этой области. Доклад от Валерии покажет, как большие модели улучшают классические области поиска — разметку, ранжирование, индексы и семантический поиск.

До скорой встречи на AiConf — прикладной конференции по Data Science 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥3
Даже у самых полезных вещей есть свои тёмные стороны. Большие языковые модели — не исключение.

Последнее время про нейросети пишут постоянно, но помимо полезных свойств сообщается и об атаках хакеров, утечках данных. И с новыми видами атак и уязвимостей ещё предстоит научиться бороться. Никита Беляевский из лаборатории LLM Security AI Talent Hub покажет один из инструментов для выявления угроз в системах на основе LLM. Расскажет о настройках open-source сканера Garak и его применении.

Подробности в новой статье: https://habr.com/ru/companies/oleg-bunin/articles/843644/
Media is too big
VIEW IN TELEGRAM
В этом видео Роман Поборчий (self-employed), руководитель программного комитета AiConf, поделился почему он участвует в организации конференции.

Роман работал в разработке в Intel, в поиске Яндекса, в маркетинге JetBrains, занимался аналитикой пользовательского поведения и метриками качества ВКонтакте. Сейчас основная деятельность — помогать докладчикам конференций выступать интересно и полезно.

Встречаемся 26 и 27 сентября в Москве на AiConf, у вас ещё есть возможность к нам присоединиться 🖐️

Посмотреть программу конференции и купить билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Как сделать поиск с помощью картинок?

Есть хороший подход, предложенный OpenAI к задаче классификации картинок с помощью модели CLIP. Использование мультимодальных моделей позволяет сделать шаг к пониманию более широкого класса запросов и контента в сервисе, что недоступно моделям с одной модальностью.

Дмитрий Огурцов из Okko подробнее разберет, как обучать сеть, чтобы искать изображения через текстовые описания: https://habr.com/ru/companies/oleg-bunin/articles/
2👍1
Какие возможности есть у LLM-архитектур в аудиодомене? Что за «зверь» такой «Писец» и как он создавался?

Об этом два доклада из секции «Работа со звуком» в программе AiConf:


1) LLM говорит: мультимодальные задачи в речевом домене. Борис Жестков (SberDevices)

Современные LLM умеют отвечать текстом, визуальные LLM умеют понимать и рисовать картинки, а как заставить LLM говорить и слышать? Борис расскажет о возможностях LLM в домене аудио — распознавание, генерация речи, клонирование голоса, инструктивная генерация голоса.

2) Как «Писец» на «Тотальный диктант» ходил, или Пара слов о робастном распознавании речи. Иван Бондаренко (НГУ)

Иван коснётся современных методов распознавания речи (для русского языка в том числе) и сделает это на симпатичном практическом примере. Как современная модель сравнится с людьми в тотальном диктанте?

До конференции осталась неделя, но ещё можете к нам присоединиться 🙌

Программа AiConf , расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Сегодня рассказываем о двух докладах из секции «Умные механизмы», которые вдохновляют переосмыслить привычные процессы производства и разметки данных, делая их более точными, быстрыми и экономичными.


1) Система управления процессом окомкования железорудных окатышей. Андрей Голов (Северсталь Диджитал)

Чугун, бентонит, шихта, окатыш… Все мы наслышаны об успехах ML в финансах, маркетинге и e-com. Но тяжелая промышленность — это другая вселенная. Андрей расскажет, как в условиях сурового производства умные алгоритмы работают в тандеме с технологами и операторами, повышая производительность линии окомкования «Карельского окатыш» на 11% с сохранением качества продукции. Доклад окунает в нюансы реальных физических процессов. А еще знакомит с парой новых слов 😎


2) Разметка будущего: как GPT помогает обучать модели? Герман Ганус (Яндекс Крауд)

Герман предлагает взглянуть на будущее разметки данных с помощью GPT. Он расскажет о том, как крупные языковые модели преобразуют подходы к разметке данных, делая их более эффективными и менее затратными. Будут представлены различные стратегии, описывая их преимущества и ограничения, а также продемонстрировано, как искусственный интеллект может решать сложные задачи в таких областях, как оптическое распознавание символов (OCR), компьютерное зрение (CV) и автоматическое распознавание речи (ASR).

🖐️ До скорой встречи на AiConf — прикладной конференции по Data Science.

Присоединиться к нам ещё можно, билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Интервью с управляющим директором, начальником Управления экспериментальных систем машинного обучения Дивизиона общих сервисов «Салют» Сергеем Марковым.

Поговорим про развитие DS в России, нехватку ресурсов, развитие специалистов, нейрострашилки и правила использования нейросетей.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/844504/
2👍1
Ловите следующую часть докладов из секции «Рекомендательные системы и поиск», на которых вы узнаете:

- о замене разметки запросов и объявлений на LLM, их качестве и влиянии на метрики;
- о внедрении трансформера для обработки событий интерфейса оператора и его тестировании в бою;
- о трансформации BERT4Rec в WildBERT для персонализации на Wildberries и его оптимизации;
- о методах офлайн-валидации рекомендательных моделей, коррелирующих с продуктовыми метриками.

1) Люди не нужны? Размечаем поисковую релевантность при помощи LLM. Данила Бочарников (Авито)

Не хотите больше полагаться на людей для разметки данных? Узнайте, как LLM может заменить разметчиков из сервисов вроде Толока, обеспечивая высокое качество релевантности для поиска! Данила расскажет про оптимальные методы дообучения LLM и их влияние на продуктовые метрики.

2) Как мы развернули трансформер на событиях интерфейса операторов поддержки. Артем Карасюк (Т-Банк)

Инструменты для операторов службы поддержки при взаимодействии с пользователем — всегда актуальный трек для прикладного применения ML-моделей. В докладе Артем расскажет, как переход на более совершенные трансформерные модели для ранжирования интентов пользователя дает осязаемый бизнес-профит.

3) WildBERT — развитие трансформерных архитектур для персонализации Wildberries. Евгений Иванов (Wildberries)

Рекомендации Wildberries уже 2 года успешно применяют модели из семейства BERT. Будут практические советы по тому, что можно улучшить на всех этапах жизни рекомендательной системы — от методов оптимизации до diversity выдачи.

4) Валидация в RecSys для корреляции с А/В: что работает в контентных рекомендациях. Дарья Тихонович (МТС Диджитал)

Вы обучили новую модель рекомендаций. Офлайн-метрики растут, а А/В-тест опять красный. Знакомо? Тогда этот доклад для вас. Дарья расскажет про причины возникновения этой проблемы и предложит подходы к решению, которые были протестированы в реальных сервисах экосистемы МТС.

До скорой встречи на AiConf 🙌

Программа конференции и расписание на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
Пятничные мемы
@UseDataConfChannel
👍2😁2🤔1
Не пропустите уникальный мастер-класс по работе с геоданными «Кто хочет стать геосайентистом» от Артема Каледина и Дениса Афанасьева (билайн)

Это прекрасная возможность не только получить полезные знания, но и отработать их. В программе: практическая работа с реальными данными, кейсами и топовыми библиотеками. Освойте геоаналитику для телекома, финтеха, доставки и маркетинга!

До AiConf осталось 3 дня, с нетерпением ждём встречи с вами!

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2
Панельная дискуссия о будущем искусственного интеллекта — это возможность вместе с лидерами индустрии придумать, как продолжить в будущее текущие тренды развития нашей отрасли. Эта возможность выдаётся слишком редко, чтобы её проигнорировать!

Вас ждёт обсуждение фундаментальных проблем, связанных с нашей бурно развивающейся отраслью и её местом в мире.

Мы поговорим на следующие темы:

1. Как LLM и другие мощные генеративные модели меняют рынок труда? Что происходит сейчас, и как продолжить тренд в будущее?

2. Какая кривая растёт быстрее: требования к железу для обучения или возможности, обусловленные законом Мура?

3. Станут ли вопросы этики и авторских прав серьёзными ограничителями в ближайшем будущем?

4. Кажется, уже давно пора встраивать в модели механизмы безопасности в плане защиты от атак и злоупотреблений. Как это будет происходить?

Вспомним свежайшие новости, наложим на них немного математики и проведём параллели с древней историей. Приходите, будет познавательно!

Ждём вас на AiConf 🙌

Расписание конференции на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Media is too big
VIEW IN TELEGRAM
В этом видео участник программного комитета AiConf Андрей Кузнецов (AIRI) поделился тем, почему он участвует в организации конференции, почему стоит посетить AiConf и чем она интересна 🔥

Ждём вас на Красном Октябре 26 и 27 сентября 🙌

Посмотреть программу конференции и присоединиться к нам можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2👎1