AiConf Channel
811 subscribers
234 photos
22 videos
225 links
Официальный канал профессиональной конференции по Data Science — AiConf

Конференция пройдёт 26 сентября 2025 г. в Москве.

Чат: https://t.iss.one/UseDataConfTalks
Download Telegram
Напоминаем, что сегодня (29 августа) у нас пройдёт закрытая онлайн-встреча сообщества, приглашаем экспертов в data science 🖐️

Собираемся в 18:00 по Мск.

Будем обсуждать горизонты профессионального развития в DS и машинном обучении. Темы встречи:

⚡️Как развиваться внутри data science?

⚡️Какие интересные прикладные задачи стоят перед лидерами индустрии?

⚡️Перспективы для сеньора: расти вверх по карьерной лестнице или углубляться внутри своей специализации? Поговорим про вертикальное и горизонтальное развитие

⚡️Где получать практические навыки и обмениваться опытом и связями?

Участники встречи:

- Андрей Кузнецов (AIRI)
- Евгений Смирнов (АЛЬФА-БАНК)
- Роман Поборчий (self-employed)
- Дани Эль-Айясс (Self-employed)
- Владимир Ершов (Яндекс)
- Никита Зелинский (МТС)
- Александр Самойлов (Wildberries)
- Иван Бондаренко (Новосибирский государственный университет)

Встреча пройдет в формате открытой дискуссии, где каждый желающий сможет задать интересующие его вопросы. Участие бесплатное.

Подключайтесь сами и зовите коллег 🙌
Устали от докладов про RecSys и NLP? Приходите послушать доклад Владислава Маслова и Василия Вологдина «Как ML помогает производить лекарства?»

Вы узнаете, как машинное обучение трансформирует сферу фармацевтики и ускоряет разработку лекарств! Доклад особенно хорош обзором разных направлений: это и лабораторные исследования, и производство, клинические и доклинические исследования, бэк-офис…

🖐️ Ждём вас на AiConf — прикладной конференции по Data Science, которая пройдёт 26 и 27 сентября в Москве.

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5
Как достичь максимальной точности обработки данных, полученных с краудсорсинговых платформ?

Сегодня мы расскажем о фреймворке агрегации разметки данных, который использует команда SberDevices. AggregateMe помогает привести несколько разметок к одной и повысить её качество в случае, если исполнители где-то ошиблись. Этот Open Source-фреймворк собирает вместе данные, размеченные разными способами, и позволяет использовать их для разных проектов.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/833994/
🔥42
This media is not supported in your browser
VIEW IN TELEGRAM
🖐️ Вчера у нас прошла онлайн-встреча экспертов в области data science с сообществом, на которой мы обсудили следующие основные тематики:

- Будущее и развитие DS. Какие интересные прикладные задачи стоят перед лидерами индустрии?
- Где стоит применять LLM, а где стоит обойтись менее сложными моделями?
- По какому вектору будет дальше развиваться "генеративный ИИ"?

Спикерами встречи стали: Андрей Кузнецов (AIRI), Евгений Смирнов (АЛЬФА-БАНК), Роман Поборчий (self-employed), Дани Эль-Айясс (Social Discovery Group) и Александр Самойлов (Wildberries)

▶️Если вы не смогли принять участие в этой дискуссии, делимся с вами записью встречи

Присоединяйтесь к нам 26 и 27 сентября на AiConf — независимую крупнейшую офлайн-конференцию по Data Science 🙌
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥42
Академические исследования — отдельный трек в программе AiConf, на котором мы будем говорить про ML будущего.

Сегодня знакомим вас со второй частью докладов трека, из которых вы узнаете:

- о фреймворке для анализа данных с использованием каузальных моделей и вероятностного ИИ;
- исследование State of the art табличных нейросетей;
- различные подходы к пониманию и улучшению рациональности в LLM;
- о текущем состоянии области физически обоснованного машинного обучения.

первая часть докладов здесь

1) Фреймворк прикладных инструментов для анализа данных на основе каузальных моделей и байесовских сетей. Ирина Деева (Университет ИТМО)

Causal ML — сложная тема, под которую необходимы специальные библиотеки для моделирования и анализа данных. Ребята из ИТМО расскажут про свою новую библиотеку, где они собрали все необходимые инструменты в одном месте, и как эта библиотека работает по сравнению с существующими решениями.

2) Превращаем нейросети в SOTA и для табличных задач. Олег Сидоршин (Альфа-Банк)

Градиентный бустинг — SOTA для работы с табличными данными. Олег расскажет, какие архитектуры нейронных сетей использовать и как именно их обучать, чтобы догнать по качеству бустинг и впоследствии в режиме end-to-end строить модели одновременно на структурированных и слабоструктурированных данных.

3) Языковые модели и основы рационального мышления. Ирина Пионтковская (Huawei Noah's Ark Lab)

Ирина расскажет о том, насколько LLM способны применять логику в своих решениях. Эти модели претендуют на роль универсальных решателей, но пока неясно, входят ли логические рассуждения в число их эмерджентных способностей, или же LLM остаются статистическим механизмом над лингвистическими данными.

4) Физически обоснованное машинное обучение — что можно и что нужно. Александр Хватов (Университет ИТМО)

Промтинжиниринг, LLM, RAG, BERT, агентные системы, GPT — НЕТ!
Дифуры, операторы Фурье, PINN, вариационное исчисление, рой роботов, моделирование поведения плазмы — ДА!
Возможно, самый «альтернативный» доклад на AIConf!
Вы узнаете о физически обоснованном МО и о том, как оно облегчает жизнь физиков.

Встречаемся 26 и 27 сентября на AiConf, присоединяйтесь 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Офлайн или онлайн?

Рассказываем про два формата участия в AiConf, их преимуществах и доступных опциях.

Офлайн-формат: погружение в атмосферу общения.

Если вы выбираете не только слушать, а ещё активно участвовать и обмениваться опытом, офлайн-формат то, что вам нужно!

- Общение со спикерами. У вас будет возможность задать вопросы и обсудить интересующие вас темы напрямую с экспертами. Это шанс получить инсайты из первых уст.
 
- Глубокая проработка тем на воркшопах и панельных дискуссиях. Погрузитесь в обсуждения, где вы сможете поделиться своими мыслями и получить обратную связь от коллег и спикеров.

- Доступ к выставочной зоне. Исследуйте новинки технологий и продуктов от ведущих компаний. Это отличная возможность найти решения для своих проектов.

- Сытные кофебрейки и обеды. Наслаждайтесь вкусной едой и общением с коллегами.

- Подарки от партнёров и организаторов. Маленькие приятные сюрпризы, которые пригодятся для дальнейшего использования.

🗄

Онлайн-формат: Знания на расстоянии одного клика!

Не можете присутствовать на конференции лично? Этот формат дает вам возможность участвовать в событии из любой точки мира.

- Трансляция всех докладов. Следите за событиями конференции в режиме реального времени. Благодаря отличному качеству трансляции, вы сможете почувствовать атмосферу в зале даже издалека.

- Воркшопы и панельные дискуссии не транслируются. Хотя интерактивные сессии доступны только офлайн, у вас все равно будет масса информации.

🔴Опции, которые будут доступны и для офлайн-участников, и для онлайн:

- Вопросы к спикерам в telegram-чате. У вас также будет возможность задать вопрос спикеру и получить ответ.

- Все презентации спикеров. Не переживайте, если что-то пропустите — у вас будет доступ ко всем материалам.

- Видеозаписи всех докладов. Все важные моменты останутся с вами. Пересматривайте их в любое время.

Какой бы формат вы ни выбрали, мы уверены, что AiConf станет для вас настоящим источником вдохновения и знаний. Приходите, подключайтесь, участвуйте 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Интервью Эмели Драль — кофаундера и технического директора Evidently AI. У её open source библиотеки для оценки, тестирования и мониторинга качества данных и моделей машинного обучения уже более 22 миллионов скачиваний.

Расспросили её о пути в карьере, передаче знаний, необходимых скиллах и будущем отрасли: https://habr.com/ru/companies/oleg-bunin/articles/840716/
👍5
Генерация видео: from zero to hero — тема доклада Дениса Димитрова, посвященному этапам развития известной генеративной модели Kandinsky от команды Сбер.

Слушатели узнают про основные отличия новых архитектур модели, возможностях новой версии Kandinsky и применении ее в современных продуктах. Доклад будет интересен как для практиков, так и теоретикам.

Денис — руководитель научной группой Sber AI Research в Сбере и научный консультант в Институте искусственного интеллекта AIRI, победитель рейтинга Forbes «30 до 30». Руководит разработкой моделей генерации изображений и видео по тексту Kandinsky и Kandinsky Video и один из разработчиков модели GigaChat.

Мы ждём вас 26 и 27 сентября в Москве на AiConf 🖐

Программа конференции, расписание и билеты на сайте
3👍3
Друзья, ловите свежую подборку полезных материалов 🙌

Набирающие хайп vision language models: InvernVL, VILA, MiniCPM.

Статья «Attention is Not All You Need: как менялась архитектура трансформера».

CoPE: контекстуальное позиционное кодирование.

КWKV: оптимизация сложности механизма внимания до линейной на основе RWKV.

SmolLM: маленькая модель, которая превосходит llama3, MobileLM и Qwen2

Оставайтесь с нами, чтобы получать ещё больше полезного и актуального контента для специалистов, увлеченных новейшими технологиями и инновациями в области искусственного интеллекта. Не забывайте делиться с коллегами 😉
👍41👎1
✍️ Открыт приём заявок на участие в БЕСПЛАТНОЙ программе MENTOR IN TECH 6.0 от сообществ Women in Tech и Women in Big Data!

Программа продлится с 1 октября 2024 по 1 февраля 2025 года. Это возможность получить ценные знания и рекомендации от опытных профессионалов IT-индустрии.

1️⃣ Подробнее о программе в записи на  YouTube и VK. Презентация со всеми ответами станет полезной памяткой при подаче заявки и участии в MiT.

2️⃣ Подача заявок с 1 по 15 сентября 2024 с помощью ТГ-бота. Набор будет происходить на конкурсной основе.

Мы ждём менторов и менти по следующим направлениям:

✔️ Data Science
✔️ Team Management in IT

Вы можете принимать участие в программе одновременно и как ментор, и как менти.

Подробнее о программе смотрите на сайте.
1👍1
Компьютерное зрение и генерация изображений — важные инструменты в арсенале дата-сантистов, которые способствуют более глубокому анализу данных и созданию инновационных решений.

На AiConf будет отдельная секция, посвященная этой теме. В этом посте рассказываем про следующие доклады и мастер-класс из секции «Компьютерное зрение и генерация изображений»

1) 3D pose estimation объектов фиксированной геометрии для складских роботов. Aлександр Тимофеев-Каракозов (Яндекс)

Александр расскажет про end-2-end-пайплайн обучения и работы складских роботов Яндекса от 3D-локализации коробок с товарами для складской робототехники через keypoints estimation и instance segmentation к финальному решению, базирующемуся на active learning в среде активно меняющихся доменов.

2) Мягкая модерация изображений: скрыть нельзя блокировать. Юрий Батраков (Авито)

Модерация UGC-контента — огромная головная боль для бизнеса и огромный простор для ML-решений. Постоянное желание пользователей обойти автоматические проверки, и высокая нагрузка рождают элегантные инженерные системы, о которых вы узнаете из доклада Юрия.

3) Побеждают ли диффузионные модели генеративные состязательные сети в задаче повышения разрешения? Денис Кузнеделев (Яндекс)

Доклад посвящён построению ряда экспериментов по сравнению диффузионных и GAN-подходов в задаче повышения разрешения при одинаковых условиях в смысле обучения/тестирования моделей. Авторы ставят эксперименты, фиксируя данные, размеры моделей, что позволяет проводить корректное сопоставление.

4) Мастер-класс «Получение высококачественных данных для обучения ИИ-моделей». Олег Секачев (Яндекс)

Если вам предстоит собирать много данных с помощью людей, а раньше вы такую разметку не организовывали, то воркшоп строго рекомендован к посещению. Там вы узнаете, как разметчики косячат, как они жульничают и что со всем этим делать вам как заказчику разметки.


Присоединяйтесь к нам 26 и 27 сентября на AiConf 🙌

Посмотреть программу конференции и купить билет можно на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍1
Будущее уже почти наступило? Ai агенты создают программы за нас!

И это не шутка. Новый Replit Agent — AI Copilot показал себя на тестировании во всей красе. Руководитель AI продуктов компании Raft Евгений Кокуйкин сделал на нём прототип своего рабочего продукта быстрее, чем написал его обзор. Причём быстро получился не только кодинг, но и отладка. А именно за отладку больше всего критиковали агентные системы, которые генерируют код по промпту от пользователя. Так что изменения в работе агента значительные.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/841808/
👍1
Ozon едет на AiConf

В новом выпуске «Рандомных дров» обсудили доклады и сделали такие спойлеры, что теперь их ещё больше хочется послушать.

⭐️ Иван Антипов пояснил за трёхэтапный пайплайн матчинга, при котором находятся не пары, а целые группы товаров. Этого удалось добиться за счёт внедрения подхода кластеризации на графах. Такой алгоритм может быть полезен не только в матчинге, но и, например, в задачах антифрода.

⭐️ Алексей Гурьянов рассказал, как команда перешла на нейросетевые модели в рантайме сервисов товарных рекомендаций и добавила туда тяжёлые трансформенные сетки.

⭐️ Также Лёша поделился идеей, как среди миллионов товаров уложиться в ограничения рантайма при подборе кандидатов.

Про трансформеры, графы, кластеризацию и рекомендации за миллисекунды Ozon Tech like
— слушайте на удобной платформе:

Яндекс Музыка
Apple Podcasts
Castbox
Mave

#ozontech_podcast #ML
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Понимание обработки естественного языка становится все более важным для дата-сантистов, особенно с учетом растущего объема текстовых данных и потребности в их анализе. Будем погружаться в тему на докладах из секции «Обработка естественного языка». Ловите вторую часть, первая здесь

1) От промпта к агентной системе: как превратить LLM в высококачественный сервис. Никита Венедиктов (Raft)

Агентные LLM-фреймворки выглядят сейчас тем инструментом, который способен продвинуть генеративные сценарии до нужных SLI в проде. В отечественном сегменте подтверждений этому пока не так много. Тем ценнее реальный кейс на примере задачи анализа Q&A в СМБ. Результаты подтверждены метриками.

2) Визуальные языковые модели: от разбора архитектуры до запуска. Эмиль Шакиров (SberDevices)

LLM обрастает разными модальностями, одной из которых является зрение. Эмиль расскажет об архитектурах визуальных LLM, о том, какие вызовы стоят перед инженерами в создании мультимодальных архитектур. Будет интересно!

3) Генеративные модели для работы с кодом. Как мы из 0 сделали 1. Евгений Колесников (Yandex Infrastructure)

Доклад посвящен подходам к обучению больших языковых моделей для работы с кодом, а также сбору данных, анализу результатов и оценке качества генерируемых подсказок для inline code completion.


Встречаемся 26 и 27 сентября на AiConf — независимой крупнейшей офлайн-конференции по Data Science, присоединяйтесь 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
Стать более ценными дата-сантистами на рынке труда и прокачаться в решении реальных задач бизнеса поможет погружение в тему рекомендательных систем и поиска 😎. И у вас будет такая возможность на докладах секции «Рекомендательные системы и поиск».

Знакомим вас со второй частью докладов секции, первая здесь

1) Нейросети в рекомендациях: от идеи до продакшна. Любовь Куприянова (Ozon)

Любовь расскажет о том, как интегрировать нейросетевые подходы в рекомендательные пайплайны, с какими проблемами можно столкнуться и как их избежать. Данный доклад, основанный на реальном опыте — это гайд для тех, кто хочет использовать нейронные сети для задач рекомендаций.

2) Less is more: как уменьшить отправку пушей и вырастить DAU. Дарья Никанорова (VK, Одноклассники)

В своем докладе Дарья делится трудностями работы с рассылками, про сложность оценки изменений и тем, как перейти от наивного подхода к более продвинутому. Даша расскажет про то, как получилось преодолеть эти челленджи в Одноклассниках и улучшить бизнес-метрики.

3) ML на графах в e-commerce: как эффективно собирать группы на миллионах товаров. Иван Антипов (Ozon)

Community Detection — нечастый гость в бизнес-задачах. Однако в Ozon он улучшил качество склейки похожих товаров, да еще и вычисляется распределенно на графе из многих миллионов вершин. Доклад будет интересен тем, кто устал от засилья нейросетей и ностальгирует по старым добрым графовым алгоритмам.


Встречаемся уже совсем скоро на AiConf, у вас ещё есть возможность к нам присоединиться в Москве или онлайн по всему миру 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Media is too big
VIEW IN TELEGRAM
В этом видео участник программного комитета AiConf Иван Бондаренко рассказал о том, что значит для него конференция и какие секции, доклады он ждёт больше всего.

Иван — старший преподаватель и научный сотрудник Новосибирского государственного университета. Вместе со своими учениками является сооснователем стартапа «Сибирские нейросети». С 2006 до 2013 года преподавал и занимался научными исследованиями в Донецком национальном техническом университете, затем перешел в IT-индустрию и работал на различных должностях — от инженера-разработчика до специалиста по машинному обучению — в ряде компаний и университетов, таких как 2ГИС, Huawei, Global Logic, Data Monsters, МФТИ (DeepPavlov)

До AiConf осталось всего две недели. Если вы планируете к нам присоединиться, но ещё не купили билет, поторопитесь 😉

Программа конференции, расписание и билеты на сайте
👍2
Развитие нейросетей способствует шквальному развитию инструментов для них и даже появлению новых языков программирования.

Давайте посмотрим, чем Mojo отличается от Python, какие у них преимущества и недостатки. И сделаем всё это с помощью экспериментов на основе стандартных наборов данных: MNIST и Housing Prices Dataset. Обучим простую сверточную нейронную сеть, а заодно разберём один из методов машинного обучения — линейную регрессию.

Подробности в статье: https://habr.com/ru/companies/oleg-bunin/articles/843044/
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🎉 Поздравляем победителя розыгрыша офлайн-билета на AiConf, который проходил в канале Нескучный Data Science

Дмитрий @dimm_day, до встречи 🙌
🔥41
Оптимизация использования железа — важная задача для data-science инфраструктуры, которая позволяет:

- снизить расходы на оборудование и его обслуживание;
- увеличить производительность;
- снизить потребление энергии;
- увеличить скорость разработки;
- улучшить масштабируемость;
- укрепить устойчивость к сбоям.

В программе AiConf вас ждут два классных доклада с реализованными задачами ⤵️

1) Устройство и перспективы использования ML-компиляторов. Виталий Шутов (VK, ВКонтакте)

Доклад Виталия охватывает эволюцию компиляторов машинного обучения от Theano до современных решений. Рассматриваются ключевые технологии: MLIR, XLA и IREE. Подробно обсудим, как MLIR улучшает гибкость и совместимость, позволяя переиспользовать оптимизации, и как XLA ускоряет вычисления и повышает производительность моделей, учитывая гетерогенную природу вычислений. Рассмотрим конкретные примеры оптимизаций, а также перспективы и текущие исследования в области ML-компиляторов.

2) Что такое ML-платформа на базе K8s? и как в ней решены разнородные требования к квотированию и шедулингу. Тимофей Разумов (Т-Банк)

ML-платформа все чаще становится обязательной частью инфраструктуры для крупных big-tech-компаний. Тимофей расскажет, какие фреймворки помогают оркестрации и квотированию железа под обучение и инференс и почему из коробки оно не всегда оптимально.


До встречи 26 и 27 сентября в Москве на AiConf 🙌

Программа конференции, расписание и билеты на сайте
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3