ВТБ и «Сколково» приглашают вас принять участие в чемпионате по анализу данных.
Вас ждут 2 задачи:
Goodsification — определение категории товара по данным из смоделированных чеков.
Brandefine — извлечение бренда товара из названия продукта.
— Общий призовой фонд 2 000 000 рублей
— Уникальный датасет из 8 000 000 смоделированных чеков
— 2 актуальные задачи для оттачивания своих навыков
Регистрируйтесь: https://data-fusion.ru/
Также чемпионат доступен на Boosters.pro
Вас ждут 2 задачи:
Goodsification — определение категории товара по данным из смоделированных чеков.
Brandefine — извлечение бренда товара из названия продукта.
— Общий призовой фонд 2 000 000 рублей
— Уникальный датасет из 8 000 000 смоделированных чеков
— 2 актуальные задачи для оттачивания своих навыков
Регистрируйтесь: https://data-fusion.ru/
Также чемпионат доступен на Boosters.pro
Участники Data Fusion Contest, для вашего удобства мы сделали Slack чат, присоединиться можно по ссылке:
https://join.slack.com/t/datafusioncontest/shared_invite/zt-lia6ul9v-qgcObWkInOV4OwC6vKeFjw
За логи теперь отвественный наш юный дата сайнтист @RFRrtr. Пишите ему в личку название команды и номер задачи, он будет присылать логи раз в день.
https://join.slack.com/t/datafusioncontest/shared_invite/zt-lia6ul9v-qgcObWkInOV4OwC6vKeFjw
За логи теперь отвественный наш юный дата сайнтист @RFRrtr. Пишите ему в личку название команды и номер задачи, он будет присылать логи раз в день.
Boosters.pro pinned «Участники Data Fusion Contest, для вашего удобства мы сделали Slack чат, присоединиться можно по ссылке: https://join.slack.com/t/datafusioncontest/shared_invite/zt-lia6ul9v-qgcObWkInOV4OwC6vKeFjw За логи теперь отвественный наш юный дата сайнтист @RFRrtr.…»
Участники Data Fusion Contest, мы очень обеспкоены временем ожидания в очереди во второй задаче. В ближайшие дни мы представим вам план и сроки по решению этой проблемы. Спасибо за понимание)
Участники Data Fusion Contest, мы продумали план по сокращению очереди в задаче Brandefine.
Сейчас на вход решению подается полный датасет.
Мы планируем подавать только паблик датасет, а после окончания чемпионата перезапустить решения на приватной части датасета. Также мы планируем сократить паблик датасет на 15%. Допустимое время выполнения будет сокращено до 39 минут.
Также мы планируем добавить в тестовый датасет бренды, которые невозможно заполнить с помощью списка.
Все решения во второй задаче будут пересчитаны на новом датасете, не пересчитанным решениям будет присвоен «0». Сабмиты будут пересчитываться по ночам или в свободное время. У новых сабмитов приоритет выполнения всегда будет выше.
Сейчас на вход решению подается полный датасет.
Мы планируем подавать только паблик датасет, а после окончания чемпионата перезапустить решения на приватной части датасета. Также мы планируем сократить паблик датасет на 15%. Допустимое время выполнения будет сокращено до 39 минут.
Также мы планируем добавить в тестовый датасет бренды, которые невозможно заполнить с помощью списка.
Все решения во второй задаче будут пересчитаны на новом датасете, не пересчитанным решениям будет присвоен «0». Сабмиты будут пересчитываться по ночам или в свободное время. У новых сабмитов приоритет выполнения всегда будет выше.
Участники Data Fusion Contest!
Мы видим ваши решения, среди них много интересных вариантов, но есть и те, которые в задаче выделения брендов в топе лидерборда не используют каких-либо алгоритмов машинного обучения.
Чтобы мотивировать участников соревнования исследовать новые ML-подходы в решении задачи, опираясь на п. 2.10 Правил, мы вводим уточнения в алгоритм подсчёта метрики качества.
Новая метрика:
1. Вычисляются accuracy на:
1.1 На всей выборке - A
1.2 На брендах, которые невозможно найти с помощью списка - Аt
2. Итоговое качество Af вычисляется:
Если At/A > 0.5, то Af = A
Иначе Af = 0.7*A + 0.3*At
Хотим отметить, что изменения не должны повлиять на нетривиальные или комбинированные решения. Пересчет на новой метрике и новых данных начнется сегодня.
Мы видим ваши решения, среди них много интересных вариантов, но есть и те, которые в задаче выделения брендов в топе лидерборда не используют каких-либо алгоритмов машинного обучения.
Чтобы мотивировать участников соревнования исследовать новые ML-подходы в решении задачи, опираясь на п. 2.10 Правил, мы вводим уточнения в алгоритм подсчёта метрики качества.
Новая метрика:
1. Вычисляются accuracy на:
1.1 На всей выборке - A
1.2 На брендах, которые невозможно найти с помощью списка - Аt
2. Итоговое качество Af вычисляется:
Если At/A > 0.5, то Af = A
Иначе Af = 0.7*A + 0.3*At
Хотим отметить, что изменения не должны повлиять на нетривиальные или комбинированные решения. Пересчет на новой метрике и новых данных начнется сегодня.
Номинация публичных решений Data Fusion Contest.
1) Участники, желающие принять участие в номинации, присылают свои нотбуки в личку @RFRrtr с номером задачи и названием команды,а также присылают свой аккаунт на гитхабе
2) Участники, желающие проголосовать за лучшее публичное решение, присылают свой аккаунт на гитхабе, а также почту или мобильный номер с которым зарегистрированы на чемпионат в личку @RFRrtr
3) Все проекты выкладываются на https://github.com/data-fusion-vtb/data_fusion.git, 21 марта мы подведём итоги, оценивать результаты будем по количеству звёздочек на проекте
Ждём ваше решения, всем удачи)
1) Участники, желающие принять участие в номинации, присылают свои нотбуки в личку @RFRrtr с номером задачи и названием команды,а также присылают свой аккаунт на гитхабе
2) Участники, желающие проголосовать за лучшее публичное решение, присылают свой аккаунт на гитхабе, а также почту или мобильный номер с которым зарегистрированы на чемпионат в личку @RFRrtr
3) Все проекты выкладываются на https://github.com/data-fusion-vtb/data_fusion.git, 21 марта мы подведём итоги, оценивать результаты будем по количеству звёздочек на проекте
Ждём ваше решения, всем удачи)
Подсчёт сабмитов в первой задаче уже закончился. Выбирать приватные решения можно до 20:30 23 марта.
Напоминаем, что выбрать можно 3 решения
Напоминаем, что выбрать можно 3 решения
Подсчёт сабмитов во второй задаче уже закончился. Выбирать приватные решения можно до 20:30 24 марта.
Напоминаем, что выбрать можно 3 решения
Напоминаем, что выбрать можно 3 решения
Первая международная конференция по анализу данных Data Fusion от ВТБ и «Сколково»
31 марта с 16:00 до 17:10 на конференции пройдет разбор решений участников из топа лидерборда.
————————————
Представители бизнеса и специалисты Data Science обсудят возможности перспективного подхода в работе с большими данными и технологиями искусственного интеллекта.
🧑💻 100 спикеров из России и других стран
🚀 5 000 участников со всего мира
На конференции:
- Спикеры поделятся опытом применения технологий Data Fusion:
- Первые результаты применения концепции Data Fusion;
- Как Data Fusion подход помогает создавать новые продукты;
На конференции Data Fusion мы подведем итоги и объявим победителей масштабного онлайн-соревнования для специалистов Data Science — Data Fusion Contest с призовым фондом 2 млн рублей.
Конференция пройдет в онлайн-формате, участие бесплатное.
Регистрируйтесь и увидимся на конференции:
https://data-fusion.ru/conference/
31 марта с 16:00 до 17:10 на конференции пройдет разбор решений участников из топа лидерборда.
————————————
Представители бизнеса и специалисты Data Science обсудят возможности перспективного подхода в работе с большими данными и технологиями искусственного интеллекта.
🧑💻 100 спикеров из России и других стран
🚀 5 000 участников со всего мира
На конференции:
- Спикеры поделятся опытом применения технологий Data Fusion:
- Первые результаты применения концепции Data Fusion;
- Как Data Fusion подход помогает создавать новые продукты;
На конференции Data Fusion мы подведем итоги и объявим победителей масштабного онлайн-соревнования для специалистов Data Science — Data Fusion Contest с призовым фондом 2 млн рублей.
Конференция пройдет в онлайн-формате, участие бесплатное.
Регистрируйтесь и увидимся на конференции:
https://data-fusion.ru/conference/
Решение соревнований в data science является одним из наиболее эффективных подходов к обучению, так как помогает моментально переводить теоретические знания в практическую плоскость. В песочнице вы можете попробовать свои силы в решении реальных бизнес-задач и прокачаться в рекомендательных системах, computer vision и работе с карточными транзакциями. @smirnovevgeny выпустил статью, в которой рассказывается как можно решить задачу из песочницы(https://boosters.pro/championship/alfabattle2_sand/overview) с помощью нейронных сетей.
Обращаем ваше внимание, что данные из соревнования можно использовать в исследовательских целях, в том числе для написания дипломных и курсовых работ. https://habr.com/ru/company/alfa/blog/551130/
Обращаем ваше внимание, что данные из соревнования можно использовать в исследовательских целях, в том числе для написания дипломных и курсовых работ. https://habr.com/ru/company/alfa/blog/551130/
Хабр
Нейросетевой подход к моделированию карточных транзакций
Клиент банка может совершить до нескольких тысяч транзакций по дебетовым и кредитным картам за год. Банк же в свою очередь сохраняет всю история пользовательских операций на своей стороне. В итоге...
MCS 2021. Gesture recognition
VisionLabs в рамках саммита MachinesCanSee 2021 приглашает принять участие в соревновании по анализу данных. Вам предстоит создать алгоритм распознавания одного из 6 жестов (Stop, Victory, Mute, Ok, Like, Dislike)
Чемпионат - https://boosters.pro/championship/machinescansee2021/overview
VisionLabs в рамках саммита MachinesCanSee 2021 приглашает принять участие в соревновании по анализу данных. Вам предстоит создать алгоритм распознавания одного из 6 жестов (Stop, Victory, Mute, Ok, Like, Dislike)
Чемпионат - https://boosters.pro/championship/machinescansee2021/overview
VisionLabs благодарит всех за участие в MCS 2021. Gesture recognition.
Призеры соревнования:
Финальный лидерборд
1 место - @Vadik_L
2 место - @antonchikin
3 место - @anokhin_alexandr
Финальный лидерборд (60 минут)
1 место - @antonchikin
2 место - @dchacks и @egorich_m
3 место - @Vadik_L
Всего в соревновании приняли участие 57 команд. Они показали высокий уровень проработки решений: больше половины превзошли базовый алгоритм, а победители улучшили его показатели в 3,5 раза. Помимо этого, алгоритмы призеров могут распознавать жесты в реальном времени, что особенно важно, например, при использовании технологии для управления «умными» устройствами. Призовой фонд соревнования составил 750 тысяч рублей.
Соревнование проходило в рамках международного саммита Machines Can See 2021. В этом году он впервые прошёл в гибридном формате – онлайн и офлайн. Мероприятие собрало более 3000 человек из 91 страны. Среднее время просмотра выступлений составило больше двух часов.
В этом году главной темой саммита стали human-centric технологии, в фокусе которых лежит аналитика на основе силуэтов, жестов, поз, направления взгляда и других атрибутов человека без сбора и анализа персональных данных.
Записи выступлений научной части доступны на сайте machinescansee.com
Призеры соревнования:
Финальный лидерборд
1 место - @Vadik_L
2 место - @antonchikin
3 место - @anokhin_alexandr
Финальный лидерборд (60 минут)
1 место - @antonchikin
2 место - @dchacks и @egorich_m
3 место - @Vadik_L
Всего в соревновании приняли участие 57 команд. Они показали высокий уровень проработки решений: больше половины превзошли базовый алгоритм, а победители улучшили его показатели в 3,5 раза. Помимо этого, алгоритмы призеров могут распознавать жесты в реальном времени, что особенно важно, например, при использовании технологии для управления «умными» устройствами. Призовой фонд соревнования составил 750 тысяч рублей.
Соревнование проходило в рамках международного саммита Machines Can See 2021. В этом году он впервые прошёл в гибридном формате – онлайн и офлайн. Мероприятие собрало более 3000 человек из 91 страны. Среднее время просмотра выступлений составило больше двух часов.
В этом году главной темой саммита стали human-centric технологии, в фокусе которых лежит аналитика на основе силуэтов, жестов, поз, направления взгляда и других атрибутов человека без сбора и анализа персональных данных.
Записи выступлений научной части доступны на сайте machinescansee.com
Выкатили новое обновление на форум, теперь можно редактировать и удалять сообщения. Также добавлен предпросмотр изображений.
https://boosters.pro/forum/thread/forum_discussion
https://boosters.pro/forum/thread/forum_discussion
@antonchikin (1 место лидерборд 60 минут) очень подробно описал свое решение на форуме, поставьте лайков, вопросы можно задать в комментариях.
https://boosters.pro/forum/thread/machinescansee2021
https://boosters.pro/forum/thread/machinescansee2021
Всем привет, у нас много обновлений на сайте: мы вакатили свой редактор статей и новую главную страницу сайта
Подробно в статье:
https://boosters.pro/forum/article/614ca47d1f7c7e11d9440865
Подробно в статье:
https://boosters.pro/forum/article/614ca47d1f7c7e11d9440865
❤1
HeadHunter Employer Review Competition
Компании HeadHunter и DreamJob работают в коллаборации, вместе упрощают и делают удобным поиск работы для каждого. Сейчас на сайте hh.ru можно прочитать отзывы о работодателе, которые собирает сервис dreamjob.ru. Публиковать или нет отзыв решают модераторы, есть 8 причин отклонения отзыва. Вам нужно создать модель, определяющую, будет ли опубликован отзыв и причину отклонения модерации.
Чемпионат пройдет с 30.12.2021 по 15.03.2022
Призовой фонд: 500 000 рублей
Чемпионат: https://boosters.pro/championship/HeadHunter
Компании HeadHunter и DreamJob работают в коллаборации, вместе упрощают и делают удобным поиск работы для каждого. Сейчас на сайте hh.ru можно прочитать отзывы о работодателе, которые собирает сервис dreamjob.ru. Публиковать или нет отзыв решают модераторы, есть 8 причин отклонения отзыва. Вам нужно создать модель, определяющую, будет ли опубликован отзыв и причину отклонения модерации.
Чемпионат пройдет с 30.12.2021 по 15.03.2022
Призовой фонд: 500 000 рублей
Чемпионат: https://boosters.pro/championship/HeadHunter
👍6
Изменение в описание этапов чемпионата:
Чемпионат пройдет в три этапа:
1. В первом этапе участники на протяжение 2 месяцев загружают свои решения в формате .csv таблиц.
2. Топ 20% участников первого этапа пройдут во второй этап, где им предстоит подготовить свои решения для работы в docker формате:
а) скор решений на втором этапе может быть ниже, чем у решений первого этапа;
б) участники второго этапа должны прислать организаторам код решения, с которым прошли во второй этап, до 21.02.2022 23:59 (МСК).
в) второй этап продлится неделю.
3. После окончания второго этапа участники больше не смогут отправлять новые решения. Три финальных решения всех участников второго этапа будут проверены на новых данных в течение двух недель. На основе этих проверок будет построен финальный рейтинг чемпионата.
Чемпионат пройдет в три этапа:
1. В первом этапе участники на протяжение 2 месяцев загружают свои решения в формате .csv таблиц.
2. Топ 20% участников первого этапа пройдут во второй этап, где им предстоит подготовить свои решения для работы в docker формате:
а) скор решений на втором этапе может быть ниже, чем у решений первого этапа;
б) участники второго этапа должны прислать организаторам код решения, с которым прошли во второй этап, до 21.02.2022 23:59 (МСК).
в) второй этап продлится неделю.
3. После окончания второго этапа участники больше не смогут отправлять новые решения. Три финальных решения всех участников второго этапа будут проверены на новых данных в течение двух недель. На основе этих проверок будет построен финальный рейтинг чемпионата.
1. Обновили ограничения на сабмит
• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 45 минут;
• размер архива: до 1GB.
2. Изменили кол-во участников проходящих во второй этап
Топ 20% (но не более топ 50 команд)
• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 45 минут;
• размер архива: до 1GB.
2. Изменили кол-во участников проходящих во второй этап
Топ 20% (но не более топ 50 команд)
https://boosters.pro/forum/thread/headhunter_employer_review_competition
В комментариях к последнему посту на форуме публикуйте свои внешние датасеты.
Напоминаем что сделать это нужно до 23:59 МСК 15 февраля 2022.
В комментариях к последнему посту на форуме публикуйте свои внешние датасеты.
Напоминаем что сделать это нужно до 23:59 МСК 15 февраля 2022.
@smirnovevgeny выложил статью на форуме по мотивам прошлогоднего конкурса от ВТБ, там описано решение Евгения и собраны публичные решения чемпионата.
https://boosters.pro/forum/article/620e82640aae516a4bea528a
Ставьте лайки
https://boosters.pro/forum/article/620e82640aae516a4bea528a
Ставьте лайки
🔥7