Boosters.pro
2.67K subscribers
65 photos
13 files
81 links
Платформа с хакатонами по Data Science & комьюнити middle+ IT-специалистов. Тут анонсы контестов, профильные мероприятия и вакансии от топ-100 компаний России.

Чат: https://t.iss.one/+hgs_8e6NcE4yYjc6
Сайт: https://boosters.pro/
Download Telegram
VisionLabs благодарит всех за участие в MCS 2021. Gesture recognition.

Призеры соревнования:

Финальный лидерборд
1 место - @Vadik_L
2 место - @antonchikin
3 место - @anokhin_alexandr

Финальный лидерборд (60 минут)
1 место - @antonchikin
2 место - @dchacks и @egorich_m
3 место - @Vadik_L

Всего в соревновании приняли участие 57 команд. Они показали высокий уровень проработки решений: больше половины превзошли базовый алгоритм, а победители улучшили его показатели в 3,5 раза. Помимо этого, алгоритмы призеров могут распознавать жесты в реальном времени, что особенно важно, например, при использовании технологии для управления «умными» устройствами. Призовой фонд соревнования составил 750 тысяч рублей.

Соревнование проходило в рамках международного саммита Machines Can See 2021. В этом году он впервые прошёл в гибридном формате – онлайн и офлайн. Мероприятие собрало более 3000 человек из 91 страны. Среднее время просмотра выступлений составило больше двух часов.
В этом году главной темой саммита стали human-centric технологии, в фокусе которых лежит аналитика на основе силуэтов, жестов, поз, направления взгляда и других атрибутов человека без сбора и анализа персональных данных.

Записи выступлений научной части доступны на сайте machinescansee.com
Выкатили новое обновление на форум, теперь можно редактировать и удалять сообщения. Также добавлен предпросмотр изображений.
https://boosters.pro/forum/thread/forum_discussion
@antonchikin (1 место лидерборд 60 минут) очень подробно описал свое решение на форуме, поставьте лайков, вопросы можно задать в комментариях.
https://boosters.pro/forum/thread/machinescansee2021
Всем привет, у нас много обновлений на сайте: мы вакатили свой редактор статей и новую главную страницу сайта

Подробно в статье:
https://boosters.pro/forum/article/614ca47d1f7c7e11d9440865
1
HeadHunter Employer Review Competition

Компании HeadHunter и DreamJob работают в коллаборации, вместе упрощают и делают удобным поиск работы для каждого. Сейчас на сайте hh.ru можно прочитать отзывы о работодателе, которые собирает сервис dreamjob.ru. Публиковать или нет отзыв решают модераторы, есть 8 причин отклонения отзыва. Вам нужно создать модель, определяющую, будет ли опубликован отзыв и причину отклонения модерации.

Чемпионат пройдет с 30.12.2021 по 15.03.2022

Призовой фонд: 500 000 рублей

Чемпионат: https://boosters.pro/championship/HeadHunter
👍6
Изменение в описание этапов чемпионата:

Чемпионат пройдет в три этапа:
1. В первом этапе участники на протяжение 2 месяцев загружают свои решения в формате .csv таблиц.

2. Топ 20% участников первого этапа пройдут во второй этап, где им предстоит подготовить свои решения для работы в docker формате:
а) скор решений на втором этапе может быть ниже, чем у решений первого этапа;
б) участники второго этапа должны прислать организаторам код решения, с которым прошли во второй этап, до 21.02.2022 23:59 (МСК).
в) второй этап продлится неделю.

3. После окончания второго этапа участники больше не смогут отправлять новые решения. Три финальных решения всех участников второго этапа будут проверены на новых данных в течение двух недель. На основе этих проверок будет построен финальный рейтинг чемпионата.
1. Обновили ограничения на сабмит
• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 45 минут;
• размер архива: до 1GB.

2. Изменили кол-во участников проходящих во второй этап
Топ 20% (но не более топ 50 команд)
https://boosters.pro/forum/thread/headhunter_employer_review_competition

В комментариях к последнему посту на форуме публикуйте свои внешние датасеты.
Напоминаем что сделать это нужно до 23:59 МСК 15 февраля 2022.
@smirnovevgeny выложил статью на форуме по мотивам прошлогоднего конкурса от ВТБ, там описано решение Евгения и собраны публичные решения чемпионата.

https://boosters.pro/forum/article/620e82640aae516a4bea528a
Ставьте лайки
🔥7
Финальный лидерборд по первому этапу на сайте.
Во второй этап проходят 50 команд. Две команды в топ 50 пустые (33 - Konstantin Sukharev
44- Celsius), поэтому команды на лидерборде с 51 и 52 места тоже проходят (dkuzyurin и Overfitting is all you need)

Присылайте полное решение по лучшему сабмиту на [email protected] до 23.02 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.

Второй этап начнется через пару часов
Второй этап открыт.
Рейтинг считается по привату из первого этапа, паблик датасет из первого этапа завтра выложим вместе с таргетами, можно будет использовать его для дообучения.
Обратите внимание на новые фичи в кабинете загрузки, теперь есть информация по очереди на докер сервере: кол-во решений ожидающих запуска и приблизительное время ожидания.
Также теперь можно смотреть логи по упавшим сабмитам в кабинете загрузки.

Всем участникам второго этапа желаем удачи!)
new_train.csv
10.1 MB
Размеченный паблик тест первого этапа. Также доступен на сайте в разделе Данные
🔥3👍1
NLP Team Lead в Альфа-банк

👨‍💻 О вакансии

@smirnovevgeny (Chief Data Scientist & Head of ML Laboratory и многократный призер контестов на Boosters) ищет кандидата с опытом (своими руками) разработки и внедрения моделей. Направление, которое предстоит лидировать, активно развивается, на данный момент в направлении 3 DS + открыт поиск на 2 DS позиций. К концу года возможен рост направления до 10 DS.

📍 Локация: Полная удаленка, можно посещать офис в Москва, м. Комсомольская.
🔌 Вилка: 400-600k (на руки).

🥁 Предстоит развивать NLP-направление, в которое входят:

- Задачи чат-бота (интенты, NER, болталка);
- Структуризация внутренних и внешних (соц. сети) отзывов;
- Маршрутизация внутренних обращений сотрудников (HelpDesk);
- Структуризация кассовых чеков ОФД(классификация, NER, нормализация);
- Развитие NLU модуля в IVR;
- Другие nlp-задачи.

🏅 Что мы ждем

- Глубокое понимание области NLP;
- Опыт вывода в продакшн нейронных сетей;
- Технологический стек: python + :pytorch:/:tensorflow:/:keras:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git;
- Понимание основных принципов и алгоритмов классического ML;
- Опыт перевода бизнес-задач в термины ml;
- Знание SOTA архитектур;
- Опыт управления командой (рассмотрим резюме сильных senior c желанием развиваться как Team Lead).

📈 Будет плюсом

- Опыт работы с pyspark и airflow
- Топовые места в соревнованиях по машинному обучению;
- Опыт работы в крупных ит-компаниях.

🚀 Помимо ежемесячной оплаты труда вас ждет

- Отсутствие бесполезных встреч - одна встреча всей команды в неделю для планированию задач информирования и обсуждения текущих вопросов, остальная коммуникация преимущественно в slack
- Оплата участия в зарубежных конференциях + оплата обучающих курсов
- Работа в сильной команде (выпускников Физтех, ШАД, МГУ, ВШЭ);
- Постоянное развитие: регулярный внутренний и внешний обмен знаний, митапы, тренинги, конференции;
- ДМС + стоматология, страхование жизни и выезжающих за рубеж;
- Льготная процентная ставка по ипотеке.

💼 Контакты
Присылайте резюме в личку к Евгению (@smirnovevgeny ) с пометкой Boosters
🔥4👍2
Хоть пост в социальных сетях вряд ли может на что-то повлиять, мы все равно хотим написать - Boosters против войны.
Берегите себя и близких.
👍3930
Завтра 07.04 в 20-00 (мск) мы начнем пересчитывать решения на новых данных, у вас есть чуть больше чем 24 часа чтобы выбрать три решения, которые будут учтены в финальном лидерборде.

Финальный лидерборд, по нашим рассчетам, будет доступен 09.04, возможно раньше.
👍4
Финальный лидерборд HeadHunter Employer Review Competition уже на сайте
🔥7👏2😢2
🏆 Semrush Cup 1.0
Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.

💻 Задача
В Интернете ежедневно совершается огромное количество переходов на сайты с различных устройств. Эти посещения можно представить как последовательность событий, описанных набором параметров. Участникам в рамках задачи будут даны события и списки предшествующих им событий. Потребуется определить, с какого домена был совершен переход.

🕓 Расписание
11.04.2022 – 12.06.2022

💵Призовой фонд
700 000 рублей

🔗Ссылка на чемпионат
https://boosters.pro/championship/semrush_cup/
👍15
Сегодня пройдет online митап по HeadHunter Employer Review Competition

На митапе лидеры конкурса в деталях расскажут о своих находках и решениях, которые привели их к победе.

Программа:
- решение 4-ого места: Кирилл Глинский
- solo-решение на 3-е место: Александр Анохин
- решение 2-ого места команды “ML Lab hype”: Евгений Смирнов, Андрей Сон, Эдуард Янаков

В качестве бонус-трека Стас Яркин (senior ds, hh.ru) расскажет о том, как мы в hh.ru используем суммаризацию для улучшения алгоритмов матчинга
Записаться можно по ссылке:

https://hh-dev.timepad.ru/event/2017693/
👍9
Команда ML lab hype описала свое решение с которым они заняли второе место в конкурсе HeadHunter Employer Review Competition.
Подписывайтесь на канал @smirnovevgeny там много интересного)
Forwarded from Нескучный Data Science (Евгений Смирнов)
Последний штрих про соревнование от Head Hunter
Выпустили статью на habr с подробным описанием решения для тех, кому лень смотреть часовой ролик ⬆️
Подробно рассказали про данные отзывов о работодателях и их предобработку, бейзлайны и особенности файнтюнинга BERTа и конечно же про неудачные эксперименты.

P.S. как же классно, что теперь статьи на хабр необязательно писать самому) Спасибо @edyanakov
👍6
Мы ждем код от топ-20 команд лидерборда

Присылайте полное решение по лучшему сабмиту на [email protected] до 19.06 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.

Формат сообщения должен быть следующим
Название команды + место на приватном лидерборде
Размер футболки всех членов команды в формате M,L и т.п.
Адрес для получения мерча

С командами из топ-3 мы свяжемся в личку в телеграме в течение дня