Boosters.pro

@smirnovevgeny выложил статью на форуме по мотивам прошлогоднего конкурса от ВТБ, там описано решение Евгения и собраны публичные решения чемпионата.

https://boosters.pro/forum/article/620e82640aae516a4bea528a
Ставьте лайки

🔥7

1.13K views20:13

Boosters.pro

Финальный лидерборд по первому этапу на сайте.
Во второй этап проходят 50 команд. Две команды в топ 50 пустые (33 - Konstantin Sukharev
44- Celsius), поэтому команды на лидерборде с 51 и 52 места тоже проходят (dkuzyurin и Overfitting is all you need)

Присылайте полное решение по лучшему сабмиту на [email protected] до 23.02 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.

Второй этап начнется через пару часов

967 views15:19

Boosters.pro

Второй этап открыт.
Рейтинг считается по привату из первого этапа, паблик датасет из первого этапа завтра выложим вместе с таргетами, можно будет использовать его для дообучения.
Обратите внимание на новые фичи в кабинете загрузки, теперь есть информация по очереди на докер сервере: кол-во решений ожидающих запуска и приблизительное время ожидания.
Также теперь можно смотреть логи по упавшим сабмитам в кабинете загрузки.

Всем участникам второго этапа желаем удачи!)

1.06K viewsedited 20:33

Boosters.pro

new_train.csv

10.1 MB

Размеченный паблик тест первого этапа. Также доступен на сайте в разделе Данные

🔥3👍1

1.1K views08:07

Boosters.pro

NLP Team Lead в Альфа-банк

👨‍💻 О вакансии

@smirnovevgeny (Chief Data Scientist & Head of ML Laboratory и многократный призер контестов на Boosters) ищет кандидата с опытом (своими руками) разработки и внедрения моделей. Направление, которое предстоит лидировать, активно развивается, на данный момент в направлении 3 DS + открыт поиск на 2 DS позиций. К концу года возможен рост направления до 10 DS.

📍 Локация: Полная удаленка, можно посещать офис в Москва, м. Комсомольская.
🔌 Вилка: 400-600k (на руки).

🥁 Предстоит развивать NLP-направление, в которое входят:

- Задачи чат-бота (интенты, NER, болталка);
- Структуризация внутренних и внешних (соц. сети) отзывов;
- Маршрутизация внутренних обращений сотрудников (HelpDesk);
- Структуризация кассовых чеков ОФД(классификация, NER, нормализация);
- Развитие NLU модуля в IVR;
- Другие nlp-задачи.

🏅 Что мы ждем

- Глубокое понимание области NLP;
- Опыт вывода в продакшн нейронных сетей;
- Технологический стек: python + :pytorch:/:tensorflow:/:keras:, LightGBM/XGBoost/CatBoost, sklearn, pandas, numpy + sql + git;
- Понимание основных принципов и алгоритмов классического ML;
- Опыт перевода бизнес-задач в термины ml;
- Знание SOTA архитектур;
- Опыт управления командой (рассмотрим резюме сильных senior c желанием развиваться как Team Lead).

📈 Будет плюсом

- Опыт работы с pyspark и airflow
- Топовые места в соревнованиях по машинному обучению;
- Опыт работы в крупных ит-компаниях.

🚀 Помимо ежемесячной оплаты труда вас ждет

- Отсутствие бесполезных встреч - одна встреча всей команды в неделю для планированию задач информирования и обсуждения текущих вопросов, остальная коммуникация преимущественно в slack
- Оплата участия в зарубежных конференциях + оплата обучающих курсов
- Работа в сильной команде (выпускников Физтех, ШАД, МГУ, ВШЭ);
- Постоянное развитие: регулярный внутренний и внешний обмен знаний, митапы, тренинги, конференции;
- ДМС + стоматология, страхование жизни и выезжающих за рубеж;
- Льготная процентная ставка по ипотеке.

💼 Контакты
Присылайте резюме в личку к Евгению (@smirnovevgeny ) с пометкой Boosters

🔥4👍2

1.48K views12:57

Boosters.pro

Хоть пост в социальных сетях вряд ли может на что-то повлиять, мы все равно хотим написать - Boosters против войны.
Берегите себя и близких.

👍39❤30

1.93K viewsedited 20:21

Boosters.pro

Завтра 07.04 в 20-00 (мск) мы начнем пересчитывать решения на новых данных, у вас есть чуть больше чем 24 часа чтобы выбрать три решения, которые будут учтены в финальном лидерборде.

Финальный лидерборд, по нашим рассчетам, будет доступен 09.04, возможно раньше.

👍4

1.84K views16:48

Boosters.pro

Финальный лидерборд HeadHunter Employer Review Competition уже на сайте

🔥7👏2😢2

4.71K views16:52

Boosters.pro

🏆 Semrush Cup 1.0
Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.

💻 Задача
В Интернете ежедневно совершается огромное количество переходов на сайты с различных устройств. Эти посещения можно представить как последовательность событий, описанных набором параметров. Участникам в рамках задачи будут даны события и списки предшествующих им событий. Потребуется определить, с какого домена был совершен переход.

🕓 Расписание
11.04.2022 – 12.06.2022

💵Призовой фонд
700 000 рублей

🔗Ссылка на чемпионат
https://boosters.pro/championship/semrush_cup/

👍15

2.65K views08:51

Boosters.pro

Сегодня пройдет online митап по HeadHunter Employer Review Competition

На митапе лидеры конкурса в деталях расскажут о своих находках и решениях, которые привели их к победе.

Программа:
- решение 4-ого места: Кирилл Глинский
- solo-решение на 3-е место: Александр Анохин
- решение 2-ого места команды “ML Lab hype”: Евгений Смирнов, Андрей Сон, Эдуард Янаков

В качестве бонус-трека Стас Яркин (senior ds, hh.ru) расскажет о том, как мы в hh.ru используем суммаризацию для улучшения алгоритмов матчинга
Записаться можно по ссылке:

https://hh-dev.timepad.ru/event/2017693/

hh-dev.timepad.ru

Разбор решений конкурса по машинному обучению от hh.ru+dreamjob / События на TimePad.ru

👍9

1.86K views08:18

Boosters.pro

Команда ML lab hype описала свое решение с которым они заняли второе место в конкурсе HeadHunter Employer Review Competition.
Подписывайтесь на канал @smirnovevgeny там много интересного)

1.48K views21:02

Boosters.pro

Forwarded from Нескучный Data Science (Евгений Смирнов)

Последний штрих про соревнование от Head Hunter
Выпустили статью на habr с подробным описанием решения для тех, кому лень смотреть часовой ролик ⬆️
Подробно рассказали про данные отзывов о работодателях и их предобработку, бейзлайны и особенности файнтюнинга BERTа и конечно же про неудачные эксперименты.

P.S. как же классно, что теперь статьи на хабр необязательно писать самому) Спасибо @edyanakov

Хабр

Как мы участвовали в чемпионате по DS длиной 3,5 месяца

В марте 2021 года HeadHunter купил портал Dream Job и позже дополнительно встроил интерфейс оценки работодателя на свой сайт. Видимо, количество отзывов резко увеличилось настолько, что их стало...

👍6

1.38K views21:02

Boosters.pro

Мы ждем код от топ-20 команд лидерборда

Присылайте полное решение по лучшему сабмиту на [email protected] до 19.06 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.

Формат сообщения должен быть следующим
Название команды + место на приватном лидерборде
Размер футболки всех членов команды в формате M,L и т.п.
Адрес для получения мерча

С командами из топ-3 мы свяжемся в личку в телеграме в течение дня

2.01K views12:27

Boosters.pro

Завершился Semrush Cup 1.0

1 место – Madgnome @trifonov864
2 место – AlexanderDudin @CyberTrain
3 место – Banan @Grossmend

Всего в соревновании зарегистрировалось более 300 команд. Спасибо всем за участие!
Статьи с описанием призовых решений скоро появятся на нашем форуме. Мы сообщим об этом дополнительно.

Благодарим орагнизатора соревнований – международную IT-компанию Semrush. Подробнее о самой компании и открытых вакансиях можно почитать здесь https://careers.semrush.com/en/

🔥13👍1

3.02K views16:21

Boosters.pro

hh.ru приглашает принять участие в их втором ML-чемпионате, участникам предлагается решить задачу Sequential рекомендаций, а именно: по последовательности событий внутри пользовательских сессий предсказать вакансию, на которую пользователь откликнется в своей следующей сессии.

Надеюсь, что мы скрасим ваши новогодние каникулы. Всех с наступающим!

https://boosters.pro/championship/hh_recsys/

🔥30👍1

7.47K views17:25

Boosters.pro

Ограничения на сабмит для второго этапа:

• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.

В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python

GitHub

GitHub - Kaggle/docker-python: Kaggle Python docker image

Kaggle Python docker image. Contribute to Kaggle/docker-python development by creating an account on GitHub.

1.95K views13:36

Boosters.pro

Финальный лидерборд по первому этапу на сайте. Во второй этап проходит 35 команд. Сабмиты во второй этап откроются 1 марта.

👍4

1.26K views22:17

Boosters.pro

Сабмиты во второй этап открыты, всем удачи

1.03K views22:12

Boosters.pro

Формат финального этапа:

Решение должно посылаться в .zip архиве. Запускаемый файл - script.py (убедитесь, что он находится в корне архива, некоторое ПО при архивации создает дополнительную папку).
В архиве могут находиться другие файлы, используемые вашим решением (например, модель). Предсказания следует сохранять в ./answers.pq.
Формат сэмпл сабмита с бейзлайноми доступен в разделе "Данные".

В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python.

Контейнер запускается со следующими опциями:

docker run \
--cpus="8.0" \
-v {workspace_dir}/:/workspace/ \
-v {testing_data}:/workspace/data/:ro \
-w /workspace/ \
--memory 60g \
boostersgpu \
python script.py 1>{workspace_dir}/output1.txt 2>${workspace_dir}/output2.txt

Внутри контейнера доступа к сети нет, модули подгрузить не получится.

Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
.
├── data
│ └── test.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда

Свои файлы можно положить рядом с script.py.

Ограничения на сабмит для второго этапа:

• vCPU: 8;
• MEM: 96 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.

GitHub

GitHub - Kaggle/docker-python: Kaggle Python docker image

Kaggle Python docker image. Contribute to Kaggle/docker-python development by creating an account on GitHub.

1.27K viewsedited 22:17

Boosters.pro

train_second_stage.pq и vacs_second_stage.pq добавлены на сервер.

Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
├── data
│ └── test.pq
└── train_second_stage.pq
└── vacs_second_stage.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда

1.29K viewsedited 23:09

Boosters.pro

Сейчас в первой задаче на сайте опять отображатеся публичный рейтинг, а не приватный. Приватный появится после окончания чемпионата.
Список команд второго этапа

madgnome
Last second
antklen
Anatoly
Мы команда просто класс
stason
ignorance
Андрей Кузнецов
дАлматинцы
Новичок
Илья Кулешов
Yaroslav Khnykov
слон - elephant
Team 42NA
ajnre
Artem Voronov
Ambitious
hh_24_try
Stas Chistyakov
simpleCode
learning2rank
NAALOH4
CrackerJack
ML train
sa-matveev
kvzharikov
CONS
barboskina
AILAB
чиби
RandomRec
Nikita Baramiia
RSexp
John Galt
Evgenii

❤2

1.6K views08:52

About

Blog

Apps

Platform