🏆 Semrush Cup 1.0
Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.
💻 Задача
В Интернете ежедневно совершается огромное количество переходов на сайты с различных устройств. Эти посещения можно представить как последовательность событий, описанных набором параметров. Участникам в рамках задачи будут даны события и списки предшествующих им событий. Потребуется определить, с какого домена был совершен переход.
🕓 Расписание
11.04.2022 – 12.06.2022
💵Призовой фонд
700 000 рублей
🔗Ссылка на чемпионат
https://boosters.pro/championship/semrush_cup/
Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.
💻 Задача
В Интернете ежедневно совершается огромное количество переходов на сайты с различных устройств. Эти посещения можно представить как последовательность событий, описанных набором параметров. Участникам в рамках задачи будут даны события и списки предшествующих им событий. Потребуется определить, с какого домена был совершен переход.
🕓 Расписание
11.04.2022 – 12.06.2022
💵Призовой фонд
700 000 рублей
🔗Ссылка на чемпионат
https://boosters.pro/championship/semrush_cup/
👍15
Сегодня пройдет online митап по HeadHunter Employer Review Competition
На митапе лидеры конкурса в деталях расскажут о своих находках и решениях, которые привели их к победе.
Программа:
- решение 4-ого места: Кирилл Глинский
- solo-решение на 3-е место: Александр Анохин
- решение 2-ого места команды “ML Lab hype”: Евгений Смирнов, Андрей Сон, Эдуард Янаков
В качестве бонус-трека Стас Яркин (senior ds, hh.ru) расскажет о том, как мы в hh.ru используем суммаризацию для улучшения алгоритмов матчинга
Записаться можно по ссылке:
https://hh-dev.timepad.ru/event/2017693/
На митапе лидеры конкурса в деталях расскажут о своих находках и решениях, которые привели их к победе.
Программа:
- решение 4-ого места: Кирилл Глинский
- solo-решение на 3-е место: Александр Анохин
- решение 2-ого места команды “ML Lab hype”: Евгений Смирнов, Андрей Сон, Эдуард Янаков
В качестве бонус-трека Стас Яркин (senior ds, hh.ru) расскажет о том, как мы в hh.ru используем суммаризацию для улучшения алгоритмов матчинга
Записаться можно по ссылке:
https://hh-dev.timepad.ru/event/2017693/
hh-dev.timepad.ru
Разбор решений конкурса по машинному обучению от hh.ru+dreamjob / События на TimePad.ru
👍9
Команда ML lab hype описала свое решение с которым они заняли второе место в конкурсе HeadHunter Employer Review Competition.
Подписывайтесь на канал @smirnovevgeny там много интересного)
Подписывайтесь на канал @smirnovevgeny там много интересного)
Forwarded from Нескучный Data Science (Евгений Смирнов)
Последний штрих про соревнование от Head Hunter
Выпустили статью на habr с подробным описанием решения для тех, кому лень смотреть часовой ролик ⬆️
Подробно рассказали про данные отзывов о работодателях и их предобработку, бейзлайны и особенности файнтюнинга BERTа и конечно же про неудачные эксперименты.
P.S. как же классно, что теперь статьи на хабр необязательно писать самому) Спасибо @edyanakov
Выпустили статью на habr с подробным описанием решения для тех, кому лень смотреть часовой ролик ⬆️
Подробно рассказали про данные отзывов о работодателях и их предобработку, бейзлайны и особенности файнтюнинга BERTа и конечно же про неудачные эксперименты.
P.S. как же классно, что теперь статьи на хабр необязательно писать самому) Спасибо @edyanakov
Хабр
Как мы участвовали в чемпионате по DS длиной 3,5 месяца
В марте 2021 года HeadHunter купил портал Dream Job и позже дополнительно встроил интерфейс оценки работодателя на свой сайт. Видимо, количество отзывов резко увеличилось настолько, что их стало...
👍6
Мы ждем код от топ-20 команд лидерборда
Присылайте полное решение по лучшему сабмиту на [email protected] до 19.06 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.
Формат сообщения должен быть следующим
Название команды + место на приватном лидерборде
Размер футболки всех членов команды в формате M,L и т.п.
Адрес для получения мерча
С командами из топ-3 мы свяжемся в личку в телеграме в течение дня
Присылайте полное решение по лучшему сабмиту на [email protected] до 19.06 23:59. Полное решение это значит, что мы сможем повторить решение участника от начала до конца.
Формат сообщения должен быть следующим
Название команды + место на приватном лидерборде
Размер футболки всех членов команды в формате M,L и т.п.
Адрес для получения мерча
С командами из топ-3 мы свяжемся в личку в телеграме в течение дня
Завершился Semrush Cup 1.0
1 место – Madgnome @trifonov864
2 место – AlexanderDudin @CyberTrain
3 место – Banan @Grossmend
Всего в соревновании зарегистрировалось более 300 команд. Спасибо всем за участие!
Статьи с описанием призовых решений скоро появятся на нашем форуме. Мы сообщим об этом дополнительно.
Благодарим орагнизатора соревнований – международную IT-компанию Semrush. Подробнее о самой компании и открытых вакансиях можно почитать здесь https://careers.semrush.com/en/
1 место – Madgnome @trifonov864
2 место – AlexanderDudin @CyberTrain
3 место – Banan @Grossmend
Всего в соревновании зарегистрировалось более 300 команд. Спасибо всем за участие!
Статьи с описанием призовых решений скоро появятся на нашем форуме. Мы сообщим об этом дополнительно.
Благодарим орагнизатора соревнований – международную IT-компанию Semrush. Подробнее о самой компании и открытых вакансиях можно почитать здесь https://careers.semrush.com/en/
🔥13👍1
hh.ru приглашает принять участие в их втором ML-чемпионате, участникам предлагается решить задачу Sequential рекомендаций, а именно: по последовательности событий внутри пользовательских сессий предсказать вакансию, на которую пользователь откликнется в своей следующей сессии.
Надеюсь, что мы скрасим ваши новогодние каникулы. Всех с наступающим!
https://boosters.pro/championship/hh_recsys/
Надеюсь, что мы скрасим ваши новогодние каникулы. Всех с наступающим!
https://boosters.pro/championship/hh_recsys/
🔥30👍1
Ограничения на сабмит для второго этапа:
• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.
В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python
• vCPU: 8;
• MEM: 62 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.
В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python
GitHub
GitHub - Kaggle/docker-python: Kaggle Python docker image
Kaggle Python docker image. Contribute to Kaggle/docker-python development by creating an account on GitHub.
Финальный лидерборд по первому этапу на сайте. Во второй этап проходит 35 команд. Сабмиты во второй этап откроются 1 марта.
👍4
Формат финального этапа:
Решение должно посылаться в .zip архиве. Запускаемый файл - script.py (убедитесь, что он находится в корне архива, некоторое ПО при архивации создает дополнительную папку).
В архиве могут находиться другие файлы, используемые вашим решением (например, модель). Предсказания следует сохранять в ./answers.pq.
Формат сэмпл сабмита с бейзлайноми доступен в разделе "Данные".
В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python.
Контейнер запускается со следующими опциями:
docker run \
--cpus="8.0" \
-v {workspace_dir}/:/workspace/ \
-v {testing_data}:/workspace/data/:ro \
-w /workspace/ \
--memory 60g \
boostersgpu \
python script.py 1>{workspace_dir}/output1.txt 2>${workspace_dir}/output2.txt
Внутри контейнера доступа к сети нет, модули подгрузить не получится.
Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
.
├── data
│ └── test.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда
Свои файлы можно положить рядом с script.py.
Ограничения на сабмит для второго этапа:
• vCPU: 8;
• MEM: 96 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.
Решение должно посылаться в .zip архиве. Запускаемый файл - script.py (убедитесь, что он находится в корне архива, некоторое ПО при архивации создает дополнительную папку).
В архиве могут находиться другие файлы, используемые вашим решением (например, модель). Предсказания следует сохранять в ./answers.pq.
Формат сэмпл сабмита с бейзлайноми доступен в разделе "Данные".
В задаче используется снэпшот образа на основе https://github.com/Kaggle/docker-python.
Контейнер запускается со следующими опциями:
docker run \
--cpus="8.0" \
-v {workspace_dir}/:/workspace/ \
-v {testing_data}:/workspace/data/:ro \
-w /workspace/ \
--memory 60g \
boostersgpu \
python script.py 1>{workspace_dir}/output1.txt 2>${workspace_dir}/output2.txt
Внутри контейнера доступа к сети нет, модули подгрузить не получится.
Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
.
├── data
│ └── test.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда
Свои файлы можно положить рядом с script.py.
Ограничения на сабмит для второго этапа:
• vCPU: 8;
• MEM: 96 GB;
• GPU: Nvidia Tesla v100;
• gpuMEM: 32gb;
• время выполнения: 80 минут;
• размер архива: до 3GB.
GitHub
GitHub - Kaggle/docker-python: Kaggle Python docker image
Kaggle Python docker image. Contribute to Kaggle/docker-python development by creating an account on GitHub.
train_second_stage.pq и vacs_second_stage.pq добавлены на сервер.
Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
├── data
│ └── test.pq
└── train_second_stage.pq
└── vacs_second_stage.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда
Расположение файлов внутри докер контейнера с запущенным примером сабмита:
/workspace# tree --filelimit 26
.
├── data
│ └── test.pq
└── train_second_stage.pq
└── vacs_second_stage.pq
├── script.py
├── user_file1
├── user_file2
└── user_folder1
└── answers.pq // - сабмит записывать сюда
Сейчас в первой задаче на сайте опять отображатеся публичный рейтинг, а не приватный. Приватный появится после окончания чемпионата.
Список команд второго этапа
madgnome
Last second
antklen
Anatoly
Мы команда просто класс
stason
ignorance
Андрей Кузнецов
дАлматинцы
Новичок
Илья Кулешов
Yaroslav Khnykov
слон - elephant
Team 42NA
ajnre
Artem Voronov
Ambitious
hh_24_try
Stas Chistyakov
simpleCode
learning2rank
NAALOH4
CrackerJack
ML train
sa-matveev
kvzharikov
CONS
barboskina
AILAB
чиби
RandomRec
Nikita Baramiia
RSexp
John Galt
Evgenii
Список команд второго этапа
madgnome
Last second
antklen
Anatoly
Мы команда просто класс
stason
ignorance
Андрей Кузнецов
дАлматинцы
Новичок
Илья Кулешов
Yaroslav Khnykov
слон - elephant
Team 42NA
ajnre
Artem Voronov
Ambitious
hh_24_try
Stas Chistyakov
simpleCode
learning2rank
NAALOH4
CrackerJack
ML train
sa-matveev
kvzharikov
CONS
barboskina
AILAB
чиби
RandomRec
Nikita Baramiia
RSexp
John Galt
Evgenii
❤2
Мы временно приостановили прием новых сабмитов. По плану у нас:
1. Добавить еще одну машину.
2. Добавить implicit в докер.
3. После возобновления второго этапа уменьшить количество сабмитов в день до 2, если всем чатом увидим, что можно поднять до 3, то поднимем.
Все дни, пока мы будем делать 1 и 2 пункты (2-3 дня), новые сабмиты приниматься не будут. Мы добавим эти дни к финальному дедлайну. Все сабмиты, что сейчас в очереди, досчитаются.
1. Добавить еще одну машину.
2. Добавить implicit в докер.
3. После возобновления второго этапа уменьшить количество сабмитов в день до 2, если всем чатом увидим, что можно поднять до 3, то поднимем.
Все дни, пока мы будем делать 1 и 2 пункты (2-3 дня), новые сабмиты приниматься не будут. Мы добавим эти дни к финальному дедлайну. Все сабмиты, что сейчас в очереди, досчитаются.
🔥3👍2😱2❤1🐳1
Сабмиты снова открыты.
1. Чемпионат продлен до 24 марта, 18:00 мск.
2. Сейчас два GPU и implicit добавлен в докер.
3. Сейчас у всех будет по 2 сабмита в день. Если увидим, что очередей совсем нет, то добавим еще один завтра вечером.
Всем удачи!
1. Чемпионат продлен до 24 марта, 18:00 мск.
2. Сейчас два GPU и implicit добавлен в докер.
3. Сейчас у всех будет по 2 сабмита в день. Если увидим, что очередей совсем нет, то добавим еще один завтра вечером.
Всем удачи!
👍2
Продолжаем чемпионат на https://boosters.world/
- Чемпионат продлен до 28 марта 15:00 мск
- На сайте нет картинок и нельзя скачать данные для тренировки, завтра продублируем данные сюда.
- Чемпионат продлен до 28 марта 15:00 мск
- На сайте нет картинок и нельзя скачать данные для тренировки, завтра продублируем данные сюда.
hh_recsys_submission1.zip
1.2 KB
Сэмпл сабмит.
Также все данные для второго этапа можно скачать с основного домена.
https://boosters.pro/championship/hh_recsys/data/the_final_stage
Также все данные для второго этапа можно скачать с основного домена.
https://boosters.pro/championship/hh_recsys/data/the_final_stage
Всем привет!
Как и обещали, возвращаемся с информацией о проектах с Changellenge >>! Прямо сейчас коллеги ищут опытных тимлидов-разработчиков в команду Авито — нужно руководить командой, участвовать в развитии продукта и писать код 20% рабочего времени.
Почему в Авито классно? Во-первых, здесь любят опенсорс и используют современную инфраструктуру и собственную платформу для тестов. Во-вторых, есть четкая матрица компетенций, чтобы карьерный рост был предсказуемым. Ну и базовые айтишные бонусы: удаленка по всему миру, ДМС, корпоративная техника.
Попасть в команду можно уже в марте — достаточно пройти два собеса. Делимся ссылкой, если заинтересовало: https://u.to/yzobIg
Реклама, ООО «Авито Тех», ИНН 9710089440
Как и обещали, возвращаемся с информацией о проектах с Changellenge >>! Прямо сейчас коллеги ищут опытных тимлидов-разработчиков в команду Авито — нужно руководить командой, участвовать в развитии продукта и писать код 20% рабочего времени.
Почему в Авито классно? Во-первых, здесь любят опенсорс и используют современную инфраструктуру и собственную платформу для тестов. Во-вторых, есть четкая матрица компетенций, чтобы карьерный рост был предсказуемым. Ну и базовые айтишные бонусы: удаленка по всему миру, ДМС, корпоративная техника.
Попасть в команду можно уже в марте — достаточно пройти два собеса. Делимся ссылкой, если заинтересовало: https://u.to/yzobIg
Реклама, ООО «Авито Тех», ИНН 9710089440
❤8🔥3
Друзья, привет!
Знаем, тут есть крутые специалисты в алгоритмической торговле, даже основатели одних из лучших компаний в этой сфере. Этот пост для тех, кто хочет начать развиваться в трейдинге — делитесь с друзьями, кому будет полезно!
Недавно коллеги из Changellenge >> начали сотрудничать со Sparkland — партнером более 20 бирж по всему миру, разработчиком алгоритмов и маркетмейкером. И нашли для вас уникальную вакансию: релокация в Дубай и зарплата до $5500 для кодеров с опытом от года.
По задачам: торговать, делать бэктесты, анализировать алгоритмы и разрабатывать свои. Ну и перенимать опыт у коллег со всего мира. Это позиция на стыке аналитики, IT и финансов, подойдет для тех, кто интересуется фондовым рынком и алгоритмами. Переезд в ОАЭ и резидентскую визу оплачивают, поэтому для желающих релоцироваться — отличная возможность.
Оставляйте заявку, если интересно, ребята будут рады познакомиться ближе на интервью: clck.ru/3K5fiq
Знаем, тут есть крутые специалисты в алгоритмической торговле, даже основатели одних из лучших компаний в этой сфере. Этот пост для тех, кто хочет начать развиваться в трейдинге — делитесь с друзьями, кому будет полезно!
Недавно коллеги из Changellenge >> начали сотрудничать со Sparkland — партнером более 20 бирж по всему миру, разработчиком алгоритмов и маркетмейкером. И нашли для вас уникальную вакансию: релокация в Дубай и зарплата до $5500 для кодеров с опытом от года.
По задачам: торговать, делать бэктесты, анализировать алгоритмы и разрабатывать свои. Ну и перенимать опыт у коллег со всего мира. Это позиция на стыке аналитики, IT и финансов, подойдет для тех, кто интересуется фондовым рынком и алгоритмами. Переезд в ОАЭ и резидентскую визу оплачивают, поэтому для желающих релоцироваться — отличная возможность.
Оставляйте заявку, если интересно, ребята будут рады познакомиться ближе на интервью: clck.ru/3K5fiq
🔥7❤5🌭1
Привет, друзья!
Мы уже рассказывали про Weekend Offer от Авито, сейчас ищут backend-разработчиков с опытом от трех лет. Отличная возможность поменять место работы и переучиться на Go, если сейчас владеете другим языком 😎
Напоминаем, почему стоит попробовать попасть в Авито — здесь используют современную инфраструктуру и предлагают поработать над уникальными фичами, включая разработку ML-моделей, VPN-решений и системы DDoS-защиты. Еще здесь есть четкая матрица компетенций для прозрачного роста, удаленка по всему миру, реально широкий ДМС и корпоративная техника.
Приступить к новой работе можно уже в апреле, поэтому делимся ссылкой — отбор вот-вот начнется: clck.ru/3LFwDX
Мы уже рассказывали про Weekend Offer от Авито, сейчас ищут backend-разработчиков с опытом от трех лет. Отличная возможность поменять место работы и переучиться на Go, если сейчас владеете другим языком 😎
Напоминаем, почему стоит попробовать попасть в Авито — здесь используют современную инфраструктуру и предлагают поработать над уникальными фичами, включая разработку ML-моделей, VPN-решений и системы DDoS-защиты. Еще здесь есть четкая матрица компетенций для прозрачного роста, удаленка по всему миру, реально широкий ДМС и корпоративная техника.
Приступить к новой работе можно уже в апреле, поэтому делимся ссылкой — отбор вот-вот начнется: clck.ru/3LFwDX
🔥15❤5🤯2🍓1