Happy Data Year - отчёт
Участники должны были предсказать индекс популярности геолокации для размещения устройства банкоматной сети.
Немного статистики:
292 участника
4418 сабмитов
Победители:
1 место - Константин Николаев
2 место - Константин Гришанов
3 место - Кирилл Хрыльченко
Презентации топ-3 по ссылке: https://drive.google.com/drive/folders/1q8XAVKYmYmI5BDI-nEdwVZ4fIUJnggHW?usp=sharing
Видеозапись финала: https://www.youtube.com/watch?v=RvbN40hCKjU
Фотографии с финала: https://vk.com/album-117459195_260103814
Росбанк благодарит всех за участие и приглашает в команду Data Lab:
В сферу ответственности команды Data Lab входит:
- применение современных методов науки о данных для развития банка, улучшение действующих моделей в банке и создание новых.
- исследование новых источников данных, извлечение пользы из внешних источников (Big data)
- проверка и формулирование бизнес гипотез, оценка бизнес эффекта
- продвижение культуры работы с данными, развитие компетенции
Над какими задачами работает сейчас Data Lab:
- Расширение кредитования за счет анализа внутренних и внешних данных (предсказание дохода, места работы)
- Упрощение процесса получения и одобрения кредита для клиента («5 полей» в заявке)
- Приоритезация входящего лид потока
- Персонализация (best time to call, персонализация коммуникаций)
- Оценка share of wallet клиента на основе внешних данных
- Оптимизация жалоб и обращений клиентов с учетом их влияния на уровень сервиса и отток
- Предиктивные модели в HR
Обязанности:
- Применение алгоритмов машинного обучения для решения поставленных бизнес-задач
- Взаимодействие с заказчиком в процессе постановки и реализации задачи
- Презентация финального отчета по итогам анализа Заказчику
- Контроль результатов на этапе имплементации
Умения и навыки:
- Программирование на языке Python или R (опционально SAS (Base, Macro, EM, EG))
- Опыт написания сложных SQL- запросов.
- Знание Теории вероятности и математической статистики
- Знание основных ML алгоритмов (регрессия, деревья решений, random forest, gradient tree boosting, нейронные сети)
- Желательно опыт работы с big data.
- Желательно наличие сертификатов в области машинного обучения
- Желательно участие в чемпионатах по анализу данных.
Присылайте ваше резюме на [email protected] или на [email protected].
Участники должны были предсказать индекс популярности геолокации для размещения устройства банкоматной сети.
Немного статистики:
292 участника
4418 сабмитов
Победители:
1 место - Константин Николаев
2 место - Константин Гришанов
3 место - Кирилл Хрыльченко
Презентации топ-3 по ссылке: https://drive.google.com/drive/folders/1q8XAVKYmYmI5BDI-nEdwVZ4fIUJnggHW?usp=sharing
Видеозапись финала: https://www.youtube.com/watch?v=RvbN40hCKjU
Фотографии с финала: https://vk.com/album-117459195_260103814
Росбанк благодарит всех за участие и приглашает в команду Data Lab:
В сферу ответственности команды Data Lab входит:
- применение современных методов науки о данных для развития банка, улучшение действующих моделей в банке и создание новых.
- исследование новых источников данных, извлечение пользы из внешних источников (Big data)
- проверка и формулирование бизнес гипотез, оценка бизнес эффекта
- продвижение культуры работы с данными, развитие компетенции
Над какими задачами работает сейчас Data Lab:
- Расширение кредитования за счет анализа внутренних и внешних данных (предсказание дохода, места работы)
- Упрощение процесса получения и одобрения кредита для клиента («5 полей» в заявке)
- Приоритезация входящего лид потока
- Персонализация (best time to call, персонализация коммуникаций)
- Оценка share of wallet клиента на основе внешних данных
- Оптимизация жалоб и обращений клиентов с учетом их влияния на уровень сервиса и отток
- Предиктивные модели в HR
Обязанности:
- Применение алгоритмов машинного обучения для решения поставленных бизнес-задач
- Взаимодействие с заказчиком в процессе постановки и реализации задачи
- Презентация финального отчета по итогам анализа Заказчику
- Контроль результатов на этапе имплементации
Умения и навыки:
- Программирование на языке Python или R (опционально SAS (Base, Macro, EM, EG))
- Опыт написания сложных SQL- запросов.
- Знание Теории вероятности и математической статистики
- Знание основных ML алгоритмов (регрессия, деревья решений, random forest, gradient tree boosting, нейронные сети)
- Желательно опыт работы с big data.
- Желательно наличие сертификатов в области машинного обучения
- Желательно участие в чемпионатах по анализу данных.
Присылайте ваше резюме на [email protected] или на [email protected].
Boosters.pro ver 2.0
Мы ради представить вам наш обновленный сайт.
Что нового?
а) https://boosters.pro/rating
1. Общий рейтинг. Рейтинг строится по каждой отдельной задаче чемпионата, не учитываются хакатоны и задачи формата "Песок"
2. Медали. Присуждаются участникам за лучшие результаты в чемпионате. Количество медалей, присуждаемых за соревнование, варьируется в зависимости от количества участников. Медали за хакатоны и чемпионаты из раздела "Песок" не присуждаются.
3. Статусы. Теперь каждый пользователь имеет статус, присуждаются статусы за определенное количество медалей.
б)Чемпионаты.
1. Для участие в чемпионате теперь нужно пройти верификацию мобильного номера.
2. Командные чемпионаты. Теперь все контесты на нашем сайте будут командными (от 1 до 5 человек в команде). Все члены команд могут отправлять сабмиты, также появилась возможность объединять команды (за 7 дней до конца чемпионата это возможность будет закрываться)
3. Новый кабинет загрузки сабмитов. Теперь можно оставить комментарий к решению, в любой момент скачать его, посмотреть кто его загрузил и выбрать какой сабмит будет учитываться на привате. Ну и теперь мы не сжигаем попытки за ошибочные решения 🙂
Никакой новый версии бы не было, если бы не наши прекрасные разработчики @kravets303 и @qzark1. Если видите баги, можете сразу писать им в личку: Никите за бэк, Алёне за фронт)
Надеемся вам у нас понравится)
Ваша команда Boosters.pro
Мы ради представить вам наш обновленный сайт.
Что нового?
а) https://boosters.pro/rating
1. Общий рейтинг. Рейтинг строится по каждой отдельной задаче чемпионата, не учитываются хакатоны и задачи формата "Песок"
2. Медали. Присуждаются участникам за лучшие результаты в чемпионате. Количество медалей, присуждаемых за соревнование, варьируется в зависимости от количества участников. Медали за хакатоны и чемпионаты из раздела "Песок" не присуждаются.
3. Статусы. Теперь каждый пользователь имеет статус, присуждаются статусы за определенное количество медалей.
б)Чемпионаты.
1. Для участие в чемпионате теперь нужно пройти верификацию мобильного номера.
2. Командные чемпионаты. Теперь все контесты на нашем сайте будут командными (от 1 до 5 человек в команде). Все члены команд могут отправлять сабмиты, также появилась возможность объединять команды (за 7 дней до конца чемпионата это возможность будет закрываться)
3. Новый кабинет загрузки сабмитов. Теперь можно оставить комментарий к решению, в любой момент скачать его, посмотреть кто его загрузил и выбрать какой сабмит будет учитываться на привате. Ну и теперь мы не сжигаем попытки за ошибочные решения 🙂
Никакой новый версии бы не было, если бы не наши прекрасные разработчики @kravets303 и @qzark1. Если видите баги, можете сразу писать им в личку: Никите за бэк, Алёне за фронт)
Надеемся вам у нас понравится)
Ваша команда Boosters.pro
Rekko Challenge.
Соревнование по машинному обучению от онлайн-кинотеатра Okko.
Вам предстоит предсказать топ 20 наиболее релевантных для пользователя идентификаторов контента.
Подробности на https://okko.boosters.pro/
Соревнование по машинному обучению от онлайн-кинотеатра Okko.
Вам предстоит предсказать топ 20 наиболее релевантных для пользователя идентификаторов контента.
Подробности на https://okko.boosters.pro/
Мы нашли ошибку в формировании тестовых данных. В них не попала часть пользователей и тест оказался смещённым. Поэтому мы вынуждены изменить:
- public и private тестовые данные
- test_users.json
Текущие решения были пересчитаны с новыми данными и скоры по ним, естественно, просели, т.к. теперь покрывают только небольшую часть пользователей.
Что необходимо сделать:
1. Скачать новые данные, либо только test_users.json (https://s3.eu-central-1.amazonaws.com/okko-public/rekko/test_users.json), скоро паблик данные обновятся и на сайте
2. Пересчитать ответ вашего алгоритма для новых тестовых пользователей.
Если решение честное и не опирается на исходное смещение в данных, скор не должен сильно измениться.
Просим прощения за причинённые неудобства. Всем текущим участникам конкурса будут единовременно доступны дополнительные 30 посылок.
- public и private тестовые данные
- test_users.json
Текущие решения были пересчитаны с новыми данными и скоры по ним, естественно, просели, т.к. теперь покрывают только небольшую часть пользователей.
Что необходимо сделать:
1. Скачать новые данные, либо только test_users.json (https://s3.eu-central-1.amazonaws.com/okko-public/rekko/test_users.json), скоро паблик данные обновятся и на сайте
2. Пересчитать ответ вашего алгоритма для новых тестовых пользователей.
Если решение честное и не опирается на исходное смещение в данных, скор не должен сильно измениться.
Просим прощения за причинённые неудобства. Всем текущим участникам конкурса будут единовременно доступны дополнительные 30 посылок.
Обновления на сайте:
1. Появилась возможность задать никнейм, который будет отображаться во всех рейтингах. Логин по прежнему не может быть изменён.
2. Для пользователей, регистрировавшихся через социальные, обязательно заполнение поля "Почта" для участия в чемпионатах.
1. Появилась возможность задать никнейм, который будет отображаться во всех рейтингах. Логин по прежнему не может быть изменён.
2. Для пользователей, регистрировавшихся через социальные, обязательно заполнение поля "Почта" для участия в чемпионатах.
Близится середина конкурса и у нас по этому поводу есть две новости:
1. Топ-30 участников по окончании чемпионата получат футболки.
2. Паблик скор текущей продуктовой модели "out of competition" доступен во вкладке "Рейтинг".
1. Топ-30 участников по окончании чемпионата получат футболки.
2. Паблик скор текущей продуктовой модели "out of competition" доступен во вкладке "Рейтинг".
Всем привет, у нас новый раздел - "Вакансии"
- Вакансии будем публиковать по трём направлениям: Data, Python, Product Analytics.
- Желательно чтобы автор вакансии был непосредственным руководителем или работал в команде/отделе, в которую ищется человек, так как наш сервис подразумевает публичные вопросы о работе от потенциальных кандидатов.
- Ждём ваши вакансии, ваши вопросы авторам вакансий и надеемся сможем помочь кому-то найти топовую работу)
https://boosters.pro/vacancy
- Вакансии будем публиковать по трём направлениям: Data, Python, Product Analytics.
- Желательно чтобы автор вакансии был непосредственным руководителем или работал в команде/отделе, в которую ищется человек, так как наш сервис подразумевает публичные вопросы о работе от потенциальных кандидатов.
- Ждём ваши вакансии, ваши вопросы авторам вакансий и надеемся сможем помочь кому-то найти топовую работу)
https://boosters.pro/vacancy
Дамы и господа, не забываем, что сегодня ночью в 23:59 по Московскому времени станут недоступны отправка решений и выбор приватных решений в REKKO CHALLENGE. Рекомендуем удостовериться, что выбраны корректные решения в количестве 3-х штук. Также напоминаем, что если не выбрано ни одно решение, то в зачет будут выбираться три решения с лучшим публичным результатом, а из них - лучшее с приватным.
Командам попавшим в топ-30 Rekko полагаются футболки с символикой Окко. Они с удовольствием пришлют вам их по удобному адресу. Присылайте на [email protected] название команды, размер футболки и полный адрес (с индексом).
Песочница соревнования по машинному обучению от онлайн-кинотеатра Okko.
На предоставленном тренировочном множестве обучить рекомендательную систему и предсказать топ 20 наиболее релевантных для пользователя идентификаторов контента. Обучающее множество собрано за N дней (N > 60), тестовое множество — за последующие 60 дней.
Чемпионат по ссылке:
https://boosters.pro/championship/rekko_sand/overview
На предоставленном тренировочном множестве обучить рекомендательную систему и предсказать топ 20 наиболее релевантных для пользователя идентификаторов контента. Обучающее множество собрано за N дней (N > 60), тестовое множество — за последующие 60 дней.
Чемпионат по ссылке:
https://boosters.pro/championship/rekko_sand/overview
Первое docker-соревнование на Boosters.pro.
ID R&D представляет конкурс по распознаванию звуковых записей. Участникам предстоит определить к какому классу принадлежат аудиозаписи: оригинальные (human) или синтезированные записи (spoof). В качестве решения принимается код и запускается в docker-контейнере.
Чемпионат по ссылке: https://boosters.pro/championship/idrnd_antispoof/overview
ID R&D представляет конкурс по распознаванию звуковых записей. Участникам предстоит определить к какому классу принадлежат аудиозаписи: оригинальные (human) или синтезированные записи (spoof). В качестве решения принимается код и запускается в docker-контейнере.
Чемпионат по ссылке: https://boosters.pro/championship/idrnd_antispoof/overview
Топовая вакансия от @Alexander_Dyakonov
Computer Vision Engineer / Data scientist CV
Компания: ООО "Алгомост"
Вилка: 150-200к
Подробнее: https://boosters.pro/vacancy
Ждём 👍 😎🚑 и комменты
Computer Vision Engineer / Data scientist CV
Компания: ООО "Алгомост"
Вилка: 150-200к
Подробнее: https://boosters.pro/vacancy
Ждём 👍 😎🚑 и комменты
Чемпионат от ID R&D приостановлен на 2 дня.
За это время мы пересчитаем все старые сабмиты на новой метрике и новых данных.
Чемпионат будет продлён на 10-14 дней, точно напишем к возобновлению чемпионата.
Всем участникам сорри за неудобства.
За это время мы пересчитаем все старые сабмиты на новой метрике и новых данных.
Чемпионат будет продлён на 10-14 дней, точно напишем к возобновлению чемпионата.
Всем участникам сорри за неудобства.
В чемпионате открыт приём решений. Сейчас посчитаны все сабмиты выше бейзлана. По мере пересчета сабмитов ниже бейзлана будет обновляться лидерборд.
Решения принимаются до 29 июля 23-59 МСК.
Решения принимаются до 29 июля 23-59 МСК.
Пока вычисляются последние отправленные решения. Возможность выбирать приватные решения включится после 10:00.
Можно выбирать приватные сабмиты. Напоминаем, что всего доступно три решения для привата.
Digital Reputation Challenge.
Чемпионат по анализу данных от цифрового агентства Digital Reputation. Определите свойства характера человека по его цифровому следу.
Призовой фонд: 200 000 рублей
Расписание: 10 сентября - 10 октября
Чемпионат: https://boosters.pro/championship/digital_reputation_challenge/overview
Чемпионат по анализу данных от цифрового агентства Digital Reputation. Определите свойства характера человека по его цифровому следу.
Призовой фонд: 200 000 рублей
Расписание: 10 сентября - 10 октября
Чемпионат: https://boosters.pro/championship/digital_reputation_challenge/overview
