Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
#вакансия #аналитикданных #DataAnalyst
#СПб #СанктПетербург

Вакансия: Аналитик данных/ Data Analyst
Компания: ЕДИНЫЙ ЦУПИС
Локация: Санкт-Петербург
Занятость: полная
Опыт работы: от 2 лет

ЕДИНЫЙ ЦУПИС - предоставляет собой современный и качественный платежный сервис по переводу денежных средств, а также обеспечивает надежную и безопасную платежную инфраструктуру для своих клиентов. Проект входит в ТОП-5 российских платежных компаний по совокупному обороту электронных денег.
В связи с расширением мы находимся в поиске Аналитика данных

Чем будете заниматься:
•Обследование источников данных;
•Описание алгоритмов обработки данных;
•Формирование отчетов и информационных панелей с помощью BI-системы
•Формирование аналитических выгрузок данных, в соответствии с запросами профильных подразделений.

Что ждем от вас:
•Работа с Tableau на уровне уверенного пользователя.
•Знание основ математической статистики и математического аппарата анализа данных.
•Составление SQL-запросов, понимание особенностей работы колоночных баз данных (ClickHouse, Vertica).
•Умение и желания разбираться в предметной области и консультировать коллег.

Что мы можем предложить вам:
•Комфортабельный офис в историческом центре Санкт-Петербурга (пешая доступность от м. Пл. Восстания). Гибридный формат работы (офис/удаленная работа на период пандемии).
•Официальное оформление, согласно ТК РФ, "белая" зарботная плата.
•Уровень з/п обсуждаем с каждым соискателем индивидуально.
•Корпоративные подарки.
•Оформление ДМС после успешного прохождения испытательного срока.
•Офисный врач, возможность ежегодной вакцинации против гриппа/COVID19.
•Корпоративное обучение английскому языку, возможность принятия участия в профильных конференциях и мероприятиях.
•Обеды, печеньки/шоколадки/фрукты в течение рабочего дня, поздние ужины из ресторана Italy.
•Возможность работать в профессиональной, сплоченной команде.

На все вопросы отвечу, пишите: @AsyaTimofeeva
Как сократить время деплоя алгоритмов с двух месяцев до двух дней?

Сегодня мы хотим познакомить вас vektonn.io — высокопроизводительной векторной поисковой системой для ваших приложений в области анализа данных.

vektonn.io помогает управлять жизненным циклом векторов и радикально сокращает время вывода моделей в продакшен.

Проект развивается разработчиками Контура и неоднократно использовался для решения внутренних задач (например, для определения проблемы пользователя по обращению в чате, классификации банковских транзакций по персональным категориям или поиска товара в товарно-учётных системах по названию из накладной).
Известны случаи, когда время деплоя алгоритмов сокращалось с двух месяцев до двух дней.

vektonn.io
— обеспечивает поддержку как плотных, так и разреженных векторов
— поддерживает точные и приближенные алгоритмы kNN (AkNN)
— предоставляет масштабируемую архитектуру для обработки данных объемом в сотни ГБ
— обеспечивает хранение и версионирование моделей и датасетов
— распространяется бесплатно и находится под лицензией Apache, поэтому вы можете бесплатно и свободно использовать его в коммерческих целях
— на практике доказал свою эффективность, существенно сокращая time-to-market моделей
— является open source проектом и потому вы сможете присоединиться к его развитию

Узнать подробности о проекте и приступить к работе можно на сайте — https://vektonn.io
Документация, примеры и quick start — https://vektonn.github.io/vektonn/
Вопросы-предложения можно публиковать в сообществе — https://t.iss.one/vektonn
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Как сократить время деплоя алгоритмов с двух месяцев до двух дней? Сегодня мы хотим познакомить вас vektonn.io — высокопроизводительной векторной поисковой системой для ваших приложений в области анализа данных. vektonn.io помогает управлять жизненным циклом…»
🤖 Решаем задачи машинного обучения с помощью алгоритма градиентного бустинга

Градиентный бустинг (Gradient Boosting) – один из самых эффективных инструментов для решения задач машинного обучения, в особенности на соревнованиях Kaggle. Чтобы научиться правильно его применять, разберем подробнее лежащие в основе алгоритма процессы.

https://proglib.io/sh/EfGw4Bm3xW
This media is not supported in your browser
VIEW IN TELEGRAM
В 🤖robot_dreams стартует курс для аналитиков, разработчиков, начинающих Data Scientists и всех, кто знает базовый синтаксис Python и хочет использовать этот язык для работы с большими массивами данных.

За 16 практических онлайн-занятий вы:
▪️научитесь работать с разными типами и структурами данных
▪️освоите 11 библиотек Python для анализа и визуализации
▪️разберетесь в построении простых ML-моделей
▪️будете решать задачи прогнозирования, классификации и кластеризации данных

Регистрируйтесь на курс, чтобы открыть новый подход в работе с большими данными
https://bit.ly/3nQ50JF
🧩 5 интересных головоломок и задач, чтобы отвлечься от рутины и немного пошевелить извилинами (выпуск 6)

В очередной еженедельной подборке мы подготовили 5 новых интересных алгоритмических, логических и математических задачек для отдыха и прокачки мозгов.

https://proglib.io/sh/50fOumxwsC
Vektonn.io — эффективное решение, радикально сокращаюшее время вывода моделей в продакшен

— Поддержка плотных и разреженных векторов
Точные и приближенные алгоритмы kNN (AkNN)
Масштабируемая архитектура для обработки данных объемом в сотни ГБ
— Хранение и версионирование моделей и датасетов

Предоставляется бесплатно и находится под лицензией Apache, поэтому вы можете свободно использовать его в коммерческих целях уже сегодня.

Документация, примеры и quick start — https://vektonn.github.io/vektonn/
Вопросы, предложения, отзывчивая поддержка — https://t.iss.one/vektonn
👍1
📈 5 сложных навыков, которые позволят экспоненциально расти в программировании

Разберем несколько сложных навыков, которые обязан иметь на вооружении каждый продуктивный программист, желающий быстрого карьерного роста.

https://proglib.io/sh/WEUHOcTkAN
Всем привет!

«Библиотека программиста» находится в поиске менеджера по маркетингу в образовательный проект proglib.academy (направление EdTech).

Мы обучаем всех желающих навыкам в IT-сфере и внедряем навыки программирования в текущей карьере. В нашу команду ищем интернет-маркетолога, который вместе с нами будет расти и развивать проект proglib.academy.

Вместе с нами ты будешь:

– Создавать digital-стратегии в рекламных каналах для бренда proglib.academy с целью привлечения новых учеников как на существующие продукты, так и на новые направления.
– Заниматься медиапланированием и прогнозировать эффективности РК.
– Создавать эффективные связки: продукт-аудитория-посыл и креатив-посадочная страница.
– Тестировать новые аудитории/связки/настройки и форматы рекламы.
– Анализировать привлекаемый трафик и работать с конверсиями до заявки.

Самое интересное:
Вы будете сами влиять на свой доход и зарабатывать на результате.
Мы абсолютно открыты к разным идеям и предложениям. Предлагай любую идею или конструктивно критикуй — твое мнение не останется без внимания и может все изменить.

Немного о важном:
Мы ищем сотрудника на полный рабочий день, возможен гибридный формат работы.

А откликнуться и узнать подробнее можно здесь.
🔥 Kubernetes отлично подойдет на роль центрального звена платформы для работы с данными. Не слышали о таком подходе?

На VK Kubernetes Conference мы покажем, что K8s - это технология, которая не только способна помирить Dev, Sec и Ops, но и может быть интересна Data Scientist и инженерам данных.

Когда: 9 декабря, 10:00 MSK
📍 Регистрация: https://cutt.ly/ZT99Qgz

Из докладов вы узнаете:
🔹 Какие инструменты дата инженера можно запустить в K8s и какие тонкости стоит при этом учитывать.
🔹Сравнение классических и облачных архитектур при работе с данными.
🔹 Инструменты для построения DWH и Data Lake в облаках.

В программе — доклады, воркшопы и, конечно же, нетворкинг, во время которого у самых активных зрителей будет возможность поделиться собственным крутым опытом!


👉 Зарегистрироваться: https://cutt.ly/ZT99Qgz
Как думать о корреляции? Это наклон регрессии после стандартизации x и y.

https://proglib.io/w/0bdf4448