Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.4K subscribers
2.41K photos
121 videos
64 files
4.86K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
Как сократить время деплоя алгоритмов с двух месяцев до двух дней?

Сегодня мы хотим познакомить вас vektonn.io — высокопроизводительной векторной поисковой системой для ваших приложений в области анализа данных.

vektonn.io помогает управлять жизненным циклом векторов и радикально сокращает время вывода моделей в продакшен.

Проект развивается разработчиками Контура и неоднократно использовался для решения внутренних задач (например, для определения проблемы пользователя по обращению в чате, классификации банковских транзакций по персональным категориям или поиска товара в товарно-учётных системах по названию из накладной).
Известны случаи, когда время деплоя алгоритмов сокращалось с двух месяцев до двух дней.

vektonn.io
— обеспечивает поддержку как плотных, так и разреженных векторов
— поддерживает точные и приближенные алгоритмы kNN (AkNN)
— предоставляет масштабируемую архитектуру для обработки данных объемом в сотни ГБ
— обеспечивает хранение и версионирование моделей и датасетов
— распространяется бесплатно и находится под лицензией Apache, поэтому вы можете бесплатно и свободно использовать его в коммерческих целях
— на практике доказал свою эффективность, существенно сокращая time-to-market моделей
— является open source проектом и потому вы сможете присоединиться к его развитию

Узнать подробности о проекте и приступить к работе можно на сайте — https://vektonn.io
Документация, примеры и quick start — https://vektonn.github.io/vektonn/
Вопросы-предложения можно публиковать в сообществе — https://t.iss.one/vektonn
Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение pinned «Как сократить время деплоя алгоритмов с двух месяцев до двух дней? Сегодня мы хотим познакомить вас vektonn.io — высокопроизводительной векторной поисковой системой для ваших приложений в области анализа данных. vektonn.io помогает управлять жизненным циклом…»
🤖 Решаем задачи машинного обучения с помощью алгоритма градиентного бустинга

Градиентный бустинг (Gradient Boosting) – один из самых эффективных инструментов для решения задач машинного обучения, в особенности на соревнованиях Kaggle. Чтобы научиться правильно его применять, разберем подробнее лежащие в основе алгоритма процессы.

https://proglib.io/sh/EfGw4Bm3xW
This media is not supported in your browser
VIEW IN TELEGRAM
В 🤖robot_dreams стартует курс для аналитиков, разработчиков, начинающих Data Scientists и всех, кто знает базовый синтаксис Python и хочет использовать этот язык для работы с большими массивами данных.

За 16 практических онлайн-занятий вы:
▪️научитесь работать с разными типами и структурами данных
▪️освоите 11 библиотек Python для анализа и визуализации
▪️разберетесь в построении простых ML-моделей
▪️будете решать задачи прогнозирования, классификации и кластеризации данных

Регистрируйтесь на курс, чтобы открыть новый подход в работе с большими данными
https://bit.ly/3nQ50JF
🧩 5 интересных головоломок и задач, чтобы отвлечься от рутины и немного пошевелить извилинами (выпуск 6)

В очередной еженедельной подборке мы подготовили 5 новых интересных алгоритмических, логических и математических задачек для отдыха и прокачки мозгов.

https://proglib.io/sh/50fOumxwsC
Vektonn.io — эффективное решение, радикально сокращаюшее время вывода моделей в продакшен

— Поддержка плотных и разреженных векторов
Точные и приближенные алгоритмы kNN (AkNN)
Масштабируемая архитектура для обработки данных объемом в сотни ГБ
— Хранение и версионирование моделей и датасетов

Предоставляется бесплатно и находится под лицензией Apache, поэтому вы можете свободно использовать его в коммерческих целях уже сегодня.

Документация, примеры и quick start — https://vektonn.github.io/vektonn/
Вопросы, предложения, отзывчивая поддержка — https://t.iss.one/vektonn
👍1
📈 5 сложных навыков, которые позволят экспоненциально расти в программировании

Разберем несколько сложных навыков, которые обязан иметь на вооружении каждый продуктивный программист, желающий быстрого карьерного роста.

https://proglib.io/sh/WEUHOcTkAN
Всем привет!

«Библиотека программиста» находится в поиске менеджера по маркетингу в образовательный проект proglib.academy (направление EdTech).

Мы обучаем всех желающих навыкам в IT-сфере и внедряем навыки программирования в текущей карьере. В нашу команду ищем интернет-маркетолога, который вместе с нами будет расти и развивать проект proglib.academy.

Вместе с нами ты будешь:

– Создавать digital-стратегии в рекламных каналах для бренда proglib.academy с целью привлечения новых учеников как на существующие продукты, так и на новые направления.
– Заниматься медиапланированием и прогнозировать эффективности РК.
– Создавать эффективные связки: продукт-аудитория-посыл и креатив-посадочная страница.
– Тестировать новые аудитории/связки/настройки и форматы рекламы.
– Анализировать привлекаемый трафик и работать с конверсиями до заявки.

Самое интересное:
Вы будете сами влиять на свой доход и зарабатывать на результате.
Мы абсолютно открыты к разным идеям и предложениям. Предлагай любую идею или конструктивно критикуй — твое мнение не останется без внимания и может все изменить.

Немного о важном:
Мы ищем сотрудника на полный рабочий день, возможен гибридный формат работы.

А откликнуться и узнать подробнее можно здесь.
🔥 Kubernetes отлично подойдет на роль центрального звена платформы для работы с данными. Не слышали о таком подходе?

На VK Kubernetes Conference мы покажем, что K8s - это технология, которая не только способна помирить Dev, Sec и Ops, но и может быть интересна Data Scientist и инженерам данных.

Когда: 9 декабря, 10:00 MSK
📍 Регистрация: https://cutt.ly/ZT99Qgz

Из докладов вы узнаете:
🔹 Какие инструменты дата инженера можно запустить в K8s и какие тонкости стоит при этом учитывать.
🔹Сравнение классических и облачных архитектур при работе с данными.
🔹 Инструменты для построения DWH и Data Lake в облаках.

В программе — доклады, воркшопы и, конечно же, нетворкинг, во время которого у самых активных зрителей будет возможность поделиться собственным крутым опытом!


👉 Зарегистрироваться: https://cutt.ly/ZT99Qgz
Как думать о корреляции? Это наклон регрессии после стандартизации x и y.

https://proglib.io/w/0bdf4448
🚀8 декабря в 19.00 МСК проведём бесплатный вебинар «Как математика используется в анализе данных?» с дата-сайентистом Артуром Сапрыкиным, специалистом по разработке систем, анализирующих тексты и аудио.

Вы узнаете, какую математику нужно знать аналитику данных для решения продуктовых задач. Вместе с вами рассмотрим на практике, как математика помогает в поиске быстрых и эффективных решений для обработки данных.

👨‍💻За 15 минут до начала вебинара всем участникам отправим напоминание.

Регистрация по ссылке.
Что можно и нельзя контролировать при поиске работы в Data Science.

https://proglib.io/w/85331942
🚀8 декабря в 19.00 МСК проведём бесплатный вебинар «Как математика используется в анализе данных?» с дата-сайентистом Артуром Сапрыкиным, специалистом по разработке систем, анализирующих тексты и аудио.

Вы узнаете, какую математику нужно знать аналитику данных для решения продуктовых задач. Вместе с вами рассмотрим на практике, как математика помогает в поиске быстрых и эффективных решений для обработки данных.

👨‍💻За 15 минут до начала вебинара всем участникам отправим напоминание.

Регистрация по ссылке.