Аналитик данных
6.05K subscribers
215 photos
27 videos
2 files
199 links
Аналитика данных, Дата Сеанс

@workakkk - по всем вопросам
Download Telegram
⭐️ Data Science разбор реальной задачи с собеседования. Прогнозирование оттока клиентов.

Смотреть
Данные
Ноутбук

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3
⚡️💼 Репозиторий с планом подготовки к алгоритмическому интервью


Эксперт составил минимально необходимый план для любого уровня подготовки. Репозиторий включает в себя ссылки на ресурсы для практики, ссылки на курсы, статьи и книги.

Аналитика данных
👍52
🖥🖥 Решаем задачи на стажировку аналитика в яндекс. Подключаем CHATGPT и другие ИИ модели!

https://www.youtube.com/watch?v=I_6exF29t0k

#youtube #стажировка #яндекс

@data_analysis_ml
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥1
🔥 Яндекс представил YandexGPT 3 Lite

Сегодня Яндекс открыл доступ к YandexGPT Lite третьего поколения. Облегченная версия этой LLM доступна через API в Yandex Cloud. Новая модель полезна в сценариях, где важна скорость ответа: например, её можно использовать в чат-ботах, для проверки орфографии или анализа данных. Это оптимальная по цене и качеству генеративная модель Яндекса для решения рутинных задач.

Новая модель по многим параметрам превосходит YandexGPT 2 Lite — облегчённую модель предыдущего поколения. По итогам теста YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU), новая модель даёт на 6 п.п. больше верных ответов, чем модель предыдущего поколения.

Интегрировать YandexGPT 3 Lite в свои продукты можно через API в сервисе Foundation Models. Новая модель заменит предыдущую в течение месяца, но попробовать ее можно уже сейчас (в консоли или используйте следующий URI модели: gpt://<идентификатор_каталога>/yandexgpt-lite/rc).
Новые пользователи Yandex Cloud смогут бесплатно протестировать её в демо-режиме.

📎 Подробнее

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🥰2👎1
⚡️ Распознавание объектов с faster-coco-eval. Разбираемся с библиотекой компьютерного зрения.

https://www.youtube.com/watch?v=5bVG2thY2tA

Аналитика данных
👍21
⚡️ ЛУЧШИЕ БЕСПЛАТНЫЕ Курсы и Книги для изучения МАШИННОГО ОБУЧЕНИЯ.

https://www.youtube.com/watch?v=j0BrMPgrCuo

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
💼 Quantstats

Полезная библиотека QuantStats на Python, которая выполняет анализ финансового портфеля, позволяя инвесторам и аналитикам данных лучше понимать свою работу.

QuantStats предоставляет функции для углубленной аналитики, визуализации данных и генерации метрик риска.

Чтобы визуализировать и анализировать эффективность роста цен конкретных акций в вашем портфеле, используя всего несколько строк на #Python, попробуйте Quantitated.

Github

Аналитика данных
👍61🔥1
🌟 DataComp-LM — комплексный фреймворк, предназначенный для построения и обучения LLM на различных наборах данных

DataComp-LM предлагает стандартизированный набор из более чем 300Т нефильтрованных лексем из CommonCrawl, эффективные рецепты предварительного обучения на основе фреймворка open_lm и большой набор из более чем 50 бенчмарков.

DCLM позволяет исследователям экспериментировать с различными стратегиями построения наборов данных в различных вычислительных масштабах, от 411M до 7B моделей с параметрами.

🖥 GitHub
🟡 Arxiv

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥1
✍️ Learn Data Structures and Algorithms with Python

Это небольшие материалы на CodeAcademy по различным структурам данных и алгоритмам, реализованным на Python. Довольно просто объясняют суть и сопровождаются кодом.

▫️Node (узел)
▫️Linked List (связный список)
▫️Doubly Linked Lists (двусвязный список)
▫️Queues (очереди)
▫️Stacks (стек)
▫️Hash Maps (хеш-таблицы)
▫️Recursion (рекурсия)
▫️Sorting Algorithms (алгоритмы сортировки)
▫️Trees (деревья)
▫️Heaps (куча)
▫️Greedy Algorithms (жадные алгоритмы)

Аналитика данных
👍5🔥21
🌟LLM Compiler — семейство LLM с дополнительными возможностями оптимизации кода

LLM Compiler — семейство моделей на основе Code Llama с дополнительными возможностями оптимизации кода и компилятора.
Эти модели могут эмулировать компилятор и дизассемблировать код.

🤗 llm-compiler-7b
🤗 llm-compiler-13b

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
Полезный и удобный каталог исследований по ML
Papers, Code, Datasets в удобной структуре и под лицензией CC-BY-SA. 134 тысячи исследований и проектов, есть подписка на newsletter, есть библиотека моделей. (More - Libraries)
https://paperswithcode.com/

Этот каталог является частью портала Papers With Code от Meta AI Research, помимо ML на портале представлены исследования и код по:
- Computer Science (14829 papers)
- Physics (9898 papers)
- Mathematics (5460 papers)
- Astronomy (5346 papers)
- Statistics (3948 papers)
https://portal.paperswithcode.com/
3👍21
🔥 БЕСПЛАТНОЕ учебное пособие по диффузионным моделям и согласованию потоков для ML!

Это крутое учебное пособие, созданное Apple.

Аудитория: начинающие специалисты в области диффузии с техническим образованием, например, студенты старших курсов или аспиранты.

Учебное пособие состоит из пяти частей:

• Основы диффузии
• Создание стохастического диффузионного самплера
• Создание детерминированного диффузионного самплера
• Изучение согласования потоков к
• Пракстические прмиеры

Исследуйте диффузию шаг за шагом: https://arxiv.org/pdf/2406.08929

Аналитика данных
👍32
🖥 Polars 1.0 — наконец-то

pip install polars

1 июля 2024 года состоялся релиз открытой библиотеки для быстрой обработки данных Python Polars 1.0 на Rust и Python.

Этим мажорным выпуском разработчики подтвердили, что компоненты in-memory engine и API проекта Polars готовы к стабильной работе. Они убеждены, что Polars находится в том состоянии, когда это уже один из лучших проектов с открытым исходным кодом для быстрого моделирования данных, ориентированного на вертикальное масштабирование.

Планы на будущее проекта Python Polars: улучшение функциональности, масштабируемости и производительности. Выпуск первой основной версии отмечает момент времени, когда разделение между API и фактической реализацией достаточно стабильное, чтобы разработчики могли продолжать улучшать проект и поддерживать необходимую обратную совместимость.

Также в планах разработчиков проекта: поддержка right join и non-equi join, расширенная поддержка метаданных, поддержка re-ordering optimization и расширенная поддержка SQL.

🖥 GitHub

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83
👌 Deep Learning на пальцах

Это бесплатный курс по глубокому обучению, который читает исследователь MIT Семён Козлов. В том же объёме курс читается и для магистрантов Новосибирского Государственного Университета, а также студентов CS центра Новосибирска.

Хоть он проходил в мае, на сайте доступны видеолекции, слайды, а также задания по курсу. Вот темы, которые он охватывает:

▪️Python, numpy, notebooks
▪️Нейронные сети
▪️PyTorch и подробности
▪️Введение в NLP, компьютерное зрение, распознавание речи и обучение с подкреплением.

🔗 Ссылка на материалы
43👍2