Аналитик данных
6.06K subscribers
215 photos
27 videos
2 files
199 links
Аналитика данных, Дата Сеанс

@workakkk - по всем вопросам
Download Telegram
🔥 Яндекс представил YandexGPT 3 Lite

Сегодня Яндекс открыл доступ к YandexGPT Lite третьего поколения. Облегченная версия этой LLM доступна через API в Yandex Cloud. Новая модель полезна в сценариях, где важна скорость ответа: например, её можно использовать в чат-ботах, для проверки орфографии или анализа данных. Это оптимальная по цене и качеству генеративная модель Яндекса для решения рутинных задач.

Новая модель по многим параметрам превосходит YandexGPT 2 Lite — облегчённую модель предыдущего поколения. По итогам теста YaMMLU_ru (русскоязычной версии международного эталонного теста MMLU), новая модель даёт на 6 п.п. больше верных ответов, чем модель предыдущего поколения.

Интегрировать YandexGPT 3 Lite в свои продукты можно через API в сервисе Foundation Models. Новая модель заменит предыдущую в течение месяца, но попробовать ее можно уже сейчас (в консоли или используйте следующий URI модели: gpt://<идентификатор_каталога>/yandexgpt-lite/rc).
Новые пользователи Yandex Cloud смогут бесплатно протестировать её в демо-режиме.

📎 Подробнее

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🥰2👎1
⚡️ Распознавание объектов с faster-coco-eval. Разбираемся с библиотекой компьютерного зрения.

https://www.youtube.com/watch?v=5bVG2thY2tA

Аналитика данных
👍21
⚡️ ЛУЧШИЕ БЕСПЛАТНЫЕ Курсы и Книги для изучения МАШИННОГО ОБУЧЕНИЯ.

https://www.youtube.com/watch?v=j0BrMPgrCuo

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🔥1
💼 Quantstats

Полезная библиотека QuantStats на Python, которая выполняет анализ финансового портфеля, позволяя инвесторам и аналитикам данных лучше понимать свою работу.

QuantStats предоставляет функции для углубленной аналитики, визуализации данных и генерации метрик риска.

Чтобы визуализировать и анализировать эффективность роста цен конкретных акций в вашем портфеле, используя всего несколько строк на #Python, попробуйте Quantitated.

Github

Аналитика данных
👍61🔥1
🌟 DataComp-LM — комплексный фреймворк, предназначенный для построения и обучения LLM на различных наборах данных

DataComp-LM предлагает стандартизированный набор из более чем 300Т нефильтрованных лексем из CommonCrawl, эффективные рецепты предварительного обучения на основе фреймворка open_lm и большой набор из более чем 50 бенчмарков.

DCLM позволяет исследователям экспериментировать с различными стратегиями построения наборов данных в различных вычислительных масштабах, от 411M до 7B моделей с параметрами.

🖥 GitHub
🟡 Arxiv

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥1
✍️ Learn Data Structures and Algorithms with Python

Это небольшие материалы на CodeAcademy по различным структурам данных и алгоритмам, реализованным на Python. Довольно просто объясняют суть и сопровождаются кодом.

▫️Node (узел)
▫️Linked List (связный список)
▫️Doubly Linked Lists (двусвязный список)
▫️Queues (очереди)
▫️Stacks (стек)
▫️Hash Maps (хеш-таблицы)
▫️Recursion (рекурсия)
▫️Sorting Algorithms (алгоритмы сортировки)
▫️Trees (деревья)
▫️Heaps (куча)
▫️Greedy Algorithms (жадные алгоритмы)

Аналитика данных
👍5🔥21
🌟LLM Compiler — семейство LLM с дополнительными возможностями оптимизации кода

LLM Compiler — семейство моделей на основе Code Llama с дополнительными возможностями оптимизации кода и компилятора.
Эти модели могут эмулировать компилятор и дизассемблировать код.

🤗 llm-compiler-7b
🤗 llm-compiler-13b

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2
Полезный и удобный каталог исследований по ML
Papers, Code, Datasets в удобной структуре и под лицензией CC-BY-SA. 134 тысячи исследований и проектов, есть подписка на newsletter, есть библиотека моделей. (More - Libraries)
https://paperswithcode.com/

Этот каталог является частью портала Papers With Code от Meta AI Research, помимо ML на портале представлены исследования и код по:
- Computer Science (14829 papers)
- Physics (9898 papers)
- Mathematics (5460 papers)
- Astronomy (5346 papers)
- Statistics (3948 papers)
https://portal.paperswithcode.com/
3👍21
🔥 БЕСПЛАТНОЕ учебное пособие по диффузионным моделям и согласованию потоков для ML!

Это крутое учебное пособие, созданное Apple.

Аудитория: начинающие специалисты в области диффузии с техническим образованием, например, студенты старших курсов или аспиранты.

Учебное пособие состоит из пяти частей:

• Основы диффузии
• Создание стохастического диффузионного самплера
• Создание детерминированного диффузионного самплера
• Изучение согласования потоков к
• Пракстические прмиеры

Исследуйте диффузию шаг за шагом: https://arxiv.org/pdf/2406.08929

Аналитика данных
👍32
🖥 Polars 1.0 — наконец-то

pip install polars

1 июля 2024 года состоялся релиз открытой библиотеки для быстрой обработки данных Python Polars 1.0 на Rust и Python.

Этим мажорным выпуском разработчики подтвердили, что компоненты in-memory engine и API проекта Polars готовы к стабильной работе. Они убеждены, что Polars находится в том состоянии, когда это уже один из лучших проектов с открытым исходным кодом для быстрого моделирования данных, ориентированного на вертикальное масштабирование.

Планы на будущее проекта Python Polars: улучшение функциональности, масштабируемости и производительности. Выпуск первой основной версии отмечает момент времени, когда разделение между API и фактической реализацией достаточно стабильное, чтобы разработчики могли продолжать улучшать проект и поддерживать необходимую обратную совместимость.

Также в планах разработчиков проекта: поддержка right join и non-equi join, расширенная поддержка метаданных, поддержка re-ordering optimization и расширенная поддержка SQL.

🖥 GitHub

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
👍83
👌 Deep Learning на пальцах

Это бесплатный курс по глубокому обучению, который читает исследователь MIT Семён Козлов. В том же объёме курс читается и для магистрантов Новосибирского Государственного Университета, а также студентов CS центра Новосибирска.

Хоть он проходил в мае, на сайте доступны видеолекции, слайды, а также задания по курсу. Вот темы, которые он охватывает:

▪️Python, numpy, notebooks
▪️Нейронные сети
▪️PyTorch и подробности
▪️Введение в NLP, компьютерное зрение, распознавание речи и обучение с подкреплением.

🔗 Ссылка на материалы
43👍2
🤗 Все что нужно знать о работе с Hugging Face за 10 минут!

В этом ролике мы разыгрываем 3 крутые книги по МАШИННОМУ ОБУЧЕНИЮ, нужно всего лишь оставить любой осмысленный коммент и лайк и быть подписанным на наш канал!

https://www.youtube.com/watch?v=4B_foZbWh2c

Аналитика данных
👍32🔥2
🔥3👍2🤣2🙈2
🖥 Deep Java Library — это высокоуровневая open-source библиотека Java для ML и Deep Learning

DJL — это удобная библиотека машинного обучения для языка Java, особенностью которой является зоопарк моделей (Model Zoo), позволяющий получить готовую модель по описываемым параметрам из списка доступных моделей. Также имеется возможность создать свою модель, сохранить на диск и загрузить для дальнейшего использования.

🖥 GitHub
🟡 Доки
🟡 Примеры использования
🟡 Обзор DJL

Аналитика данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥2