Machine learning Interview

⚡️ Mistral-NeMo-Minitron-8B-Base: Базовая Minitron 8B от Nvidia

NVIDIA и Mistral AI представили модель Mistral-NeMo-Minitron 8B, одну из наиболее точных открытых моделей в своем классе для генерации текста.

Mistral-NeMo-Minitron-8B-Base получена в результате обрезки (pruning) и дистилляции Mistral-NeMo 12B. В процессе создания была урезана размерность эмбеддинга и промежуточная размерность MLP (с 14336 до 11520).
Комбинация применяемых методов позволила оставить количество attention heads и слоев неизменным.

После обрезки было продолжено обучение с дистилляцией, используя корпус данных от Nemotron-4 15B размером 380 миллиардов токенов для получения окончательной модели, что примерно в 40 раз меньше, чем необходимо для тренировки модели такой же плотности с нуля.

Корпус обучения (набор данных) по структуре точно такой же, как в недавно представленной другой модели, собранной по такой же методике обрезки и дистилляции.
Дата актуальности корпуса обучения - июнь 2023 года.

При создании Mistral-NeMo-Minitron 8B использованы техники Grouped-Query Attention (GQA) и Rotary Position Embeddings (RoPE).
Архитектурные характеристики:

🟢total params - 8B;
🟢active non-embedding params - 7.3B;
🟢embedding size - 4096;
🟢attention heads - 32;
🟢MLP intermediate dimension - 11520;
🟢number of layers - 40;
🟢input context - 8000.

Поддержка Mistral-NeMo-Minitron-8B-Base в Hugging Face Transformers будет реализована в ближайшем обновлении.
Для инференса модели выполните рекомендованные разработчиками инструкции или запустите модель в NeMo v.24.05

Есть неофициальные квантованные (imatrix) GGUF - версии модели в 8 разрядностях, от 1-bit (2. 12 Gb) до 16-bit (16.08 Gb).

📌Лицензирование : NVIDIA Open Model License.

🟡

Страница проекта

🟡

Модель

🟡

Набор GGUF

🟡

Arxiv

🟡

Demo

@ai_machinelearning_big_data

#AI #NVIDIA #LLM #ML #Minitron

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥8👍5❤4

3.31K views09:04

Machine learning Interview

🌟

Инструмент для ускорения обучения LLM YaFSDP

Алгоритм YaFSDP позволяет существенно ускорить процесс обучения больших языковых моделей. Руководитель группы претрейна YandexGPT рассказал, как команда работала над созданием библиотеки, были ли референсы и сложности в процессе.

📎

Ссылка

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2🔥1

4.39K views13:37

Machine learning Interview

🌟

Упражнения в использовании R для ML

Держите несколько практических заданий по ML и их решение на R.
Вот некоторые из заданий:

— кластеризация и классификация
— работа с текстом
— определение выбросов в датасете
— проведение статистических тестов

🟡

ML exercises

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡9❤4👍3🤯1

4.32K views15:03

Machine learning Interview

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

Xorbits — масштабируемый Python фреймворк для задач ML и DS, ориентированный на скорость

Xorbits позволяет, к примеру, легко использовать данные для обучения генеративных моделей а также разворачивать обученные модели в своей инфраструктуре.

Xorbits может использовать несколько ядер/GPU, может работать на 1 машине или масштабироваться до тысяч машин для поддержки обработки терабайтов данных.
Xorbits предоставляет набор полезных библиотек для анализа данных и ML.

🖥

GitHub

🟡

Доки

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11🔥4❤3🤔1

5.66K views09:32

Machine learning Interview

🌟

OmniCast — технология, где нейросети делают более точный прогноз погоды

На Хабр вышла статья-разбор новой технологии Яндекс Погоды, работающей на основе нейросетей. OmniCast улучшает локальный прогноз за счет новых источников данных — любительских метеостанций. Благодаря этому сервис стал в 36 раз чаще получать данные о температуре и обновлять прогноз каждые пять минут.

📎

Статья

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤10👍5🔥5👏1

4.81K views16:33

Machine learning Interview

⚡️ Как выбрать Фреймворк для инференса.

Полезный чек-лист вопросов для выбора мл фреймворка для настройки моделей.

📌 Github

@machinelearning_interview

👍9❤2🔥2

4.45K views09:32

Machine learning Interview

📌

Полный курс лекций по ML с упором на практические примеры

Помимо подробной теории по ML здесь приводятся лабораторные работы с решениями

🟡

Practical Machine Learning

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20🔥11❤3⚡1

5.72K views17:51

Machine learning Interview

⚡️ LinkedIn_AIHawk — это утилита на основе ИИ, созданная пользователем Reddit, для быстрого поиска работы.

Программа адаптирует ваше резюме под описания вакансий и автоматически рассылает их.

Результаты впечатляют: за сутки автор отправил 1000 резюме, что привело к 50 приглашениям на собеседования. Бот не только корректирует резюме, но и самостоятельно отвечает на вопросы HR-менеджеров от вашего имени.

Установка:


bash
$ git clone https://github.com/feder-cr/LinkedIn_AIHawk_automatic_job_application
$ cd LinkedIn_AIHawk_automatic_job_application
$ pip install -r requirements.txt

▪ Github

@machinelearning_interview

👍25🔥10🤩4❤3⚡1👏1

5.94K views10:03

Machine learning Interview

📶 Главные темы линейной алгебры для специалиста по машинному обучению

📌 Крутейшие Стэнфордские материалы по линейной алгебре

@machinelearning_interview

🔥19👍8❤3⚡1👏1

4.63K views13:04

Machine learning Interview

🌟 Опубликована программа конференции Practical ML Conf, которая пройдет 14 сентября

Доклады экспертов, заслуживающие отдельного внимания:
— Виктор Плошихин, руководитель ML-лаборатории в Yandex Platform Engineering — «AI-инструмент для разработчика: как мы обучали LLM работе с кодом».
— Ирина Барская, руководитель службы аналитики и исследований – «Человек и LLM. Как оценивать качество моделей и строить их метрики качества».
— Екатерина Глазкова, тимлид команды алайнмента VLM службы компьютерного зрения — «Адаптация VLM под продуктовые требования — как сервис Нейро делали мультимодальным».
— Савва Степурин, старший разработчик команды рекомендаций — «Как улучшить знакомые подходы для рекомендации незнакомого — как умная система рекомендаций помогает пользователям Яндекс Музыки открывать новые треки и артистов».
— Степан Комков, старший разработчик службы синтеза речи — «Синтез выразительной речи для аудиокниг, прошлое, настоящее и будущее — как GPT и диффузионные модели произвели революции в синтезе речи и как мы это используем».

📎 Можно посетить мероприятие офлайн в Москве или присоединиться онлайн, необходима предварительная регистрация.

@machinelearning_interview

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

4.29K views15:03

Machine learning Interview

🐈‍⬛ A Comprehensive Benchmark of Machine and Deep Learning
Across Diverse Tabular Datasets

В новом обзоре алгоритмов машинного обучения были проанализированы 20 моделей на 111 датасетах, охватывающих задачи классификации и регрессии.

CatBoost, относящийся к группе моделей Tree-based Ensemble (TE), занял первое место, продемонстрировав лучшие результаты на 19 из 111 наборов данных. В то же время XGBoost оказался на 10-й позиции.

🔗 Подробности

👍15🤔4❤2🎉1

4.28K views17:05

About

Blog

Apps

Platform