Что внутри?
• 02:01 — Примеры использования машинного обучения
• 06:02 — Упаковка модели в Docker-контейнер
• 07:26 — Использование машинного обучения в проде
• 09:21 — ML-специалисты и их роль в машинном обучении
• 12:50 — ML-система и ее компоненты
• 15:03 — Выбор инфраструктуры и обучение моделей
• 18:47 — ML-платформа и ее компоненты
• 21:59 — Тестирование и авторизация
• 26:51 — Обсуждение видеокарт для обучения моделей
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Повышение скорости инференса больших языковых моделей
Разработчик из команды YandexGPT по полочкам раскладывает, в каких случаях подойдёт дистилляция и с помощью каких трюков можно заменить алгоритм PPO, как бороться с выбросами с помощью LLM.Int8, SmoothQuant и GPT-Q, и разбирает особые методы ускорения вроде Speculative Decoding и Continuous Batching.
🔗 https://habr.com/ru/companies/yandex/articles/801119/
@machinelearning_interview
Разработчик из команды YandexGPT по полочкам раскладывает, в каких случаях подойдёт дистилляция и с помощью каких трюков можно заменить алгоритм PPO, как бороться с выбросами с помощью LLM.Int8, SmoothQuant и GPT-Q, и разбирает особые методы ускорения вроде Speculative Decoding и Continuous Batching.
🔗 https://habr.com/ru/companies/yandex/articles/801119/
@machinelearning_interview
⚡️ Jan - Bring AI to your Desktop
Jan : альтернатива ChatGPT с открытым исходным кодом, которая работает на вашем компьютере в автономном режиме на 100%:
🔗 Github
@machinelearning_interview
Jan : альтернатива ChatGPT с открытым исходным кодом, которая работает на вашем компьютере в автономном режиме на 100%:
🔗 Github
@machinelearning_interview
Держите полезный контент)
В данной статье в виде ссылок представлены все популярные алгоритмы классического машинного обучения с их подробным теоретическим описанием и немного упрощённой реализацией на Python, отражающей основную идею.
В конце каждой темы указаны дополнительные источники для более глубокого ознакомления, суммарное время прочтения статей по этим ссылкам составляет более трёх часов, что неплохо для погружения в тему
Пользуйтесь)
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥 Interview questions on DS, AI, ML, DL, NLP, Python,computer vision.
Большая подборка вопросов для собеседования по DS, AI, ML, DL, NLP, компьютерному зрению.
Подборка вопросов для собеседования поможет вам на собеседовании в области науки о данных, искусственного интеллекта, машинного обучения, глубинного обучения, обработки естественного языка, компьютерного зрения.
▪100 вопросов с собеседований Data Science
▪100 вопросов для собеседования по машинному обучению в 2024 году
▪Более 100 вопросов с собеседования Python. Разбор реальных вопросов.
▪50 вопросов для собеседования по компьютерному зрению в 2024 году
▪50 вопросов для интервью по глубинному обучению в 2024 году
▪50 вопросов для интервью по НЛП (обработке естественного языка) в 2024 году
▪Топ-60 вопросов с собеседований R
@machinelearning_interview
Большая подборка вопросов для собеседования по DS, AI, ML, DL, NLP, компьютерному зрению.
Подборка вопросов для собеседования поможет вам на собеседовании в области науки о данных, искусственного интеллекта, машинного обучения, глубинного обучения, обработки естественного языка, компьютерного зрения.
▪100 вопросов с собеседований Data Science
▪100 вопросов для собеседования по машинному обучению в 2024 году
▪Более 100 вопросов с собеседования Python. Разбор реальных вопросов.
▪50 вопросов для собеседования по компьютерному зрению в 2024 году
▪50 вопросов для интервью по глубинному обучению в 2024 году
▪50 вопросов для интервью по НЛП (обработке естественного языка) в 2024 году
▪Топ-60 вопросов с собеседований R
@machinelearning_interview
Стандартизация процессов позволяет унифицировать и масштабировать лучшие практики управления исследованиями и разработкой. То же самое относится и к Machine Learning, конечно.
Вот, собственно, эти 6 фаз:
— понимание бизнеса и данных
— инженерия данных
— моделирование машинного обучения
— обеспечение качества приложений машинного обучения
— развертывание ML-модели
— мониторинг и обслуживание ML-системы
Подробнее об этом в статье
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Держите сверхполезный видеокурс по основам Machine Learning, по Python в целом, и по Scikit-Learn.
Отлично подойдёт, если вы только вливаетесь в это, да и если давно занимаетесь ML, не повредит освежить основы
Enjoy)
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Google мощно улучшила Gemini 1.5 Pro. Теперь нейронная сеть понимает аудио и работает быстрее.
Она может легко трансформировать аудио в текст, создавать краткую выжимку из лекции, анализировать любимую песню. Есть множество возможностей применения.
Тестируем новый функционал здесь. Нужно включить VPN.
@machinelearning_interview
Она может легко трансформировать аудио в текст, создавать краткую выжимку из лекции, анализировать любимую песню. Есть множество возможностей применения.
Тестируем новый функционал здесь. Нужно включить VPN.
@machinelearning_interview
📌 Яндекс открыл YandexART API и рассказал, как обучали модель
Исследователь генеративных моделей из Yandex Research делится подробностями разработки и усовершенствования API YandexART v2, которая недавно стала доступна для тестирования компаниям в Foundation Models, сервисе платформы Yandex Cloud: как отбирали данные для обучения модели, какие подходы лежат в её основе, как добились качества работы нейросети по нужным критериям. Внутри также замеры на DrawBench.
🔗 https://habr.com/ru/companies/yandex/articles/805745/
@machinelearning_interview
Исследователь генеративных моделей из Yandex Research делится подробностями разработки и усовершенствования API YandexART v2, которая недавно стала доступна для тестирования компаниям в Foundation Models, сервисе платформы Yandex Cloud: как отбирали данные для обучения модели, какие подходы лежат в её основе, как добились качества работы нейросети по нужным критериям. Внутри также замеры на DrawBench.
🔗 https://habr.com/ru/companies/yandex/articles/805745/
@machinelearning_interview
🦾 Google выпустили модель с новой архитектурой Griffin, которая превосходит transformers по своим характеристикам.
Griffin превосходит базовые показатели transformers baseline в контролируемых тестах как по шкале MMLU для различных размеров параметров, так и по среднему баллу в различных тестах.
Архитектура модели имеет преимущества в плане эффективности за счет более быстрого вывода и меньшего потребления памяти при выводе длинных контекстов.
▪Статья: arxiv.org/abs/2402.19427
▪Версия 2B на hugging face: huggingface.co/google/recurrentgemma-2b
@machinelearning_interview
Griffin превосходит базовые показатели transformers baseline в контролируемых тестах как по шкале MMLU для различных размеров параметров, так и по среднему баллу в различных тестах.
Архитектура модели имеет преимущества в плане эффективности за счет более быстрого вывода и меньшего потребления памяти при выводе длинных контекстов.
▪Статья: arxiv.org/abs/2402.19427
▪Версия 2B на hugging face: huggingface.co/google/recurrentgemma-2b
@machinelearning_interview
Неплохая статья о том, какую топологию может иметь кластер Apache Kafka при межрегиональной репликации по нескольким ЦОД и как это реализовать.
Плюс описывается, чем брокеры-наблюдатели отличаются от подписчиков в Confluent Server и при чем здесь конфигурация подтверждений acks в приложении-продюсере.
Для репликации в нескольких регионах кластер Kafka может иметь следующую топологию:
Преимущество растянутого кластера в том, что он сохраняет смещения, а также обеспечивает быстрое аварийное восстановление и автоматическое переключение клиента при сбое без дополнительного кода.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Держите полезную статью, которая поможет разобраться в таком алгоритме ML, как Monte Carlo Tree Search.
Некоторые факты из статьи:
• MCTS использует дерево для представления игры и симуляции возможных ходов. Дерево строится динамически, добавляя новые состояния при выборе наиболее перспективных ходов.
• MCTS сходится к minimax благодаря использованию оценочной функции и перспективного хода.
• В MCTS учитывается перспективность хода, основанная на оценке и любопытстве.
• MCTS и нейросети дополняют друг друга, создавая наборы данных для обучения и используя их в тандеме.
@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM