Читаем, как сохранять стабильности гиперпараметров при масштабировании модели. Одно из предлагаемых решений — использовать перенос параметров с маленькой модели на большую без допнастройки. В этом случае масштаб признаков и их изменений на каждом шаге сохраняется при увеличении размера сети.
TG: https://t.iss.one/stuffyNLP/28
@nuancesprog #MachineLearning
TG: https://t.iss.one/stuffyNLP/28
@nuancesprog #MachineLearning
Объедините с помощью MergeKit несколько моделей в один коллектив экспертов (MoE). Предлагаем подробное описание процесса создания многозадачной и высокопроизводительной модели frankenMoE, не требующей предварительного обучения.
https://nsprg.ru/xPbN2O
VK: https://nsprg.ru/v8G15x
@nuancesprog #MachineLearning
https://nsprg.ru/xPbN2O
VK: https://nsprg.ru/v8G15x
@nuancesprog #MachineLearning
Ознакомьтесь с применением текстового эмбеддинга в классификации текстов и семантическом поиске (с примерами Python-кода). Текстовой эмбеддинг позволит использовать более простые и дешевые LLM-методы, сохраняя при этом большую часть смысла.
https://nsprg.ru/maY56m
VK: https://nsprg.ru/vdWewx
@nuancesprog #MachineLearning #LLM
https://nsprg.ru/maY56m
VK: https://nsprg.ru/vdWewx
@nuancesprog #MachineLearning #LLM
Узнайте, что именно происходит за кулисами в векторных базах данных. У вас есть возможность самостоятельно пройти все этапы работы с векторами: начиная от эмбеддинга и заканчивая поиском ближайшего соседа.
https://nsprg.ru/O4Kqgv
VK: https://nsprg.ru/x1zKqv
@nuancesprog #LLM #MachineLearning
https://nsprg.ru/O4Kqgv
VK: https://nsprg.ru/x1zKqv
@nuancesprog #LLM #MachineLearning
Оценка эффективности классификатора - непростая задача. Чтобы справиться с ней, понадобится несколько показателей. Предлагаем доступное описание 8 главных метрик.
https://nsprg.ru/OZYjAv
VK: https://nsprg.ru/mEKjnv
Дзен: https://nsprg.ru/vXPjAv
@nuancesprog #MachineLearning
https://nsprg.ru/OZYjAv
VK: https://nsprg.ru/mEKjnv
Дзен: https://nsprg.ru/vXPjAv
@nuancesprog #MachineLearning
Рассмотрим внедрение Visual Language Model (VLM) для поиска по картинкам в Нейро Яндекса. Изучим архитектуру VLM, процесс обучения и применение в поиске по картинкам. Проанализируем изменения в пайплайне и оценим результаты внедрения.
ХАБР: https://habr.com/ru/companies/yandex/articles/847706/
@nuancesprog #MachineLearning #LLM
ХАБР: https://habr.com/ru/companies/yandex/articles/847706/
@nuancesprog #MachineLearning #LLM
Область квантового машинного обучения не сразу поддается начинающим исследователям данных из CSV. Предлагаем поучиться не на теоретических примерах (которые зачастую не имеют практической пользы), а на реальном опыте специалистов QML.
https://nsprg.ru/OKpl4m
VK: https://nsprg.ru/O5ka7x
Дзен: https://nsprg.ru/mW7jJm
@nuancesprog #MachineLearning #CSV
https://nsprg.ru/OKpl4m
VK: https://nsprg.ru/O5ka7x
Дзен: https://nsprg.ru/mW7jJm
@nuancesprog #MachineLearning #CSV
Мощь больших языковых моделей (LLM) очевидна. Но так ли легко обеспечить их всем необходимым? Сегодня мы пройдем путь работы над LLM - от доказательства концепции до производства - и поговорим о том, какие меры предпринять и каких подводных камней избегать.
https://nsprg.ru/ma7Z7v
VK: https://nsprg.ru/O7wgXO
@nuancesprog #MachineLearning #LLM
https://nsprg.ru/ma7Z7v
VK: https://nsprg.ru/O7wgXO
@nuancesprog #MachineLearning #LLM
Что общего у фейковых новостей? Как создать чат-бота, который отличает такие новости от реальных? Почему BERT не является универсальным решением в машинном обучении? Узнайте ответы на эти и сопутствующие вопросы прямо сейчас.
https://nsprg.ru/OobY2v
VK: https://nsprg.ru/vd0W8v
Дзен: https://nsprg.ru/ObZkEO
@nuancesprog #MachineLearning
https://nsprg.ru/OobY2v
VK: https://nsprg.ru/vd0W8v
Дзен: https://nsprg.ru/ObZkEO
@nuancesprog #MachineLearning
Отправной точкой в машинном обучении является установление стандартов с помощью базовых моделей. Ознакомьтесь со основным механизмом, стратегиями и ключевыми параметрами этого процесса, чтобы оценить эффективность простейшего инструмента МО - базового классификатора.
https://nsprg.ru/mwZ7JO
VK: https://nsprg.ru/vLdp1v
@nuancesprog #MachineLearning #DataScience #ForBeginners
https://nsprg.ru/mwZ7JO
VK: https://nsprg.ru/vLdp1v
@nuancesprog #MachineLearning #DataScience #ForBeginners
Машинное обучение - одна из тех областей, которые должен знать каждый, кто изучает науку о данных. Предлагаем описание 6 ключевых алгоритмов контролируемого МО, изложенное простым, доступным языком.
https://nsprg.ru/v2n6jv
VK: https://nsprg.ru/vX94wO
Дзен: https://nsprg.ru/OZEnav
@nuancesprog #MachineLearning
https://nsprg.ru/v2n6jv
VK: https://nsprg.ru/vX94wO
Дзен: https://nsprg.ru/OZEnav
@nuancesprog #MachineLearning
Регуляризация размерности данных - важнейший навык в машинном обучении, позволяющий повысить эффективность модели. Чтобы овладеть им, необходимо понять различие между лассо- и ридж-регрессиями. Попробуем разобраться с этими методами статистического обучения.
https://nsprg.ru/O5PDRv
VK: https://nsprg.ru/OobGEv
Дзен: https://nsprg.ru/v3GDbv
@nuancesprog #MachineLearning
https://nsprg.ru/O5PDRv
VK: https://nsprg.ru/OobGEv
Дзен: https://nsprg.ru/v3GDbv
@nuancesprog #MachineLearning
Предлагаем пошаговое руководство по полной разработке LLM-приложений - от первоначальной идеи до экспериментов, оценки и создания продукта. Следуя ему, вы сможете максимально расширить границы возможного LLM-нативных технологий.
https://nsprg.ru/mW2lyO
VK: https://nsprg.ru/O5P7Bv
@nuancesprog #LLM #MachineLearning
https://nsprg.ru/mW2lyO
VK: https://nsprg.ru/O5P7Bv
@nuancesprog #LLM #MachineLearning
Предлагаем наглядное руководство по смарт-обрезке ветвей дерева решений с учетом сложности/стоимости вычислений. Описанный подход потенциально позволяет создавать более оптимальные деревья, хотя зависит от набора данных, поставленной задачи и доступных вычислительных ресурсов.
https://nsprg.ru/xPGArm
VK: https://nsprg.ru/v8p4zv
@nuancesprog #MachineLearning #Python #Sklearn #Pandas #Numpy
https://nsprg.ru/xPGArm
VK: https://nsprg.ru/v8p4zv
@nuancesprog #MachineLearning #Python #Sklearn #Pandas #Numpy
Разберем пошагово процесс создания масштабируемой, эффективной системы рекомендаций с нуля. Подробно изучим нюансы ее компонентов: сбор и представление данных, выбор алгоритма, обучение модели, обработка в реальном времени, обратная связь.
https://nsprg.ru/xPGX6m
VK: https://nsprg.ru/v8pXrv
@nuancesprog #MachineLearning
https://nsprg.ru/xPGX6m
VK: https://nsprg.ru/v8pXrv
@nuancesprog #MachineLearning
Ознакомьтесь с новым подходом к поиску необходимых документов. Для повышения точности поиска он предполагает учет соседних документов с помощью контекстно-зависимых эмбеддингов.
https://nsprg.ru/x9w7aO
VK: https://nsprg.ru/mwZ10O
@nuancesprog #MachineLearning #RAG
https://nsprg.ru/x9w7aO
VK: https://nsprg.ru/mwZ10O
@nuancesprog #MachineLearning #RAG
Узнаем, как Яндекс создавал новое поколение языковых моделей YandexGPT 5, какие технические улучшения реализовали для Pro-версии, как добились результатов на уровне GPT-4o и превзошли Qwen 2.5. Разберем оптимизации, снизившие затраты на вычисления на 25%, и возможности выложенной опенсорс Lite-версии для разработки собственных решений.
ХАБР: https://nsprg.ru/O4lodO
@nuancesprog #MachineLearning #LLM
ХАБР: https://nsprg.ru/O4lodO
@nuancesprog #MachineLearning #LLM
Последние достижения в области LLM открывают новые возможности для оптимизации процесса аннотирования, особенно для обнаружения ошибок в метках в существующих наборах данных. Ознакомьтесь с новым подходом, использующим ансамбль LLM для выявления потенциально ошибочно помеченных примеров.
https://nsprg.ru/OKb3ov
VK: https://nsprg.ru/mW2EqO
@nuancesprog #LLM #MachineLearning
https://nsprg.ru/OKb3ov
VK: https://nsprg.ru/mW2EqO
@nuancesprog #LLM #MachineLearning