Big data world
2.39K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Оживите портреты!

Portrait Animation стремится синтезировать реалистичное видео из одного исходного изображения, используя его в качестве эталона внешнего вида, с движением (то есть выражениями лица и позой головы), полученным из движущегося видео, аудио, текста или генерации. Вместо того, чтобы следовать основным методам, основанным на диффузии, мы исследуем и расширяем потенциал фреймворка, основанного на неявных ключевых точках, который эффективно уравновешивает вычислительную эффективность и управляемость.


https://github.com/KwaiVGI/LivePortrait
Принципы обучения с подкреплением: введение в Python

https://machinelearningmastery.com/principles-of-reinforcement-learning-an-introduction-with-python
Учебное пособие: анализ трафика с помощью видео (21 минута чтения) В этом учебном пособии рассказывается о том, как создать систему, которая сообщает о плотности автомобильного трафика. Для подсчета автомобилей с течением времени используется современное компьютерное зрение. подробнее→ https://blog.roboflow.com/video-stream-analysis/
Большие языковые модели (LLM) обладают огромным потенциалом, но разработка надежных приложений промышленного уровня остается сложной задачей. После создания десятков систем LLM я свел формулу успеха к четырем фундаментальным принципам, которые может применять любая команда.

https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e
Советы по эффективному обучению моделей машинного обучения

https://machinelearningmastery.com/tips-for-effectively-training-your-machine-learning-models
Справочник специалиста по данным 2024 г.

Подборка ресурсов (бесплатных и платных), которые помогут специалистам по данным учиться, расти и выходить на новый уровень в области науки о данных…
https://github.com/andresvourakis/data-scientist-handbook

Что такое градиентный спуск?

https://leakybrain.ericekholm.com/stats/gradient_descent

Machine Learning Engineering Open Book

Это открытая коллекция методологий, инструментов и пошаговых инструкций, которые помогут успешно тренировать большие языковые модели и многомодальные модели. Это технический материал, подходящий для инженеров и операторов обучения LLM/VLM.
https://github.com/stas00/ml-engineering
IMAGDressing-v1: настраиваемая виртуальная одежда

Последние достижения позволили добиться реалистичной виртуальной примерки (VTON) посредством локализованной прорисовки одежды с использованием моделей скрытой диффузии, что значительно улучшило опыт онлайн-покупок для потребителей. https://github.com/muzishen/imagdressing
DataComp-LM (DCLM) — это комплексная структура, разработанная для создания и обучения больших языковых моделей (LLM) с разнообразными наборами данных.

https://github.com/mlfoundations/dclm
Викторина «Трансформеры с обнимашками»

В этом тесте вы проверите свое понимание Hugging Face Transformers . Эта библиотека является популярным выбором для работы с моделями трансформаторов в задачах обработки естественного языка, компьютерного зрения и других приложениях машинного обучения.

https://realpython.com/quizzes/hugging-face-transformers
Прикладное машинное обучение для табличных данных

Мы хотим создать практическое руководство по разработке качественных предиктивных моделей из табличных данных… Книга дает целостный взгляд на процесс предиктивного моделирования и фокусируется на нескольких областях, которые обычно остаются вне подобных работ. Например, эффективность модели может зависеть от того, как представлены предикторы. Из-за этого мы тесно связываем методы проектирования признаков с моделями машинного обучения. Кроме того, довольно много работы происходит после того, как мы определили нашу лучшую модель и создали окончательную подгонку. Эти действия после моделирования являются важной частью процесса разработки модели и будут подробно описаны…

https://aml4td.org/
MINT-1T: мультимодальный чередующийся набор данных объемом один триллион токенов.

Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.

https://github.com/mlfoundations/mint-1t
👍2
Изучите основы RAG и продвинутые методы

Понимание того, как улучшить возможности систем ИИ и машинного обучения, является ценным навыком. Одним из методов является Retrieval-Augmented Generation (RAG), мощная техника, которая сочетает методы, основанные на поиске, с генеративными моделями для создания более точных и контекстно-релевантных ответов.

https://www.freecodecamp.org/news/learn-rag-fundamentals-and-advanced-techniques