Big data world
2.39K subscribers
412 photos
64 videos
18 files
1.25K links
Интересные статьи Data Science : Big Data : Machine Learning : Deep Learning

По вопросам сотрудничества- @Daily_admin_info

По иным темам @un_ixtime
Download Telegram
Наслаждайтесь волшебством моделей Diffusion!

DiffSynth Studio — это движок Diffusion. Мы реструктурировали архитектуры, включая Text Encoder, UNet, VAE и другие, сохранив совместимость с моделями сообщества открытого исходного кода и одновременно повысив вычислительную производительность. Мы предоставляем много интересных функций. Наслаждайтесь волшебством моделей Diffusion!

https://github.com/modelscope/DiffSynth-Studio
Яндекс разработал и опубликовал библиотеку YaFSDP — собственное решение для ускорения обучения больших языковых моделей.

При обучении LLM возникает проблема сложности вычислений и коммуникаций GPU в кластере. Большие расчёты должны синхронизироваться на разных видеокартах, а для этого сами устройства должны обмениваться информацией, чтобы не считать два раза одно и то же. Если GPU делают это неэффективно, то они теряют до 30% недоутилизированной мощности.

Библиотека YaFSDP позволяет ускорить обучение больших языковых моделей до 25%. С её помощью можно тратить меньше времени на обучение и расходовать меньше ресурсов графических процессоров (GPU). Подробнее о том, как менялись подходы к оптимизации ресурсов можно прочитать в статье на «Хабре».

Реклама. ООО "ЯНДЕКС". ИНН 7736207543.
1
Обнаружение галлюцинаций в больших языковых моделях с использованием семантической энтропии
Большие языковые модели (LLM), такие как ChatGPT и Gemini, часто генерируют ложные или необоснованные результаты, создавая риски в таких областях, как юриспруденция, журналистика и медицина. Новый статистический метод, использующий оценщики неопределенности на основе энтропии, может обнаруживать эти «галлюцинации», оценивая неопределенность сгенерированного значения, а не конкретные последовательности слов, что повышает надежность, не требуя данных, специфичных для конкретной задачи. https://www.nature.com/articles/s41586-024-07421-0
2
Регрессия Пуассона против линейной регрессии
Линейная регрессия — не единственная линейная модель.

https://blog.dailydoseofds.com/p/poisson-regression-vs-linear-regression
👍1
Оживляем хоккей с помощью ИИ: отслеживание игроков с помощью компьютерного зрения
Используя PyTorch, методы компьютерного зрения и сверточную нейронную сеть (CNN), я работал над моделью, которая отслеживает игроков, команды и базовую статистику производительности.

https://towardsdatascience.com/spicing-up-ice-hockey-with-ai-player-tracking-with-computer-vision-ce9ceec9122a

Изучите мудрость LSTM, ведущую к xLSTM — вероятному конкуренту современных LLM

https://towardsdatascience.com/deep-dive-into-lstms-xlstms-by-hand-%EF%B8%8F-c33e638bebb1
This media is not supported in your browser
VIEW IN TELEGRAM
Оживите портреты!

Portrait Animation стремится синтезировать реалистичное видео из одного исходного изображения, используя его в качестве эталона внешнего вида, с движением (то есть выражениями лица и позой головы), полученным из движущегося видео, аудио, текста или генерации. Вместо того, чтобы следовать основным методам, основанным на диффузии, мы исследуем и расширяем потенциал фреймворка, основанного на неявных ключевых точках, который эффективно уравновешивает вычислительную эффективность и управляемость.


https://github.com/KwaiVGI/LivePortrait
Принципы обучения с подкреплением: введение в Python

https://machinelearningmastery.com/principles-of-reinforcement-learning-an-introduction-with-python
Учебное пособие: анализ трафика с помощью видео (21 минута чтения) В этом учебном пособии рассказывается о том, как создать систему, которая сообщает о плотности автомобильного трафика. Для подсчета автомобилей с течением времени используется современное компьютерное зрение. подробнее→ https://blog.roboflow.com/video-stream-analysis/
Большие языковые модели (LLM) обладают огромным потенциалом, но разработка надежных приложений промышленного уровня остается сложной задачей. После создания десятков систем LLM я свел формулу успеха к четырем фундаментальным принципам, которые может применять любая команда.

https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e
Советы по эффективному обучению моделей машинного обучения

https://machinelearningmastery.com/tips-for-effectively-training-your-machine-learning-models
Справочник специалиста по данным 2024 г.

Подборка ресурсов (бесплатных и платных), которые помогут специалистам по данным учиться, расти и выходить на новый уровень в области науки о данных…
https://github.com/andresvourakis/data-scientist-handbook

Что такое градиентный спуск?

https://leakybrain.ericekholm.com/stats/gradient_descent

Machine Learning Engineering Open Book

Это открытая коллекция методологий, инструментов и пошаговых инструкций, которые помогут успешно тренировать большие языковые модели и многомодальные модели. Это технический материал, подходящий для инженеров и операторов обучения LLM/VLM.
https://github.com/stas00/ml-engineering