Наслаждайтесь волшебством моделей Diffusion!
DiffSynth Studio — это движок Diffusion. Мы реструктурировали архитектуры, включая Text Encoder, UNet, VAE и другие, сохранив совместимость с моделями сообщества открытого исходного кода и одновременно повысив вычислительную производительность. Мы предоставляем много интересных функций. Наслаждайтесь волшебством моделей Diffusion!
https://github.com/modelscope/DiffSynth-Studio
DiffSynth Studio — это движок Diffusion. Мы реструктурировали архитектуры, включая Text Encoder, UNet, VAE и другие, сохранив совместимость с моделями сообщества открытого исходного кода и одновременно повысив вычислительную производительность. Мы предоставляем много интересных функций. Наслаждайтесь волшебством моделей Diffusion!
https://github.com/modelscope/DiffSynth-Studio
GitHub
GitHub - modelscope/DiffSynth-Studio: Enjoy the magic of Diffusion models!
Enjoy the magic of Diffusion models! Contribute to modelscope/DiffSynth-Studio development by creating an account on GitHub.
Яндекс разработал и опубликовал библиотеку YaFSDP — собственное решение для ускорения обучения больших языковых моделей.
При обучении LLM возникает проблема сложности вычислений и коммуникаций GPU в кластере. Большие расчёты должны синхронизироваться на разных видеокартах, а для этого сами устройства должны обмениваться информацией, чтобы не считать два раза одно и то же. Если GPU делают это неэффективно, то они теряют до 30% недоутилизированной мощности.
Библиотека YaFSDP позволяет ускорить обучение больших языковых моделей до 25%. С её помощью можно тратить меньше времени на обучение и расходовать меньше ресурсов графических процессоров (GPU). Подробнее о том, как менялись подходы к оптимизации ресурсов можно прочитать в статье на «Хабре».
Реклама. ООО "ЯНДЕКС". ИНН 7736207543.
При обучении LLM возникает проблема сложности вычислений и коммуникаций GPU в кластере. Большие расчёты должны синхронизироваться на разных видеокартах, а для этого сами устройства должны обмениваться информацией, чтобы не считать два раза одно и то же. Если GPU делают это неэффективно, то они теряют до 30% недоутилизированной мощности.
Библиотека YaFSDP позволяет ускорить обучение больших языковых моделей до 25%. С её помощью можно тратить меньше времени на обучение и расходовать меньше ресурсов графических процессоров (GPU). Подробнее о том, как менялись подходы к оптимизации ресурсов можно прочитать в статье на «Хабре».
Реклама. ООО "ЯНДЕКС". ИНН 7736207543.
❤1
Обнаружение галлюцинаций в больших языковых моделях с использованием семантической энтропии
Большие языковые модели (LLM), такие как ChatGPT и Gemini, часто генерируют ложные или необоснованные результаты, создавая риски в таких областях, как юриспруденция, журналистика и медицина. Новый статистический метод, использующий оценщики неопределенности на основе энтропии, может обнаруживать эти «галлюцинации», оценивая неопределенность сгенерированного значения, а не конкретные последовательности слов, что повышает надежность, не требуя данных, специфичных для конкретной задачи. https://www.nature.com/articles/s41586-024-07421-0
Большие языковые модели (LLM), такие как ChatGPT и Gemini, часто генерируют ложные или необоснованные результаты, создавая риски в таких областях, как юриспруденция, журналистика и медицина. Новый статистический метод, использующий оценщики неопределенности на основе энтропии, может обнаруживать эти «галлюцинации», оценивая неопределенность сгенерированного значения, а не конкретные последовательности слов, что повышает надежность, не требуя данных, специфичных для конкретной задачи. https://www.nature.com/articles/s41586-024-07421-0
Nature
Detecting hallucinations in large language models using semantic entropy
Nature - Hallucinations (confabulations) in large language model systems can be tackled by measuring uncertainty about the meanings of generated responses rather than the text itself to improve...
❤2
Регрессия Пуассона против линейной регрессии
Линейная регрессия — не единственная линейная модель.
https://blog.dailydoseofds.com/p/poisson-regression-vs-linear-regression
Линейная регрессия — не единственная линейная модель.
https://blog.dailydoseofds.com/p/poisson-regression-vs-linear-regression
Dailydoseofds
Poisson Regression vs. Linear Regression
Linear regression is not the only linear model.
👍1
Изучите тонкую настройку трансформатора и сегментируйте что угодно
https://towardsdatascience.com/learn-transformer-fine-tuning-and-segment-anything-481c6c4ac802
https://towardsdatascience.com/learn-transformer-fine-tuning-and-segment-anything-481c6c4ac802
Medium
Learn Transformer Fine-Tuning and Segment Anything
Train Meta’s SAM to segment high fidelity masks for any domain
Машинное обучение на устройстве с TensorFlow Lite📲
https://medium.com/@akshaynagamalla23/on-device-machine-learning-with-tensorflow-lite-ec4544acfb50
https://medium.com/@akshaynagamalla23/on-device-machine-learning-with-tensorflow-lite-ec4544acfb50
Medium
On-Device Machine Learning with TensorFlow Lite📲
At Sangraha360, we’re at the forefront of mobile cybersecurity, constantly exploring new frontiers with cutting-edge federated learning…
Метаобучение синтезу текста в речь на более чем 7000 языках
https://github.com/digitalphonetics/ims-toucan
https://github.com/digitalphonetics/ims-toucan
GitHub
GitHub - DigitalPhonetics/IMS-Toucan: Controllable and fast Text-to-Speech for over 7000 languages!
Controllable and fast Text-to-Speech for over 7000 languages! - DigitalPhonetics/IMS-Toucan
От «голого железа» до модели 70B: настройка инфраструктуры и скрипты
https://imbue.com/research/70b-infrastructure
https://imbue.com/research/70b-infrastructure
Imbue
From bare metal to a 70B model: infrastructure set-up and scripts
We would like to thank Voltage Park, Dell, H5, and NVIDIA for their invaluable partnership and help with setting up our cluster. A special…
Как я освоил структуры данных и алгоритмы
https://blog.algomaster.io/p/how-i-mastered-data-structures-and-algorithms
https://blog.algomaster.io/p/how-i-mastered-data-structures-and-algorithms
blog.algomaster.io
How I Mastered Data Structures and Algorithms
#16 How I mastered DSA
Оживляем хоккей с помощью ИИ: отслеживание игроков с помощью компьютерного зрения
Используя PyTorch, методы компьютерного зрения и сверточную нейронную сеть (CNN), я работал над моделью, которая отслеживает игроков, команды и базовую статистику производительности.
https://towardsdatascience.com/spicing-up-ice-hockey-with-ai-player-tracking-with-computer-vision-ce9ceec9122a
Изучите мудрость LSTM, ведущую к xLSTM — вероятному конкуренту современных LLM
https://towardsdatascience.com/deep-dive-into-lstms-xlstms-by-hand-%EF%B8%8F-c33e638bebb1
Используя PyTorch, методы компьютерного зрения и сверточную нейронную сеть (CNN), я работал над моделью, которая отслеживает игроков, команды и базовую статистику производительности.
https://towardsdatascience.com/spicing-up-ice-hockey-with-ai-player-tracking-with-computer-vision-ce9ceec9122a
Изучите мудрость LSTM, ведущую к xLSTM — вероятному конкуренту современных LLM
https://towardsdatascience.com/deep-dive-into-lstms-xlstms-by-hand-%EF%B8%8F-c33e638bebb1
Medium
Spicing up Ice Hockey with AI: Player Tracking with Computer Vision
Using PyTorch, computer vision techniques, and a CNN, I worked on a model that tracks players, teams, and basic performance statistics
This media is not supported in your browser
VIEW IN TELEGRAM
Оживите портреты!
Portrait Animation стремится синтезировать реалистичное видео из одного исходного изображения, используя его в качестве эталона внешнего вида, с движением (то есть выражениями лица и позой головы), полученным из движущегося видео, аудио, текста или генерации. Вместо того, чтобы следовать основным методам, основанным на диффузии, мы исследуем и расширяем потенциал фреймворка, основанного на неявных ключевых точках, который эффективно уравновешивает вычислительную эффективность и управляемость.
https://github.com/KwaiVGI/LivePortrait
Portrait Animation стремится синтезировать реалистичное видео из одного исходного изображения, используя его в качестве эталона внешнего вида, с движением (то есть выражениями лица и позой головы), полученным из движущегося видео, аудио, текста или генерации. Вместо того, чтобы следовать основным методам, основанным на диффузии, мы исследуем и расширяем потенциал фреймворка, основанного на неявных ключевых точках, который эффективно уравновешивает вычислительную эффективность и управляемость.
https://github.com/KwaiVGI/LivePortrait
Принципы обучения с подкреплением: введение в Python
https://machinelearningmastery.com/principles-of-reinforcement-learning-an-introduction-with-python
https://machinelearningmastery.com/principles-of-reinforcement-learning-an-introduction-with-python
Как ускорить Python Pandas более чем в 300 раз
https://www.kdnuggets.com/how-to-speed-up-python-pandas-by-over-300x
https://www.kdnuggets.com/how-to-speed-up-python-pandas-by-over-300x
KDnuggets
How to Speed Up Python Pandas by Over 300x
In this blog, we will define Pandas and provide an example of how you can vectorize your Python code to optimize dataset analysis using Pandas to speed up your code over 300x times faster.
Учебное пособие: анализ трафика с помощью видео (21 минута чтения) В этом учебном пособии рассказывается о том, как создать систему, которая сообщает о плотности автомобильного трафика. Для подсчета автомобилей с течением времени используется современное компьютерное зрение. подробнее→ https://blog.roboflow.com/video-stream-analysis/
Roboflow Blog
Realtime Video Stream Analysis with Computer Vision
In this guide, we use computer vision to process multiple live video streams to perform analysis and gain insights.
Большие языковые модели (LLM) обладают огромным потенциалом, но разработка надежных приложений промышленного уровня остается сложной задачей. После создания десятков систем LLM я свел формулу успеха к четырем фундаментальным принципам, которые может применять любая команда.
https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e
https://towardsdatascience.com/the-llm-triangle-principles-to-architect-reliable-ai-apps-d3753dd8542e
Medium
The LLM Triangle Principles to Architect Reliable AI Apps
Software design principles for thoughtfully designing reliable, high-performing LLM applications
Советы по эффективному обучению моделей машинного обучения
https://machinelearningmastery.com/tips-for-effectively-training-your-machine-learning-models
https://machinelearningmastery.com/tips-for-effectively-training-your-machine-learning-models
Справочник специалиста по данным 2024 г.
Подборка ресурсов (бесплатных и платных), которые помогут специалистам по данным учиться, расти и выходить на новый уровень в области науки о данных…
https://github.com/andresvourakis/data-scientist-handbook
Что такое градиентный спуск?
https://leakybrain.ericekholm.com/stats/gradient_descent
Machine Learning Engineering Open Book
Это открытая коллекция методологий, инструментов и пошаговых инструкций, которые помогут успешно тренировать большие языковые модели и многомодальные модели. Это технический материал, подходящий для инженеров и операторов обучения LLM/VLM.
https://github.com/stas00/ml-engineering
Подборка ресурсов (бесплатных и платных), которые помогут специалистам по данным учиться, расти и выходить на новый уровень в области науки о данных…
https://github.com/andresvourakis/data-scientist-handbook
Что такое градиентный спуск?
https://leakybrain.ericekholm.com/stats/gradient_descent
Machine Learning Engineering Open Book
Это открытая коллекция методологий, инструментов и пошаговых инструкций, которые помогут успешно тренировать большие языковые модели и многомодальные модели. Это технический материал, подходящий для инженеров и операторов обучения LLM/VLM.
https://github.com/stas00/ml-engineering
GitHub
GitHub - andresvourakis/data-scientist-handbook: Curated Data Science resources (Free & Paid) to help aspiring and experienced…
Curated Data Science resources (Free & Paid) to help aspiring and experienced data scientists learn, grow, and advance their careers. - andresvourakis/data-scientist-handbook
Агентный ИИ: создание агента ИИ, способного ориентироваться в Интернете
https://cobusgreyling.medium.com/agentic-ai-creating-an-ai-agent-which-can-navigate-the-internet-655fe5596a0c
https://cobusgreyling.medium.com/agentic-ai-creating-an-ai-agent-which-can-navigate-the-internet-655fe5596a0c
Medium
Agentic AI: Creating An AI Agent Which Can Navigate The Internet
WebVoyager is a vision-enabled web-browsing agent capable of navigating the web. It interprets annotated browser screenshots for each…
Как создать интерпретируемую модель искусственного интеллекта — простой пример кода Python
https://www.freecodecamp.org/news/how-to-build-an-interpretable-ai-deep-learning-model
https://www.freecodecamp.org/news/how-to-build-an-interpretable-ai-deep-learning-model
freeCodeCamp.org
How to Build an Interpretable Artificial Intelligence Model – Simple Python Code Example
Artificial Intelligence is being used everywhere these days. And many of the groundbreaking applications come from Machine Learning, a subfield of AI. Within Machine Learning, a field called Deep Learning represents one of the main areas of research....