IMAGDressing-v1: настраиваемая виртуальная одежда
Последние достижения позволили добиться реалистичной виртуальной примерки (VTON) посредством локализованной прорисовки одежды с использованием моделей скрытой диффузии, что значительно улучшило опыт онлайн-покупок для потребителей. https://github.com/muzishen/imagdressing
Последние достижения позволили добиться реалистичной виртуальной примерки (VTON) посредством локализованной прорисовки одежды с использованием моделей скрытой диффузии, что значительно улучшило опыт онлайн-покупок для потребителей. https://github.com/muzishen/imagdressing
GitHub
GitHub - muzishen/IMAGDressing: [AAAI 2025]👔IMAGDressing👔: Interactive Modular Apparel Generation for Virtual Dressing. It enables…
[AAAI 2025]👔IMAGDressing👔: Interactive Modular Apparel Generation for Virtual Dressing. It enables customizable human image generation with flexible garment, pose, and scene control, ensuring high ...
Forwarded from Добро пожаловать в мир Python
Как построить модель квантового искусственного интеллекта — с примерами кода Python
https://www.freecodecamp.org/news/how-to-build-a-quantum-ai-model
https://www.freecodecamp.org/news/how-to-build-a-quantum-ai-model
freeCodeCamp.org
How to Build a Quantum Artificial Intelligence Model – With Python Code Examples
Machine learning (ML) is one of the most important subareas of AI used in building great AI systems. In ML, deep learning is a narrow area focused solely on neural networks. Through the field of deep learning, systems like ChatGPT and many other AI m...
DataComp-LM (DCLM) — это комплексная структура, разработанная для создания и обучения больших языковых моделей (LLM) с разнообразными наборами данных.
https://github.com/mlfoundations/dclm
https://github.com/mlfoundations/dclm
GitHub
GitHub - mlfoundations/dclm: DataComp for Language Models
DataComp for Language Models. Contribute to mlfoundations/dclm development by creating an account on GitHub.
Викторина «Трансформеры с обнимашками»
В этом тесте вы проверите свое понимание Hugging Face Transformers . Эта библиотека является популярным выбором для работы с моделями трансформаторов в задачах обработки естественного языка, компьютерного зрения и других приложениях машинного обучения.
https://realpython.com/quizzes/hugging-face-transformers
В этом тесте вы проверите свое понимание Hugging Face Transformers . Эта библиотека является популярным выбором для работы с моделями трансформаторов в задачах обработки естественного языка, компьютерного зрения и других приложениях машинного обучения.
https://realpython.com/quizzes/hugging-face-transformers
Realpython
Hugging Face Transformers Quiz – Real Python
In this quiz, you'll test your understanding of the Hugging Face Transformers library. This library is a popular choice for working with transformer models in natural language processing tasks, computer vision, and other machine learning applications.
Модели ИИ терпят крах при обучении на рекурсивно сгенерированных данных
https://www.nature.com/articles/s41586-024-07566-y
https://www.nature.com/articles/s41586-024-07566-y
Nature
AI models collapse when trained on recursively generated data
Nature - Analysis shows that indiscriminately training generative artificial intelligence on real and generated content, usually done by scraping data from the Internet, can lead to a collapse in...
Прикладное машинное обучение для табличных данных
Мы хотим создать практическое руководство по разработке качественных предиктивных моделей из табличных данных… Книга дает целостный взгляд на процесс предиктивного моделирования и фокусируется на нескольких областях, которые обычно остаются вне подобных работ. Например, эффективность модели может зависеть от того, как представлены предикторы. Из-за этого мы тесно связываем методы проектирования признаков с моделями машинного обучения. Кроме того, довольно много работы происходит после того, как мы определили нашу лучшую модель и создали окончательную подгонку. Эти действия после моделирования являются важной частью процесса разработки модели и будут подробно описаны…
https://aml4td.org/
Мы хотим создать практическое руководство по разработке качественных предиктивных моделей из табличных данных… Книга дает целостный взгляд на процесс предиктивного моделирования и фокусируется на нескольких областях, которые обычно остаются вне подобных работ. Например, эффективность модели может зависеть от того, как представлены предикторы. Из-за этого мы тесно связываем методы проектирования признаков с моделями машинного обучения. Кроме того, довольно много работы происходит после того, как мы определили нашу лучшую модель и создали окончательную подгонку. Эти действия после моделирования являются важной частью процесса разработки модели и будут подробно описаны…
https://aml4td.org/
aml4td.org
Applied Machine Learning for Tabular Data
MINT-1T: мультимодальный чередующийся набор данных объемом один триллион токенов.
Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.
https://github.com/mlfoundations/mint-1t
Мультимодальные чередующиеся наборы данных, включающие чередующиеся последовательности изображений и текста свободной формы, имеют решающее значение для обучения передовых больших мультимодальных моделей (LMM). Несмотря на быстрое развитие LMM с открытым исходным кодом, по-прежнему наблюдается выраженный дефицит крупномасштабных разнообразных мультимодальных чередующихся наборов данных с открытым исходным кодом. В ответ на это мы представляем MINT-1T, самый обширный и разнообразный набор данных Multimodal INTerleaved с открытым исходным кодом на сегодняшний день.
https://github.com/mlfoundations/mint-1t
👍2
Изучите основы RAG и продвинутые методы
Понимание того, как улучшить возможности систем ИИ и машинного обучения, является ценным навыком. Одним из методов является Retrieval-Augmented Generation (RAG), мощная техника, которая сочетает методы, основанные на поиске, с генеративными моделями для создания более точных и контекстно-релевантных ответов.
https://www.freecodecamp.org/news/learn-rag-fundamentals-and-advanced-techniques
Понимание того, как улучшить возможности систем ИИ и машинного обучения, является ценным навыком. Одним из методов является Retrieval-Augmented Generation (RAG), мощная техника, которая сочетает методы, основанные на поиске, с генеративными моделями для создания более точных и контекстно-релевантных ответов.
https://www.freecodecamp.org/news/learn-rag-fundamentals-and-advanced-techniques
freeCodeCamp.org
Learn RAG Fundamentals and Advanced Techniques
Understanding how to enhance the capabilities of AI and machine learning systems is a valuable skill. One method is Retrieval-Augmented Generation (RAG), a powerful technique that combines retrieval-based methods with generative models to create more...
Потенциальное применение LLM, которое привлекло внимание и инвестиции, связано с их способностью генерировать SQL-запросы. Запросы к большим базам данных с использованием естественного языка открывают несколько привлекательных вариантов использования: от повышения прозрачности данных до улучшения доступности для нетехнических пользователей.
Однако, как и в случае с любым контентом, сгенерированным ИИ, вопрос оценки важен. Как мы можем определить, является ли SQL-запрос, сгенерированный LLM, правильным и дает ли он предполагаемые результаты? Наше недавнее исследование углубляется в этот вопрос и изучает эффективность использования LLM в качестве судьи для оценки генерации SQL.
https://towardsdatascience.com/evaluating-sql-generation-with-llm-as-a-judge-1ff69a70e7cf
Однако, как и в случае с любым контентом, сгенерированным ИИ, вопрос оценки важен. Как мы можем определить, является ли SQL-запрос, сгенерированный LLM, правильным и дает ли он предполагаемые результаты? Наше недавнее исследование углубляется в этот вопрос и изучает эффективность использования LLM в качестве судьи для оценки генерации SQL.
https://towardsdatascience.com/evaluating-sql-generation-with-llm-as-a-judge-1ff69a70e7cf
Medium
Evaluating SQL Generation with LLM as a Judge
Results point to a promising approach
Наглядное руководство по квантованию — демистификация сжатия LLM
Большие языковые модели (LLM) часто слишком велики для запуска на потребительском оборудовании. Эти модели могут содержать миллиарды параметров и, как правило, требуют графических процессоров с большим объемом видеопамяти для ускорения вывода. Таким образом, все больше исследований было сосредоточено на том, чтобы сделать эти модели меньше за счет улучшения обучения, адаптеров и т. д. Одна из основных методик в этой области называется квантованием. В этой статье я представлю область квантования в контексте моделирования языка и рассмотрю концепции одну за другой, чтобы развить интуицию об этой области. Мы рассмотрим различные методологии, варианты использования и принципы, лежащие в основе квантования… https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-quantization
Интерпретируемое машинное обучение
Руководство по созданию объяснимых моделей черного ящика
https://christophm.github.io/interpretable-ml-book
Большие языковые модели (LLM) часто слишком велики для запуска на потребительском оборудовании. Эти модели могут содержать миллиарды параметров и, как правило, требуют графических процессоров с большим объемом видеопамяти для ускорения вывода. Таким образом, все больше исследований было сосредоточено на том, чтобы сделать эти модели меньше за счет улучшения обучения, адаптеров и т. д. Одна из основных методик в этой области называется квантованием. В этой статье я представлю область квантования в контексте моделирования языка и рассмотрю концепции одну за другой, чтобы развить интуицию об этой области. Мы рассмотрим различные методологии, варианты использования и принципы, лежащие в основе квантования… https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-quantization
Интерпретируемое машинное обучение
Руководство по созданию объяснимых моделей черного ящика
https://christophm.github.io/interpretable-ml-book
Maartengrootendorst
A Visual Guide to Quantization
Exploring memory-efficient techniques for LLMs
Многоагентная структура веб-поисковой системы на основе LLM (например, Perplexity.ai Pro и SearchGPT)
MindSearch — это фреймворк поисковой системы ИИ с открытым исходным кодом и производительностью Perplexity.ai Pro. Вы можете просто развернуть его с собственной поисковой системой в стиле perplexity.ai с закрытыми исходными кодами LLM (GPT, Claude) или с открытыми исходными кодами LLM (InternLM2.5-7b-chat). https://github.com/internlm/mindsearch
MindSearch — это фреймворк поисковой системы ИИ с открытым исходным кодом и производительностью Perplexity.ai Pro. Вы можете просто развернуть его с собственной поисковой системой в стиле perplexity.ai с закрытыми исходными кодами LLM (GPT, Claude) или с открытыми исходными кодами LLM (InternLM2.5-7b-chat). https://github.com/internlm/mindsearch
GitHub
GitHub - InternLM/MindSearch: 🔍 An LLM-based Multi-agent Framework of Web Search Engine (like Perplexity.ai Pro and SearchGPT)
🔍 An LLM-based Multi-agent Framework of Web Search Engine (like Perplexity.ai Pro and SearchGPT) - InternLM/MindSearch
Исследователи Google DeepMind представляют Diffusion Augmented Agents: фреймворк машинного обучения для эффективного исследования и передачи обучения
https://www.marktechpost.com/2024/08/02/google-deepmind-researchers-introduce-diffusion-augmented-agents-a-machine-learning-framework-for-efficient-exploration-and-transfer-learning
https://www.marktechpost.com/2024/08/02/google-deepmind-researchers-introduce-diffusion-augmented-agents-a-machine-learning-framework-for-efficient-exploration-and-transfer-learning
MarkTechPost
Google DeepMind Researchers Introduce Diffusion Augmented Agents: A Machine Learning Framework for Efficient Exploration and Transfer…
Reinforcement learning (RL) focuses on how agents can learn to make decisions by interacting with their environment. These agents aim to maximize cumulative rewards over time by using trial and error. This field is particularly challenging due to the need…
Lagent: легкий фреймворк Python с открытым исходным кодом, позволяющий пользователям эффективно создавать агенты на основе больших языковых моделей (LLM)
https://www.marktechpost.com/2024/08/07/lagent-a-lightweight-open-source-python-framework-that-allows-users-to-efficiently-build-large-language-model-llm-based-agents
https://www.marktechpost.com/2024/08/07/lagent-a-lightweight-open-source-python-framework-that-allows-users-to-efficiently-build-large-language-model-llm-based-agents
MarkTechPost
Lagent: A Lightweight Open-Source Python Framework that Allows Users to Efficiently Build Large Language Model (LLM)-Based Agents
Developing efficient language model-based agents is crucial for various applications, from virtual assistants to automated customer service. However, creating these agents can be complex and resource-intensive. One can face challenges in integrating different…
CatVTON: конкатенация — это все, что вам нужно для виртуальной примерки с диффузионными моделями
https://github.com/zheng-chong/catvton
https://github.com/zheng-chong/catvton
GitHub
GitHub - Zheng-Chong/CatVTON: [ICLR 2025] CatVTON is a simple and efficient virtual try-on diffusion model with 1) Lightweight…
[ICLR 2025] CatVTON is a simple and efficient virtual try-on diffusion model with 1) Lightweight Network (899.06M parameters totally), 2) Parameter-Efficient Training (49.57M parameters trainable) ...
Создавайте более надежные деревья решений с помощью самонастройки и генетических алгоритмов
Метод, позволяющий лучше использовать деревья решений в качестве интерпретируемых моделей. https://towardsdatascience.com/create-stronger-decision-trees-with-bootstrapping-and-genetic-algorithms-1ae633a993c9
Метод, позволяющий лучше использовать деревья решений в качестве интерпретируемых моделей. https://towardsdatascience.com/create-stronger-decision-trees-with-bootstrapping-and-genetic-algorithms-1ae633a993c9
Medium
Create Stronger Decision Trees with bootstrapping and genetic algorithms
A technique to better allow decision trees to be used as interpretable models
Spark!= Pandas + Поддержка больших данных
Будьте осторожны, перенося свои знания с Pandas на Spark.
Pandas и Spark оперируют одним и тем же типом данных — таблицами. Однако способ их взаимодействия с ними существенно отличается.
Тем не менее, многие программисты часто переносят свои знания из Pandas в Spark, предполагая схожесть архитектуры, что приводит к узким местам в производительности.
https://blog.dailydoseofds.com/p/spark-pandas-big-data-support
Будьте осторожны, перенося свои знания с Pandas на Spark.
Pandas и Spark оперируют одним и тем же типом данных — таблицами. Однако способ их взаимодействия с ними существенно отличается.
Тем не менее, многие программисты часто переносят свои знания из Pandas в Spark, предполагая схожесть архитектуры, что приводит к узким местам в производительности.
https://blog.dailydoseofds.com/p/spark-pandas-big-data-support
Dailydoseofds
Spark != Pandas + Big Data Support
Extend your learnings from Pandas to Spark with caution.
❤2👍1
Как справиться с отсутствующими данными с помощью методов интерполяции в Pandas
Предотвратите потерю данных — научитесь профессионально обрабатывать отсутствующие данные, используя методы интерполяции в Pandas. https://www.kdnuggets.com/how-to-deal-with-missing-data-using-interpolation-techniques-in-pandas
Предотвратите потерю данных — научитесь профессионально обрабатывать отсутствующие данные, используя методы интерполяции в Pandas. https://www.kdnuggets.com/how-to-deal-with-missing-data-using-interpolation-techniques-in-pandas
KDnuggets
How to Deal with Missing Data Using Interpolation Techniques in Pandas - KDnuggets
Stop data from dropping out - learn how to handle missing data like a pro using interpolation techniques in Pandas.