Machinelearning – Telegram

Machinelearning

@ai_machinelearning_big_data

304K subscribers

4.01K photos

710 videos

17 files

4.59K links

Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri

Download Telegram

About

Blog

Apps

Platform

Machinelearning

304K subscribers

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌪 Can machine learning predict chaos?

Может ли машинное обучение предсказывать хаос? В новой статье проводится масштабное сравнение современных методов прогнозирования на гигантском наборе данных из 135 хаотических систем.

https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.5.043252

@ai_machinelearning_big_data

👍24❤7🎉5🔥2🍌1

11.1K views19:39

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models 🎄 🎁 🎅 Colab 🥳

PIA, аниматор изображений, который превосходит аналоги в согласованности текста с изображениями.

🎓

page: https://pi-animator.github.io

📚

paper: https://arxiv.org/abs/2312.13964

🖥

code: https://github.com/open-mmlab/PIA

🥩

OpenXLab: https://openxlab.org.cn/apps/detail/zhangyiming/PiaPia

🥩

colab: https://github.com/camenduru/PIA-colab

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍22❤6🎉3🔥1😁1

11.4K views05:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🖥

Десять самых ярких ИИ-работ от NVIDIA Research за 2023 год.

- Neuralangelo: потрясающая высокоточная 3D-реконструкция поверхностей. https://research.nvidia.com/labs/dir/neuralangelo/

- Magic3D: быстрое преобразование текста в 3D! https://research.nvidia.com/labs/dir/magic3d/

- Hair Simulation: эффективное моделирование дискретных упругих стержней (DER) для волос. Это не совсем работа над искусственным интеллектом, но очень визуально привлекательная технология. https://research.nvidia.com/publication/2023-08_interactive-hair-simulation-gpu-using-admm

-Eureka: GPT-4 учит робота-руку крутить ручки! https://eureka-research.github.io

- Align Your Latents: синтез видео высокого разрешения с помощью моделей латентной диффузии. Одна из лучших работ по генерации видео в 2023 году. https://research.nvidia.com/labs/toronto-ai/VideoLDM/

- Text2Materials: Модель работы с текстовыми промптами для генерации материалов, таких как кирпич или мозаика, которые можно выложить плиткой и плавно воспроизвести на поверхности любого размера.
https://blogs.nvidia.com/blog/siggraph-research-generative-ai-materials-3d-scenes/

- CALM: метод обучения управляемых виртуальных персонажей выполнению действий в физическом симуляторе. https://research.nvidia.com/labs/par/

- Vid2Player3D: обучение навыкам игры в теннис для виртуальных персонажей! https://research.nvidia.com/labs/toronto-ai/vid2player3d/

- Flexicubes: mesh optimization https://research.nvidia.com/labs/toronto-ai/flexicubes/

- eDiff-I: диффузия текста в изображение с помощью ансамбля экспертных моделей.
https://research.nvidia.com/labs/dir/eDiff-I/

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥9❤5😁1🎉1

12.1K views07:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌠

AnyDoor: Zero-shot Object-level Image Customization

AnyDoor - новый генератор изображений на основе диффузии, который может гармонично вписывать любые объекты в новые сцены в указанных местах.

Модель, обучена на видео и понимает разные ракурсы и освещения объектов, чтобы вписывать изображения в любой новый план с новым освещением и камерой.

pip install git+https://github.com/cocodataset/panopticapi.git

pip install pycocotools -i https://pypi.douban.com/simple

pip install lvis

🖥

Code: https://github.com/damo-vilab/AnyDoor

🎓

HF: https://huggingface.co/spaces/xichenhku/AnyDoor-online

🔮

Project Page: https://damo-vilab.github.io/AnyDoor-Page/

📚

ArXiv: https://arxiv.org/abs/2307.09481

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍21❤5🎉2🔥1🗿1

11.9K views11:01

Machinelearning

☑️Here are some of the most remarkable AI releases of the year.

2023 год был годом ИИ!

Вот некоторые из самых значимых ИИ релизов года...👇

https://journal.everypixel.com/2023-the-year-of-ai

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤21👍7🔥2

13.5K views09:03

Machinelearning

🍏

Ferret: Refer and Ground Anything Anywhere at Any Granularity

Новая новая мультимодальная модель большого языка (MLLM) от Apple, которая может точно распознавать отдельные объекты и их отдельные части на изображении и обсуждать всю информацию с пользователем.

В точности и скорости обработки данных с изображений на бенчмарках Ferret опережает GPT-4🔥

🖥

Code: github.com/apple/ml-ferret

🎓

Paper: https://arxiv.org/abs/2310.07704

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥6❤1

12.5K views07:01

Machinelearning

📌

Модель машинного обучения Ferret-UI от Apple

⏩Apple представила модель машинного обучения Ferret-UI для распознавания элементов пользовательского интерфейса. В исследовании компания отметила, что практически все доступные мультимодальные языковые модели плохо работают с интерфейсами. Нейросети не отличают кнопки от полей ввода и других элементов.

⏩Компания собрала большой датасет для обучения Ferret-UI, что значительно улучшило распознавание. Отмечается, что нейросеть превосходит не только открытые MLLM, но и GPT-4. Модель можно использовать для реализации новых функций доступности. К примеру, нейросеть сможет управлять мобильным устройством, опираясь на запросы пользователя.

📎Инженеры компании опубликовали исследование на портале Arxiv.

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍6💊3🔥1

11.1K viewsedited 10:33

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🐱

DiffMorpher: Unleashing the Capability of Diffusion Models for Image Morphing

DiffMorpher - новый подход, обеспечивающий плавное преобрахование изображений с помощью диффузионных моделей.

🖥

Code: https://github.com/Kevin-thu/DiffMorpher

🧪

OpenXLab: https://openxlab.org.cn/apps/detail/KaiwenZhang/DiffMorpher

🎓

Colab: https://github.com/camenduru/DiffMorpher-colab

🔮

Project Page: https://kevin-thu.github.io/DiffMorpher_page

📚

ArXiv: https://arxiv.org/abs/2312.07409

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👏9🔥6👍5❤2🥰1

11.8K views18:16

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

MotionCtrl: A Unified and Flexible Motion Controller for Video Generation

Новая модель-контроллер движения для генерации видео, который способен самостоятельно управлять сложным движением камеры и движением объектов в генерируемых видео.

🖥

Code: https://github.com/TencentARC/MotionCtrl

🎓

Colab: https://github.com/camenduru/MotionCtrl-colab

🔮

Project Page: https://openxlab.org.cn/apps/detail/camenduru/MotionCtrl

📚

ArXiv: https://arxiv.org/abs/2312.03641

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11❤3🔥3

12.5K views06:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🧍‍♂ Perpetual Humanoid Control for Real-time Simulated Avatars

Новая модель, которая позволяет добиться генерации текста в движение в режиме реального времени, используя симуляцию движения человека.

Контроллер, обеспечивает высокую точность имитации движений и восстановления положения при наличии помех и неожиданных падений.

🖥

Code: github.com/ZhengyiLuo/PerpetualHumanoidControl

🎓 Video: https://www.youtube.com/watch?v=zS6Y00EW37A

🔮

Project: https://zhengyiluo.github.io/PHC/

📚

ArXiv: https://arxiv.org/abs/2305.06456

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥27👍8😁4❤2👏1💘1

13.1K views09:01

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌹

4DGen: Grounded 4D Content Generation with Spatial-temporal Consistency

Генерация 4D-контента с пространственно-временной согласованностью!

Пайплайн обеспечивает условное создание 4D, позволяя пользователям задавать геометрию генераци и движение (монокулярные видео), тем самым обеспечивая контроль над созданием контента. #GaussianSplatting #3DGS

🖥

Code: https://github.com/VITA-Group/4DGen

🔮

Project: https://vita-group.github.io/4DGen/

📚

ArXiv: https://arxiv.org/abs/2305.06456

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20❤4🔥2

12.6K views07:19

Machinelearning

✔️ AIJack: Security and Privacy Risk Simulator for Machine Learning

Security and Privacy Risk Simulator for Machine Learning.

AIJack - библиотека с открытым исходным кодом, предназначенная для оценки рисков безопасности и конфиденциальности, связанных с обучением и развертыванием моделей машинного обучения.

На фоне растущего интереса к большим данным и искусственному интеллекту ускоряется прогресс в исследованиях и применения в бизнесе инструментов машинного обучения. Однако недавние исследования выявили потенциальные угрозы, такие как кража обучающих данных и манипулирование моделями со стороны злоумышленников.

Поэтому полное понимание уязвимостей моделей машинного обучения в области безопасности и конфиденциальности имеет решающее значение для безопасной интеграции машинного обучения в реальные проекты.

AIJack призван решить эту задачу, предоставляя библиотеку с различными методами атак и защиты через единый API.

pip install git+https://github.com/Koukyosyumei/AIJack

🖥

Code: https://github.com/Koukyosyumei/AIJack

📚

Paper: https://arxiv.org/abs/2312.17667v1

⚡️

Docs: https://koukyosyumei.github.io/AIJack/

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍18🔥6❤3

13.1K viewsedited 06:59

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🎙OpenVoice: Versatile Instant Voice Cloning

OpenVoice: Универсальное мгновенное клонирование голоса ✨

1. Точное клонирование тональности голоса. OpenVoice может точно клонировать тон голоса и генерировать речь на нескольких языках и акцентах.

2. Гибкое управление стилем голоса. OpenVoice позволяет контролировать стили голоса, такие как эмоции и акцент, а также другие параметры стиля, включая ритм, паузы и интонацию.

3. Кросс-языковое клонирование голоса.

🖥

Code: https://github.com/myshell-ai/OpenVoice

📚

Paper: https://arxiv.org/abs/2312.01479

⚡️

Page: https://research.myshell.ai/open-voice

🌟

Colab: https://github.com/camenduru/OpenVoice-colab

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍31❤11🔥7😁1🎉1🙈1

14.4K views08:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🦜 DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models

DreamTalk - это фреймворк для создания выразительных говорящих голов, который может создавать высококачественные видеоролики говорящих голов в различных стилях речи.

DreamTalk демонстрирует высокую производительность при работе с разнообразными исходными данными, включая песни, речь на нескольких языках, зашумленное аудио.

🖥

Code: https://github.com/ali-vilab/dreamtalk

📚

Paper: https://arxiv.org/abs/2312.09767

⚡️

Page: https://dreamtalk-project.github.io

🌟

Colab: https://github.com/camenduru/dreamtalk-colab

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19❤10🔥2🤔2

14.2K views09:02

Machinelearning

🦾 Free Course: The Hands-on Reinforcement Learning course 🚀

🔗 Для начинающих вот ссылка на обучаюущую платформу c ЗАДАЧАМИ С НУЛЯ - https://code-basics.com/ru

Обучение с подкреплением — один из способов машинного обучения, в ходе которого испытуемая система обучается, взаимодействуя с некоторой средой.

Это пошаговый практический курс, который поможет вам пройти изучить RL с сымых основ.

💻

🖥

Github

#бесплаьныекурсы

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍33❤6🔥4

14.7K viewsedited 17:21

Machinelearning

🖥

Transformers From Scratch
PYTHON

In this notebook we have built a transformer model based on the Attention Is All You Need paper following along with Andrej Karpathy’s fantastic YouTube video: Let’s build GPT.

В этом блоге показн процесс создания и обучения трансформеров с нуля.

Шаг за шагом рассмотрен каждый основополагающий элемент с объяснением, что происходит на каждом этапе.

Этот блог написан в блокноте Jupyter, который вы можете скачать и использовать для самостоятельного выполнения кода по ходу работы.

📌 Notebook

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍39🔥11❤6

14.6K views08:02

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🧠

BakedAvatar: Baking Neural Fields for Real-Time Head Avatar Synthesis

Рендеринг в реальном времени управляемых аватаров с 4D-головой на различных устройствах, включая мобильные.

BakedAvatar использует видеозаписи человека для создания качественных управляемых аватаров.

git clone https://github.com/buaavrcg/BakedAvatar
cd BakedAvatar

🖥

Code: https://github.com/buaavrcg/BakedAvatar

📚

Paper: https://dl.acm.org/doi/10.1145/3618399

⚡️

Page: https://buaavrcg.github.io/BakedAvatar/

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍24❤5🔥4😱2

12.9K views06:05

Machinelearning

⚡️

The SwiftInfer project combines StearmingLLM with TesorR-LLM to make the inference efficiency and productivity much higher.

Сегодня состоялся новый большой релиз от команды Colossal-AI!

Они выложили в открытый доступ новый алгоритм SwiftInfer.

Алгоритм позволяет на 46% улучшить производительность LLM!

Этот проект объединяет инновации из двух недавних проектов, таких как StreamingLLM и TensoRT-LLM, чтобы обеспечить лучшую производильность и низкую задержку при выводе LLM.

Как StreamingLLM решает эту проблему

📌 StreamingLLM решает проблему 'attentional sink' (поглощения внимания) , когда начальные лексемы в тексте получают непропорционально большое внимание алгоритма. В традиционных методах, производительность модели значительно снижается, как только эти начальные лексемы исключаются из окна внимания.

StreamingLLM решает эту проблему, обеспечивая постоянное включение этих важных начальных лексем в окно внимания, тем самым стабилизируя генерацию и поддерживая высокое качество без необходимости дополнительной тонкой настройки.

Очень интересный проект!

git clone https://github.com/hpcaitech/SwiftInfer.git
cd SwiftInfer
pip install.

🖥

Github

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20🔥6❤2

13.3K views08:00

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🔥Physics-based Text-to-Motion🔥

InsActor - генеративный фреймворк, использующий последние достижения в области диффузионных моделей движения человека для создания управляемых промптами анимаций персонажей, основанных на физике.

🖥

Code: github.com/jiawei-ren/insactor

📚

Paper: arxiv.org/abs/2312.17135

⚡️

Project: https://jiawei-ren.github.io/projects/insactor/

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍29🔥11❤2🥰1🤔1

12.5K views06:29

Machinelearning

⚡️ SigLIP: a better CLIP model

SigLIP от Google теперь доступен в 🤗 Transformers!

Он улучшает CLIP с помощью функции сигмоидальной потери.

SOTA для пары изображение в текст и наоборот.

🖥

Github: https://github.com/NielsRogge/Transformers-Tutorials/blob/master/SigLIP/Inference_with_(multilingual)_SigLIP%2C_a_better_CLIP_model.ipynb

📚

Paper: https://arxiv.org/abs/2303.15343

⚡️

HF: https://huggingface.co/docs/transformers/main/en/model_doc/siglip

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25❤5🔥5

18.4K views06:16