This media is not supported in your browser
VIEW IN TELEGRAM
Новая модель-контроллер движения для генерации видео, который способен самостоятельно управлять сложным движением камеры и движением объектов в генерируемых видео.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🧍♂ Perpetual Humanoid Control for Real-time Simulated Avatars
Новая модель, которая позволяет добиться генерации текста в движение в режиме реального времени, используя симуляцию движения человека.
Контроллер, обеспечивает высокую точность имитации движений и восстановления положения при наличии помех и неожиданных падений.
🖥 Code: github.com/ZhengyiLuo/PerpetualHumanoidControl
🎓 Video: https://www.youtube.com/watch?v=zS6Y00EW37A
🔮 Project: https://zhengyiluo.github.io/PHC/
📚 ArXiv: https://arxiv.org/abs/2305.06456
@ai_machinelearning_big_data
Новая модель, которая позволяет добиться генерации текста в движение в режиме реального времени, используя симуляцию движения человека.
Контроллер, обеспечивает высокую точность имитации движений и восстановления положения при наличии помех и неожиданных падений.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥27👍8😁4❤2👏1💘1
This media is not supported in your browser
VIEW IN TELEGRAM
Генерация 4D-контента с пространственно-временной согласованностью!
Пайплайн обеспечивает условное создание 4D, позволяя пользователям задавать геометрию генераци и движение (монокулярные видео), тем самым обеспечивая контроль над созданием контента. #GaussianSplatting #3DGS
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20❤4🔥2
✔️ AIJack: Security and Privacy Risk Simulator for Machine Learning
Security and Privacy Risk Simulator for Machine Learning.
AIJack - библиотека с открытым исходным кодом, предназначенная для оценки рисков безопасности и конфиденциальности, связанных с обучением и развертыванием моделей машинного обучения.
На фоне растущего интереса к большим данным и искусственному интеллекту ускоряется прогресс в исследованиях и применения в бизнесе инструментов машинного обучения. Однако недавние исследования выявили потенциальные угрозы, такие как кража обучающих данных и манипулирование моделями со стороны злоумышленников.
Поэтому полное понимание уязвимостей моделей машинного обучения в области безопасности и конфиденциальности имеет решающее значение для безопасной интеграции машинного обучения в реальные проекты.
AIJack призван решить эту задачу, предоставляя библиотеку с различными методами атак и защиты через единый API.
🖥 Code: https://github.com/Koukyosyumei/AIJack
📚 Paper: https://arxiv.org/abs/2312.17667v1
⚡️ Docs: https://koukyosyumei.github.io/AIJack/
@ai_machinelearning_big_data
Security and Privacy Risk Simulator for Machine Learning.
AIJack - библиотека с открытым исходным кодом, предназначенная для оценки рисков безопасности и конфиденциальности, связанных с обучением и развертыванием моделей машинного обучения.
На фоне растущего интереса к большим данным и искусственному интеллекту ускоряется прогресс в исследованиях и применения в бизнесе инструментов машинного обучения. Однако недавние исследования выявили потенциальные угрозы, такие как кража обучающих данных и манипулирование моделями со стороны злоумышленников.
Поэтому полное понимание уязвимостей моделей машинного обучения в области безопасности и конфиденциальности имеет решающее значение для безопасной интеграции машинного обучения в реальные проекты.
AIJack призван решить эту задачу, предоставляя библиотеку с различными методами атак и защиты через единый API.
pip install git+https://github.com/Koukyosyumei/AIJack
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥6❤3
This media is not supported in your browser
VIEW IN TELEGRAM
🎙OpenVoice: Versatile Instant Voice Cloning
OpenVoice: Универсальное мгновенное клонирование голоса ✨
1. Точное клонирование тональности голоса. OpenVoice может точно клонировать тон голоса и генерировать речь на нескольких языках и акцентах.
2. Гибкое управление стилем голоса. OpenVoice позволяет контролировать стили голоса, такие как эмоции и акцент, а также другие параметры стиля, включая ритм, паузы и интонацию.
3. Кросс-языковое клонирование голоса.
🖥 Code: https://github.com/myshell-ai/OpenVoice
📚 Paper: https://arxiv.org/abs/2312.01479
⚡️ Page: https://research.myshell.ai/open-voice
🌟 Colab: https://github.com/camenduru/OpenVoice-colab
@ai_machinelearning_big_data
OpenVoice: Универсальное мгновенное клонирование голоса ✨
1. Точное клонирование тональности голоса. OpenVoice может точно клонировать тон голоса и генерировать речь на нескольких языках и акцентах.
2. Гибкое управление стилем голоса. OpenVoice позволяет контролировать стили голоса, такие как эмоции и акцент, а также другие параметры стиля, включая ритм, паузы и интонацию.
3. Кросс-языковое клонирование голоса.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31❤11🔥7😁1🎉1🙈1
This media is not supported in your browser
VIEW IN TELEGRAM
🦜 DreamTalk: When Expressive Talking Head Generation Meets Diffusion Probabilistic Models
DreamTalk - это фреймворк для создания выразительных говорящих голов, который может создавать высококачественные видеоролики говорящих голов в различных стилях речи.
DreamTalk демонстрирует высокую производительность при работе с разнообразными исходными данными, включая песни, речь на нескольких языках, зашумленное аудио.
🖥 Code: https://github.com/ali-vilab/dreamtalk
📚 Paper: https://arxiv.org/abs/2312.09767
⚡️ Page: https://dreamtalk-project.github.io
🌟 Colab: https://github.com/camenduru/dreamtalk-colab
@ai_machinelearning_big_data
DreamTalk - это фреймворк для создания выразительных говорящих голов, который может создавать высококачественные видеоролики говорящих голов в различных стилях речи.
DreamTalk демонстрирует высокую производительность при работе с разнообразными исходными данными, включая песни, речь на нескольких языках, зашумленное аудио.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19❤10🔥2🤔2
🦾 Free Course: The Hands-on Reinforcement Learning course 🚀
🔗 Для начинающих вот ссылка на обучаюущую платформу c ЗАДАЧАМИ С НУЛЯ - https://code-basics.com/ru
Обучение с подкреплением — один из способов машинного обучения, в ходе которого испытуемая система обучается, взаимодействуя с некоторой средой.
Это пошаговый практический курс, который поможет вам пройти изучить RL с сымых основ.
💻 Course
🖥 Github
#бесплаьныекурсы
@ai_machinelearning_big_data
🔗 Для начинающих вот ссылка на обучаюущую платформу c ЗАДАЧАМИ С НУЛЯ - https://code-basics.com/ru
Обучение с подкреплением — один из способов машинного обучения, в ходе которого испытуемая система обучается, взаимодействуя с некоторой средой.
Это пошаговый практический курс, который поможет вам пройти изучить RL с сымых основ.
#бесплаьныекурсы
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33❤6🔥4
PYTHON
In this notebook we have built a transformer model based on the Attention Is All You Need paper following along with Andrej Karpathy’s fantastic YouTube video: Let’s build GPT.
В этом блоге показн процесс создания и обучения трансформеров с нуля.
Шаг за шагом рассмотрен каждый основополагающий элемент с объяснением, что происходит на каждом этапе.
Этот блог написан в блокноте Jupyter, который вы можете скачать и использовать для самостоятельного выполнения кода по ходу работы.
📌 Notebook
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍39🔥11❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Рендеринг в реальном времени управляемых аватаров с 4D-головой на различных устройствах, включая мобильные.
BakedAvatar использует видеозаписи человека для создания качественных управляемых аватаров.
git clone https://github.com/buaavrcg/BakedAvatar
cd BakedAvatar
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24❤5🔥4😱2
Сегодня состоялся новый большой релиз от команды Colossal-AI!
Они выложили в открытый доступ новый алгоритм SwiftInfer.
Алгоритм позволяет на 46% улучшить производительность LLM!
Этот проект объединяет инновации из двух недавних проектов, таких как StreamingLLM и TensoRT-LLM, чтобы обеспечить лучшую производильность и низкую задержку при выводе LLM.
Как StreamingLLM решает эту проблему
📌 StreamingLLM решает проблему 'attentional sink' (поглощения внимания) , когда начальные лексемы в тексте получают непропорционально большое внимание алгоритма. В традиционных методах, производительность модели значительно снижается, как только эти начальные лексемы исключаются из окна внимания.
StreamingLLM решает эту проблему, обеспечивая постоянное включение этих важных начальных лексем в окно внимания, тем самым стабилизируя генерацию и поддерживая высокое качество без необходимости дополнительной тонкой настройки.
Очень интересный проект!
git clone https://github.com/hpcaitech/SwiftInfer.git
cd SwiftInfer
pip install.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥6❤2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥Physics-based Text-to-Motion🔥
🖥 Code: github.com/jiawei-ren/insactor
📚 Paper: arxiv.org/abs/2312.17135
⚡️ Project: https://jiawei-ren.github.io/projects/insactor/
@ai_machinelearning_big_data
InsActor
- генеративный фреймворк, использующий последние достижения в области диффузионных моделей движения человека для создания управляемых промптами анимаций персонажей, основанных на физике. @ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍29🔥11❤2🥰1🤔1
⚡️ SigLIP: a better CLIP model
SigLIP от Google теперь доступен в 🤗 Transformers!
Он улучшает CLIP с помощью функции сигмоидальной потери.
SOTA для пары изображение в текст и наоборот.
🖥 Github: https://github.com/NielsRogge/Transformers-Tutorials/blob/master/SigLIP/Inference_with_(multilingual)_SigLIP%2C_a_better_CLIP_model.ipynb
📚 Paper: https://arxiv.org/abs/2303.15343
⚡️ HF: https://huggingface.co/docs/transformers/main/en/model_doc/siglip
@ai_machinelearning_big_data
SigLIP от Google теперь доступен в 🤗 Transformers!
Он улучшает CLIP с помощью функции сигмоидальной потери.
SOTA для пары изображение в текст и наоборот.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25❤5🔥5
149 актеров, играющих пациентов, общались в прямом эфире с одним из 20 врачей, отобранных для теста и новым медицинским LLM от Google, AMIE.
После врачи-специалисты и пациенты оценивали качество обслуживания. AMIE обошел врачей.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥5❤2
This media is not supported in your browser
VIEW IN TELEGRAM
🖼️ DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders 🔥
DDColor - инструмент для естественной колоризации изображений.
Обширные эксперименты показывают, что DDColor превосходит все существующие современные разработки на бенчмарках.
🖥 Code: github.com/piddnad/DDColor
📚 Paper: arxiv.org/abs/2212.11613
🌟 Colab: https://github.com/camenduru/DDColor-colab
@ai_machinelearning_big_data
DDColor - инструмент для естественной колоризации изображений.
Обширные эксперименты показывают, что DDColor превосходит все существующие современные разработки на бенчмарках.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥33👍13❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Мощная система преобразования текста в звук от FAIR.
И да, она с открытым исходным кодом.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16🔥12👍6
📐 AlphaGeometry: An Olympiad-level AI system for geometry
Deepmind представили AlphaGeometry: систему искусственного интеллекта, которая решает олимпиадные задачи по геометрии на уровне, приближающемся к уровню золотого медалиста.
Система была обучена исключительно на синтетических данных и знаменует собой прорыв ИИ в области математики.
🖥 Code: https://github.com/google-deepmind/alphageometry
🚀 Deepmind: https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/
📚 Paper: https://www.nature.com/articles/s41586-023-06747-5
@ai_machinelearning_big_data
Deepmind представили AlphaGeometry: систему искусственного интеллекта, которая решает олимпиадные задачи по геометрии на уровне, приближающемся к уровню золотого медалиста.
Система была обучена исключительно на синтетических данных и знаменует собой прорыв ИИ в области математики.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43👍12🤔11🥰3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
💃 (Moore) Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation
Animate Anyone: новая модель синтеза изображения в видео для качественно анимации персонажей.
🖥 Code: https://github.com/MooreThreads/Moore-AnimateAnyone
🚀 Colab: github.com/camenduru/Moore-AnimateAnyone-colab
📚 Paper: arxiv.org/abs/2311.17117
🌟 Project: humanaigc.github.io/animate-anyone/
@ai_machinelearning_big_data
Animate Anyone: новая модель синтеза изображения в видео для качественно анимации персонажей.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24❤8👍3❤🔥1
🥈 Kandinsky от Сбера стала второй по популярности нейросетью среди разработчиков по версии Hugging Face
AI-ресурс с лучшими open-source решениями выпустил рейтинг, где нейросеть Kandinsky от Сбера стала лидером по темпам роста, но уступила первое место Stable Diffusion по популярности среди разработчиков.
Разработчики Kandinsky отметили, что по итогам 2023 года аудитория нейросети выросла до 12 млн человек, а число сгенерированных в прошлом году изображений превысило 200 млн.
📚 Paper
@ai_machinelearning_big_data
AI-ресурс с лучшими open-source решениями выпустил рейтинг, где нейросеть Kandinsky от Сбера стала лидером по темпам роста, но уступила первое место Stable Diffusion по популярности среди разработчиков.
Разработчики Kandinsky отметили, что по итогам 2023 года аудитория нейросети выросла до 12 млн человек, а число сгенерированных в прошлом году изображений превысило 200 млн.
📚 Paper
@ai_machinelearning_big_data
Telegram
Kandinsky
Kandinsky by Sber AI
❤26👍9😁6🥱6🔥3👏3🤪2❤🔥1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Google представили ASPIRE - фреймворк, который расширяет возможности предсказания больших языковых моделей, позволяя им выдавать ответ в паре с оценкой уверенности.
Узнайте, почему он превосходит современные методы на различных наборах данных QA.
https://blog.research.google/2024/01/introducing-aspire-for-selective.html
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥6👍3🥰2
🦾 Hard skills ML-разработчиков: Яндекс составил карту технических навыков для специалистов по Machine Learning
На ней можно найти, какие навыки тесно связаны между собой и к каким инструментам интерес особенно вырос за последний год.
Чем больше надпись на карте, тем чаще разработчики искали информацию по тегу. Чем ближе два навыка друг к другу, тем ближе контекст, в котором они применяются.
Можно побродить по карте, а ещё заполнить чек-лист на основе трендов 2023 года. Полезное.
@ai_machinelearning_big_data
На ней можно найти, какие навыки тесно связаны между собой и к каким инструментам интерес особенно вырос за последний год.
Чем больше надпись на карте, тем чаще разработчики искали информацию по тегу. Чем ближе два навыка друг к другу, тем ближе контекст, в котором они применяются.
Можно побродить по карте, а ещё заполнить чек-лист на основе трендов 2023 года. Полезное.
@ai_machinelearning_big_data
🔥28👍5😁5❤2🥰1🤓1