This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть обучили анализировать картинку и под её настроение генерировать музыку. Такой саундтрек изображения, получается.
Mubert работает так: в неё попадают теги-подсказки, полученные из картинки. Каждому множеству тегов соответствует множество звуков, из которых дальше и генерируется саундтрек.
Есть ещё API на базе Mubert и Stable Diffusion, которое может генерить музыку из разных картинок с анимацией. Из этого всего получается видео, как выше.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥2❤1😁1
🤗 A Dive into Vision-Language Models
https://huggingface.co/blog/vision_language_pretraining
@machinelearning_ru
https://huggingface.co/blog/vision_language_pretraining
@machinelearning_ru
👍6❤2🔥1
Знакомство с моделями машинного обучения, которые поддерживают ChatGPT, начнётся с представления больших языковых моделей, погружения в революционный Механизм внимания, который позволил обучить GPT-3, а затем углубится в обучение с подкреплением на основе обратной связи с человеком, новой техники, которая сделала ChatGPT таким уникальным.
▪ Читать дальше
▪ Видео
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 MOSE: A New Dataset for Video Object Segmentation in Complex Scenes
Новый большой набор данных для сегментации сложных видеообъектов.
🖥 Github
✔️ Dataset
📝 Paper
@machinelearning_ru
Новый большой набор данных для сегментации сложных видеообъектов.
📝 Paper
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2
Microsoft создали модель, которая имитирует голос человека на основе трёхсекундной записи.
https://www.youtube.com/watch?v=F6HSsVIkqIU
• Подробнее
• GitHub
@machinelearning_ru
https://www.youtube.com/watch?v=F6HSsVIkqIU
• Подробнее
• GitHub
@machinelearning_ru
YouTube
Microsoft’s New AI Clones Your Voice In 3 Seconds!
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers" is available here:
https://valle-demo.github.io/
My latest paper on simulations…
📝 The paper "VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers" is available here:
https://valle-demo.github.io/
My latest paper on simulations…
👍9❤4🔥4😱2
Смотреть
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Как писать код с ChatGpt!
Chatgpt пишет код на уровне junior разработчика. Нейросеть может заметно облегчить жизнь программистам. В этом видео мы расскажем, как пользоваться chatgpt для написания кода.
https://t.iss.one/+IRlw-rMEdm9jNjQy - chatgpt ведет телеграм!
Пишем Telegram bot с…
https://t.iss.one/+IRlw-rMEdm9jNjQy - chatgpt ведет телеграм!
Пишем Telegram bot с…
👍10❤1🔥1
💭 Speech Synthesis, Recognition, and More With SpeechT5
▪speech-to-text for automatic speech recognition or speaker identification,
▪text-to-speech to synthesize audio, and
▪speech-to-speech for converting between different voices or performing speech enhancement.
🖥 Github: https://huggingface.co/blog/speecht5
💨 Demo: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
@machinelearning_ru
▪speech-to-text for automatic speech recognition or speaker identification,
▪text-to-speech to synthesize audio, and
▪speech-to-speech for converting between different voices or performing speech enhancement.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
Pyserini is a Python toolkit for reproducible information retrieval research with sparse and dense representations.
pip install pyserini@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1
Как организовать работу над ML-экспериментами с помощью MLflow
Ребята из VK Cloud и Karpov.Courses в своей статье на Хабре рассказали, как выстроить MLOps-подход в облаке. А именно:
- Что могут инструменты JupyterHub и MLflow в облаке;
- Как использовать их для MLOps на практике (на примере Cloud ML Platform);
- Какую последовательность действий по выстраиванию MLOps рекомендуют авторы.
Читать дальше
@machinelearning_ru
Ребята из VK Cloud и Karpov.Courses в своей статье на Хабре рассказали, как выстроить MLOps-подход в облаке. А именно:
- Что могут инструменты JupyterHub и MLflow в облаке;
- Как использовать их для MLOps на практике (на примере Cloud ML Platform);
- Какую последовательность действий по выстраиванию MLOps рекомендуют авторы.
Читать дальше
@machinelearning_ru
👍4❤1🔥1
ControlNet
ControlNet - Новый способ контролировать генерацию. Улучшение Stable Diffusion в плане тотального контроля над генерируемой картинкой.
🖥 Github: https://github.com/lllyasviel/ControlNet
⭐️ Paper: https://arxiv.org/abs/2302.05543
💻 Demo: https://paperswithcode.com/dataset/visdrone
@machinelearning_ru
ControlNet - Новый способ контролировать генерацию. Улучшение Stable Diffusion в плане тотального контроля над генерируемой картинкой.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1
Towards Robust Blind Face Restoration with Codebook Lookup Transformer
Нейросетевая модель для восстановления размытых, поврежденных, низкокачественных фотографий.
🖥 Github: https://github.com/sczhou/CodeFormer
⭐️ Colab: https://colab.research.google.com/drive/1m52PNveE4PBhYrecj34cnpEeiHcC5LTb?usp=sharing
💻 Demo: https://huggingface.co/spaces/sczhou/CodeFormer
@machinelearning_ru
Нейросетевая модель для восстановления размытых, поврежденных, низкокачественных фотографий.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥3❤2
Вы хотите узнать что-то новое? Я тоже. Итак, я собрал отличный список бесплатных курсов от Google, которые вы можете начать изучать прямо сейчас. Ловите список и хорощей учебы!
Список содержит курсы, связанные с цифровым маркетингом, Google Analytics, Google Maps, Python, Google Cloud, Data Science и машинным обучением.
📌Читать
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
VoxFormer: a Cutting-edge Baseline for 3D Semantic Occupancy Prediction
A Cutting-edge Baseline for 3D Semantic Occupancy Prediction
🖥 Github: github.com/NVlabs/VoxFormer
⭐️ Paper: https://arxiv.org/abs/2302.12251
@machinelearning_ru
A Cutting-edge Baseline for 3D Semantic Occupancy Prediction
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤1🔥1
⚽️ EA’s Gaming AI: Incredible Juggling Skills!
Видео: https://www.youtube.com/watch?v=L5KOQkZOusE
Статья: https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html
@machinelearning_ru
Видео: https://www.youtube.com/watch?v=L5KOQkZOusE
Статья: https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html
@machinelearning_ru
YouTube
EA’s New AI: Next-Level Games Are Coming!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.com/papers
📝 The paper "Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts" is available here:
https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html…
📝 The paper "Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts" is available here:
https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html…
👍6❤1🔥1
SplineCam: Neural Decision Boundary
🖥 Github: https://github.com/AhmedImtiazPrio/SplineCAM
⭐️ Paper: https://arxiv.org/pdf/2302.12828.pdf
💻 Project : https://imtiazhumayun.github.io/splinecam
@machinelearning_ru
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Идентификация круглых печатей на изображении
Анализ данных, получаемых при обработке изображений — популярная тема среди разработчиков и аналитиков. Я поделюсь опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.
Идея обратиться к идентификации геометрических объектов на изображении родилась при решении задачи поиска фальсификата в pdf файлах.
В период пандемии многие организации перешли на особый режим работы, личное взаимодействие с клиентами снизилось, поменялись бизнес-процессы. Изменения коснулись оформления первичных документов, чаще стали встречаться скан-копии файлов со вставленными подписями и печатями в виде отдельных картинок. Для оценки объема и формирования пула соответствующих документов потребовалось создать инструмент, способный «просмотреть» более 20 Гбайт файлов на предмет наличия указанных отклонений.
Задача:
Идентификация наличия круглых печатей на странице сканированного документа.
Реализация:
Python OpenCV (версия 4.6.0) – open source библиотека компьютерного зрения.
▪ Читать
@machinelearning_ru
Анализ данных, получаемых при обработке изображений — популярная тема среди разработчиков и аналитиков. Я поделюсь опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.
Идея обратиться к идентификации геометрических объектов на изображении родилась при решении задачи поиска фальсификата в pdf файлах.
В период пандемии многие организации перешли на особый режим работы, личное взаимодействие с клиентами снизилось, поменялись бизнес-процессы. Изменения коснулись оформления первичных документов, чаще стали встречаться скан-копии файлов со вставленными подписями и печатями в виде отдельных картинок. Для оценки объема и формирования пула соответствующих документов потребовалось создать инструмент, способный «просмотреть» более 20 Гбайт файлов на предмет наличия указанных отклонений.
Задача:
Идентификация наличия круглых печатей на странице сканированного документа.
Реализация:
Python OpenCV (версия 4.6.0) – open source библиотека компьютерного зрения.
▪ Читать
@machinelearning_ru
👍12❤1🔥1
Google’s Video Editor AI: Absolute Magic!
https://www.youtube.com/watch?v=G1dXEM_7lh8
Dreamix: Video Diffusion Models are General Video Editors: https://dreamix-video-editing.github.io/
@machinelearning_ru
https://www.youtube.com/watch?v=G1dXEM_7lh8
Dreamix: Video Diffusion Models are General Video Editors: https://dreamix-video-editing.github.io/
@machinelearning_ru
YouTube
Google’s Video Editor AI: Absolute Magic!
❤️ Check out Fully Connected by Weights & Biases: https://wandb.me/papers
📝 The paper "Dreamix: Video Diffusion Models are General Video Editors" is available here:
https://dreamix-video-editing.github.io/
My latest paper on simulations that look almost…
📝 The paper "Dreamix: Video Diffusion Models are General Video Editors" is available here:
https://dreamix-video-editing.github.io/
My latest paper on simulations that look almost…
👍7🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
3D generation on ImageNet
🖥 Github: https://github.com/snap-research/3dgp
⏩ Paper: https://arxiv.org/abs/2303.01500v1
📝 Project: https://snap-research.github.io/3dgp/
@machinelearning_ru
📝 Project: https://snap-research.github.io/3dgp/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥2❤1