Microsoft создали модель, которая имитирует голос человека на основе трёхсекундной записи.
https://www.youtube.com/watch?v=F6HSsVIkqIU
• Подробнее
• GitHub
@machinelearning_ru
https://www.youtube.com/watch?v=F6HSsVIkqIU
• Подробнее
• GitHub
@machinelearning_ru
YouTube
Microsoft’s New AI Clones Your Voice In 3 Seconds!
❤️ Check out Lambda here and sign up for their GPU Cloud: https://lambdalabs.com/papers
📝 The paper "VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers" is available here:
https://valle-demo.github.io/
My latest paper on simulations…
📝 The paper "VALL-E Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers" is available here:
https://valle-demo.github.io/
My latest paper on simulations…
👍9❤4🔥4😱2
Смотреть
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
Как писать код с ChatGpt!
Chatgpt пишет код на уровне junior разработчика. Нейросеть может заметно облегчить жизнь программистам. В этом видео мы расскажем, как пользоваться chatgpt для написания кода.
https://t.iss.one/+IRlw-rMEdm9jNjQy - chatgpt ведет телеграм!
Пишем Telegram bot с…
https://t.iss.one/+IRlw-rMEdm9jNjQy - chatgpt ведет телеграм!
Пишем Telegram bot с…
👍10❤1🔥1
💭 Speech Synthesis, Recognition, and More With SpeechT5
▪speech-to-text for automatic speech recognition or speaker identification,
▪text-to-speech to synthesize audio, and
▪speech-to-speech for converting between different voices or performing speech enhancement.
🖥 Github: https://huggingface.co/blog/speecht5
💨 Demo: https://huggingface.co/spaces/Matthijs/speecht5-asr-demo
@machinelearning_ru
▪speech-to-text for automatic speech recognition or speaker identification,
▪text-to-speech to synthesize audio, and
▪speech-to-speech for converting between different voices or performing speech enhancement.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤1🔥1
Pyserini is a Python toolkit for reproducible information retrieval research with sparse and dense representations.
pip install pyserini@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤1🔥1
Как организовать работу над ML-экспериментами с помощью MLflow
Ребята из VK Cloud и Karpov.Courses в своей статье на Хабре рассказали, как выстроить MLOps-подход в облаке. А именно:
- Что могут инструменты JupyterHub и MLflow в облаке;
- Как использовать их для MLOps на практике (на примере Cloud ML Platform);
- Какую последовательность действий по выстраиванию MLOps рекомендуют авторы.
Читать дальше
@machinelearning_ru
Ребята из VK Cloud и Karpov.Courses в своей статье на Хабре рассказали, как выстроить MLOps-подход в облаке. А именно:
- Что могут инструменты JupyterHub и MLflow в облаке;
- Как использовать их для MLOps на практике (на примере Cloud ML Platform);
- Какую последовательность действий по выстраиванию MLOps рекомендуют авторы.
Читать дальше
@machinelearning_ru
👍4❤1🔥1
ControlNet
ControlNet - Новый способ контролировать генерацию. Улучшение Stable Diffusion в плане тотального контроля над генерируемой картинкой.
🖥 Github: https://github.com/lllyasviel/ControlNet
⭐️ Paper: https://arxiv.org/abs/2302.05543
💻 Demo: https://paperswithcode.com/dataset/visdrone
@machinelearning_ru
ControlNet - Новый способ контролировать генерацию. Улучшение Stable Diffusion в плане тотального контроля над генерируемой картинкой.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2🔥1
Towards Robust Blind Face Restoration with Codebook Lookup Transformer
Нейросетевая модель для восстановления размытых, поврежденных, низкокачественных фотографий.
🖥 Github: https://github.com/sczhou/CodeFormer
⭐️ Colab: https://colab.research.google.com/drive/1m52PNveE4PBhYrecj34cnpEeiHcC5LTb?usp=sharing
💻 Demo: https://huggingface.co/spaces/sczhou/CodeFormer
@machinelearning_ru
Нейросетевая модель для восстановления размытых, поврежденных, низкокачественных фотографий.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥3❤2
Вы хотите узнать что-то новое? Я тоже. Итак, я собрал отличный список бесплатных курсов от Google, которые вы можете начать изучать прямо сейчас. Ловите список и хорощей учебы!
Список содержит курсы, связанные с цифровым маркетингом, Google Analytics, Google Maps, Python, Google Cloud, Data Science и машинным обучением.
📌Читать
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
VoxFormer: a Cutting-edge Baseline for 3D Semantic Occupancy Prediction
A Cutting-edge Baseline for 3D Semantic Occupancy Prediction
🖥 Github: github.com/NVlabs/VoxFormer
⭐️ Paper: https://arxiv.org/abs/2302.12251
@machinelearning_ru
A Cutting-edge Baseline for 3D Semantic Occupancy Prediction
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤1🔥1
⚽️ EA’s Gaming AI: Incredible Juggling Skills!
Видео: https://www.youtube.com/watch?v=L5KOQkZOusE
Статья: https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html
@machinelearning_ru
Видео: https://www.youtube.com/watch?v=L5KOQkZOusE
Статья: https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html
@machinelearning_ru
YouTube
EA’s New AI: Next-Level Games Are Coming!
❤️ Check out Weights & Biases and sign up for a free demo here: https://wandb.com/papers
📝 The paper "Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts" is available here:
https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html…
📝 The paper "Learning Soccer Juggling Skills with Layer-wise Mixture-of-Experts" is available here:
https://www.cs.ubc.ca/~van/papers/2022-SIGGRAPH-juggle/index.html…
👍6❤1🔥1
SplineCam: Neural Decision Boundary
🖥 Github: https://github.com/AhmedImtiazPrio/SplineCAM
⭐️ Paper: https://arxiv.org/pdf/2302.12828.pdf
💻 Project : https://imtiazhumayun.github.io/splinecam
@machinelearning_ru
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Идентификация круглых печатей на изображении
Анализ данных, получаемых при обработке изображений — популярная тема среди разработчиков и аналитиков. Я поделюсь опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.
Идея обратиться к идентификации геометрических объектов на изображении родилась при решении задачи поиска фальсификата в pdf файлах.
В период пандемии многие организации перешли на особый режим работы, личное взаимодействие с клиентами снизилось, поменялись бизнес-процессы. Изменения коснулись оформления первичных документов, чаще стали встречаться скан-копии файлов со вставленными подписями и печатями в виде отдельных картинок. Для оценки объема и формирования пула соответствующих документов потребовалось создать инструмент, способный «просмотреть» более 20 Гбайт файлов на предмет наличия указанных отклонений.
Задача:
Идентификация наличия круглых печатей на странице сканированного документа.
Реализация:
Python OpenCV (версия 4.6.0) – open source библиотека компьютерного зрения.
▪ Читать
@machinelearning_ru
Анализ данных, получаемых при обработке изображений — популярная тема среди разработчиков и аналитиков. Я поделюсь опытом применения преобразования Хафа для поиска окружностей на страницах сканированных документов.
Идея обратиться к идентификации геометрических объектов на изображении родилась при решении задачи поиска фальсификата в pdf файлах.
В период пандемии многие организации перешли на особый режим работы, личное взаимодействие с клиентами снизилось, поменялись бизнес-процессы. Изменения коснулись оформления первичных документов, чаще стали встречаться скан-копии файлов со вставленными подписями и печатями в виде отдельных картинок. Для оценки объема и формирования пула соответствующих документов потребовалось создать инструмент, способный «просмотреть» более 20 Гбайт файлов на предмет наличия указанных отклонений.
Задача:
Идентификация наличия круглых печатей на странице сканированного документа.
Реализация:
Python OpenCV (версия 4.6.0) – open source библиотека компьютерного зрения.
▪ Читать
@machinelearning_ru
👍12❤1🔥1
Google’s Video Editor AI: Absolute Magic!
https://www.youtube.com/watch?v=G1dXEM_7lh8
Dreamix: Video Diffusion Models are General Video Editors: https://dreamix-video-editing.github.io/
@machinelearning_ru
https://www.youtube.com/watch?v=G1dXEM_7lh8
Dreamix: Video Diffusion Models are General Video Editors: https://dreamix-video-editing.github.io/
@machinelearning_ru
YouTube
Google’s Video Editor AI: Absolute Magic!
❤️ Check out Fully Connected by Weights & Biases: https://wandb.me/papers
📝 The paper "Dreamix: Video Diffusion Models are General Video Editors" is available here:
https://dreamix-video-editing.github.io/
My latest paper on simulations that look almost…
📝 The paper "Dreamix: Video Diffusion Models are General Video Editors" is available here:
https://dreamix-video-editing.github.io/
My latest paper on simulations that look almost…
👍7🔥2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
3D generation on ImageNet
🖥 Github: https://github.com/snap-research/3dgp
⏩ Paper: https://arxiv.org/abs/2303.01500v1
📝 Project: https://snap-research.github.io/3dgp/
@machinelearning_ru
📝 Project: https://snap-research.github.io/3dgp/
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥2❤1
Примеры генераций от Midjourney. Cправочник, содержащий стили и ключевые слова, которые вы можете использовать с ИИ MidJourney
Есть также страницы, на которых показано сравнение разрешений, веса изображений и многое другое
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥4❤2
Введение в развёртывание ML: Flask, Docker и Locust
Вы потратили много времени на EDA, тщательно проработали все функции, несколько дней настраивали модель и, наконец, получили то, что хорошо работает в тестовом варианте. Теперь, мой друг, вам нужно развернуть вашу модель. В конце концов, любая модель, которая остаётся на локальном компьютере, ничего из себя не представляет, независимо от того, насколько она хороша.
Изучение этой части рабочего процесса Data Science может показаться непосильным, особенно если у вас нет большого опыта разработки программного обеспечения. Не бойтесь, основная цель этой статьи — познакомить вас с одним из самых популярных фреймворков для развёртывания на Python – Flask. Кроме того, вы узнаете, как контейнеризировать развёртывание и измерить его производительность – два аспекта, которые часто упускаются из виду.
▪Читать
▪Код
@machinelearning_ru
Вы потратили много времени на EDA, тщательно проработали все функции, несколько дней настраивали модель и, наконец, получили то, что хорошо работает в тестовом варианте. Теперь, мой друг, вам нужно развернуть вашу модель. В конце концов, любая модель, которая остаётся на локальном компьютере, ничего из себя не представляет, независимо от того, насколько она хороша.
Изучение этой части рабочего процесса Data Science может показаться непосильным, особенно если у вас нет большого опыта разработки программного обеспечения. Не бойтесь, основная цель этой статьи — познакомить вас с одним из самых популярных фреймворков для развёртывания на Python – Flask. Кроме того, вы узнаете, как контейнеризировать развёртывание и измерить его производительность – два аспекта, которые часто упускаются из виду.
▪Читать
▪Код
@machinelearning_ru
👍10🔥3❤2
Поэтому в этой статье я представлю 5 крутых возможностей Jupyter, о существовании которых вы, вероятно, даже не подозревали.
📌 Читать
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥3❤1
Если уже тестировали популярные модельки нейросетей через API или даже просто когда-то что-то где-то слышали и хотите копнуть глубже, в этой статье автор рассказал, как написать GPT всего в 60 строках numpy с нуля: https://habr.com/ru/post/716902/
Для понимания статьи достаточно базово разбираться в Python, NumPy и обладать небольшим опытом в обучении нейросетей. В реализации отсутствует большая часть функциональности, чтобы максимально её упростить. В общем, enjoy.
Вообще, понимание архитектуры GPT — всего лишь небольшая часть более масштабной темы больших языковых моделей, но жизненно важная для разработчиков нейросетей. GPT оказалась первой архитектурой, у которой есть удобные свойства масштабирования, высокой параллелизации на GPU и качественного моделирования последовательностей. Ну и самое приятное, что исходники выложены на гитхабе: github.com/jaymody/picoGPT.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8❤1🔥1