AI для обработки аудио и голоса
85 subscribers
66 photos
147 videos
204 links
Download Telegram
В сервисе «Яндекс Музыки» появился новый инструмент

«AI-сеты» сделают из вас полноценного диджея. Вы сможете создавать миксы из разных треков без особых навыков и специальных программ. Выбираем жанр, закидываем любимые треки или исполнителей и наслаждаемся результатом - нейронка создаст идеальные миксы и составит плейлист.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Google прокачал Gemini — теперь он понимает аудио

Закидываешь подкаст или лекцию — на выходе получаешь:
— Краткую выжимку.
— Полную расшифровку текста.
— Главные тезисы и хайлайты.

Пробуем тут



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
У Stabitilty AI новый релиз — они выпустили МОЩНЫЙ генератор музыки Stable Audio 2.5

Все еще без текста, но есть крутые и действительно важные особенности:

— Модель разработана совместно со студией звукозаписи amp, поэтому все сгенерированные треки лицензированы и их можно использовать в коммерческих целях;

— А еще они использовали новый метод Adversarial Relativistic-Contrastive (ARC), который уменьшил количество шагов генерации с 50 до 8, что сильно ускорило работу.

Можно пользоваться на Replicate, FalAI или на официальном сайте.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Cursor для генерации ЛЮБОЙ музыки ВЫШЕЛ. Mozart AI поможет записать и свести всевозможные треки.

• Это буквально домашняя СТУДИЯ звукозаписи со всеми фишками.
• Генерит ЛЮБЫЕ сэмплы и треки с нуля. Достаточно одного запроса.
• Можно загрузить свою музыку и сделать настоящий хит с помощью нейронок.
• КУЧА настроек: можно миксовать треки, задавать жанр, стиль, музыкальные инструменты, вокал и прочее.

Сейчас идет бета, поэтому сервис работает 😶😶😶😶😶😶😶😶😶

Пробуем скорее — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Клонируем ЛЮБЫЕ голоса и звуки за один клик — нашли отличный сервис Real-Time Voice Cloning, который за пару секунд копирует всевозможные звуки и сможет нагенерить целую дипфейк-речь.

• Написан на Python и сделан максимально ПРОСТО и понятно.
• Загружаем ЛЮБОЙ короткий отрывок голоса или звука и получаем ТОЧНУЮ копию, с помощью которой можно генерить речь.
• Работает только ЛОКАЛЬНО.

😶😶😶😶😶😶😶😶😶

Пробуем — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Расшифровываем ЛЮБОЕ аудио за секунду — в сети нашли мегасервис Notely Voice, который поможет расшифровать записанные лекции, интервью и заметки.

• Это настоящая ИМБА для школьников, студентов и интервьюеров.
• Вы сможете записать лекции и спикеров, не отвлекаясь на письменные конспекты, а потом расшифровать и переработать их дома.
• Под капотом Whisper — нейронка понимает больше 50 языков и ЗНАЕТ РУССКИЙ.
• Сервис работает только ЛОКАЛЬНО — ни одна ваша запись не улетит в сеть.
• БЕЗ ограничений и БЕСПЛАТНО!

Крутейшая тулза лежит — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️Suno 5 уже здесь — нейросеть снова ворвалась в топ по генерации суперхитов, став угрозой для музыкантов.

• Треки от модели не отличить от работ профи.
• Поддерживает любые жанры — от попсы до тяжёлого метала.
• Встраивает инструменты, вокал и эффекты — полноценная студия звукозаписи в вашем компьютере.

Пробуем — здесь.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen теперь и текст озвучивает

Alibaba выпустили Qwen-TTS (text-to-speech). Модель поддерживает следующие языки:
—Японский
—Корейский
—Китайский
—Английский
—Немецкий
—Французский
—Итальянский
—Русский

На выбор представляются 17 голосов с разными эмоциональностями и тембрами. Затестить можно на HuggingFace



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Превращаем любую книгу в аудиокнигу — вышла нейронка Ebook2audiobook.

Поддерживает 107 языков, среди которых русский.

Имба, пользуемся!



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Это ЛУЧШИЙ генератор речи на данный момент — стартап Hume AI подарил нам личную студию звукозаписи прямо в браузере.

Модель Octave 2 умеет ВСЁ — клонирует и генерит голоса, подбирает произношение, копирует нужные интонации и генерит целые подкасты.

• Владеет 11 языками — русский в их числе
• Умеет генерить дорожки со множеством голосов на разных языках
• Клонирует голос, акцент, эмоции и манеру речи
• Может создать любой голос с нуля — по вашему запросу
• Не сыпется на необычных словах и выражениях
• Киллерфича — произношение КАЖДОГО слова можно настраивать отдельно.

Забираем имбу по ссылке.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
ElevenLabs убили: клонируем любые голоса с новой опенсорс-моделью NeuTTS-Air! Она работает локально на вашем компе и даже телефоне — всё приватно и полностью бесплатно.

Результат при этом быстрый и качественный. Нейронке достаточно скормить 3-секундную запись голоса и она выдаст с ним хоть целый подкаст.

У модели безумные 748 млн параметров — хватит на ВСЁ.

Пользуемся бесплатно тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
У Suno новый конкурент — встречайте MiniMax Music 2.0 😇

— Реалистичный вокал в разных стилях с разными эмоциями;
— Поп, джаз, блюз, рок, фолк, дуэты и а-капелла;
— Качество студийного уровня;
— Песни длинной до 5 минут;
— Точный контроль музыкальной выразительности.

Пробуем — это бесплатно.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
Fish Audio — новая имба в мире озвучки.

Бесплатный сервис клонирует голос, настраивает эмоции и тон, а библиотека из 200 тысяч голосов закрывает любые задачи — от видосов и игр до аудиокниг.

Огромный лимит на фри-озвучку делает его лучшим выбором для студентов и креаторов.

Пробуем — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
💬 ElevenLabs выкатили монстра для преобразования речи в текст.

Scribe v2 Realtime — новая модель, которая выдает транскрипцию речи в реальном времени, пока вы говорите. Она умеет:

🟡Предсказывать слова ещё до того, как вы их договорили;
🟡Поддерживает 90+ языков (включая русский);
🟡Различает несколько голосов;
🟡Уделывает Gemini 2.5 Flash, GPT 4o MiniTranscribe и Deepgram Nova 3.
🟡Подключается к API в три строки кода.


➡️ Уже можно потестить бесплатно.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Переводим и транскрибируем ЛЮБЫЕ видео и РЕАЛЬНОМ времени — топовый сервис Soniox распознает десятки языков прямо в лайве.

• Знает и понимает более 6️⃣0️⃣ языков, в том числе русский.
• Различает диалекты и даже АКЦЕНТЫ.
Мгновенно переводит речь на ЛЮБОЙ язык.
• Язык перевода можно менять прямо НА ХОДУ.
• Различает говорящих во время диалогов и не путается в переводе.
БЕЗ ограничений, БЕЗ долгого ожидания, ВСЁ в лайве.
Мастхев для перевода и транскрибации лекций, созвонов и иностранной речи.
• Убивает хайповые нейронки OpenAI и Google в сфере перевода.

😶😶😶😶😶😶😶😶😶

Веб-версия — тут.
Android — тут.
iOS — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ МЕГАРЕАЛИСТИЧНЫЙ генератор речи дропнули в открытый доступ — Dia2 создает ЛЮБУЮ озвучку, которую вообще не отличить от реального голоса. Это мастхев для контента, подкастов, видео и дубляжа.

• Нейронка генерит речь в РЕАЛЬНОМ времени. Да, видео получает озвучку, пока проигрывается, а не через пару минут.
Склонировать можно ЛЮБОЙ голос — в запасе есть множество готовых ИИ-спикеров с разными голосами, тембрами, интонацией и даже акцентами.
• Создавать можно до двух минут аудио.
• Нейронка учитывает все ЭМОЦИИ: может волноваться, смеяться, запинаться, «жевать» слова как настоящие ЛЮДИ.
• Полностью в открытом доступе.
• БЕЗ ограничений, БЕЗ цензуры.

😶😶😶😶😶😶😶😶😶

Модель на HuggingFace — тут.
Код на GitHub — тут.
Демка в вебе — здесь.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Вышел лучший генератор речи — Qwen3-TTS-Flash мощно обновили и добавили поддержку десятков разных голосов, языков и акцентов.

- Больше 49 уникальных голосов — разные возрасты, национальности и пол персонажей.
- В совершенстве знает 10 языков — среди них английский, китайский и РУССКИЙ.
- Впервые поддерживает редчайшие акценты и ДИАЛЕКТЫ — даже сычуаньский.
- Реализм прокачали — нейронка научилась мимикрировать под человека и на ходу адаптировать ритм, темп и интонации речи.
- Подходит для озвучки ЛЮБЫХ диалогов — можно всё максимально кастомизировать с разными голосами, акцентами и диалектами.

Пользуемся — тут.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot
This media is not supported in your browser
VIEW IN TELEGRAM
Нашли для вас ЛУЧШУЮ тулзу для очистки звука от шумов — Auphonic 😇

Это ультимативный сервис для работы со звуком: вычищает шумы из аудиодорожки, обрезает моменты тишины, или просто отделяет музыку от вокала.

Можно пользоваться бесплатно — ежемесячно дают 2 часа обработки аудио. Если не записываете подкасты каждый день — хватит с головой.

Забираем имбу — здесь.



@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.

@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.

➡️🖥 ChatGPT5 Bot