Ловите новую модель для работы с аудио от Mistral
Voxtral работает с аудио-записями длиной до 40 минут. Модель умеет транскрибировать и анализировать записи, а это значит, что вы можете задавать вопросы по аудио напрямую модели или же скопировать полученный текст и закинуть его в другую AI.
Voxtral появится в Le Chat
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Voxtral работает с аудио-записями длиной до 40 минут. Модель умеет транскрибировать и анализировать записи, а это значит, что вы можете задавать вопросы по аудио напрямую модели или же скопировать полученный текст и закинуть его в другую AI.
Voxtral появится в Le Chat
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Suno вернулся — вышла новая модель Suno v4.5+ 😇
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
T-Технологии выкатили в опенсорс модель для потокового распознавания речи — T-one.
Она мгновенно превращает разговор в текст — идеально для звонков и голосовых помощников. Модель лёгкая, быстрая и заточена под реальные условия: шумы, плохое качество связи и нестабильный интернет.
Разрабы также дали подробные инструкции — модель можно легко дообучить под свои нужды или встроить в продукт.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Она мгновенно превращает разговор в текст — идеально для звонков и голосовых помощников. Модель лёгкая, быстрая и заточена под реальные условия: шумы, плохое качество связи и нестабильный интернет.
Разрабы также дали подробные инструкции — модель можно легко дообучить под свои нужды или встроить в продукт.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Media is too big
VIEW IN TELEGRAM
Eleven Music сгенерит трек студийного качества, который можно использовать в коммерческих целях.
Тут можно выбрать жанр, стиль, язык, настроить звук и текст.
Самое приятное — это бесплатно, а в августе генерация трека съедает в 2 раза меньше кредитов.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Minimax дропнули один из лучших генераторов речи Speech 2.5 — звучит нереально круто и поддерживает русский язык.
Три главные фичи:
— Высокая выразительность речи;
— Реалистично звучание голоса;
— Аж 40 языков, среди которых и русский.
Пробуем — это бесплатно.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
Три главные фичи:
— Высокая выразительность речи;
— Реалистично звучание голоса;
— Аж 40 языков, среди которых и русский.
Пробуем — это бесплатно.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Музыка которая сама подстраивается под видео — ElevenLabs выкатили ИИ-композитор нового уровня.
- Заливаешь ролик — нейросеть анализирует кадры и сама создает нужное настроение.
- Саундтрек готов за секунды, никаких долгих рендеров.
- В пару кликов — закадровый голос и звуковые эффекты прямо внутри платформы.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
- Заливаешь ролик — нейросеть анализирует кадры и сама создает нужное настроение.
- Саундтрек готов за секунды, никаких долгих рендеров.
- В пару кликов — закадровый голос и звуковые эффекты прямо внутри платформы.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Музыкальный ИИ нового уровня — Riffusion выкатили агента Producer, который заменяет целую студию.
- Генерит треки прямо в чате, из текста или идеи.
- Добавляет и убирает инструменты за секунду.
- Делает обложки, клипы и даже пишет код для визуализаторов.
- В один клик — ремиксы: reverb, slowed, dark synth и многое другое.
Попробовать — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT4 Bot
- Генерит треки прямо в чате, из текста или идеи.
- Добавляет и убирает инструменты за секунду.
- Делает обложки, клипы и даже пишет код для визуализаторов.
- В один клик — ремиксы: reverb, slowed, dark synth и многое другое.
Попробовать — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Нашли очень крутой ИИ-сервис для музыкантов — Studio Moises
Это генератор стемов, который работает audio2audio — закидываете свою игру на инструменте, а ИИ догенерирует другие партии (барабаны, бас, электрику и т.д.). В автоматическом режиме звучит очень органично и как будто так и было задумано, а для полного контроля есть генерация с промта.
Кроме этого там есть ИИ-инструменты типа мастеринга, возможность разбить трек на отдельные составляюще и генератор текстов для песен.
Можно пользоваться бесплатно, кредитов дают не намного меньше, чем в платном тарифе
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
Это генератор стемов, который работает audio2audio — закидываете свою игру на инструменте, а ИИ догенерирует другие партии (барабаны, бас, электрику и т.д.). В автоматическом режиме звучит очень органично и как будто так и было задумано, а для полного контроля есть генерация с промта.
Кроме этого там есть ИИ-инструменты типа мастеринга, возможность разбить трек на отдельные составляюще и генератор текстов для песен.
Можно пользоваться бесплатно, кредитов дают не намного меньше, чем в платном тарифе
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь можно выбрать один из форматов:
🟡 Deep Dive — глубокий разбор материала.🟡 Brief — короткое саммари на 1-2 минуты с ключевыми моментами.🟡 Critique — для конструктивного фидбека.🟡 Debate — дискуссия между двумя спикерами, показывающая разные точки зрения.
Фичу постепенно раскатывают всем юзерам.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Клонируем ЛЮБОЙ голос за секунду — релизнулась настоящая ПУШКА для работы со звуком Chatterbox.
Зацените имбищу:
• Сервис генерит озвучку со ВСЕМИ ЭМОЦИЯМИ — можно расставлять акценты, делать паузы, выделять слова голосом, контролировать тон и тембр.
• Клонирует ЛЮБОЙ голос за секунду — достаточно короткого отрывка.
• Знает РУССКИЙ и еще 22 языка. Можно построить целую беседу.
• Есть огромная библиотека голосов, которые можно использовать в ваших проектах.
• API простейший — легко интегрируется в другие сервисы и программы.
😶 😶 😶 😶 😶 😶 😶 😶 😶
Мегатулза для озвучки — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
Зацените имбищу:
• Сервис генерит озвучку со ВСЕМИ ЭМОЦИЯМИ — можно расставлять акценты, делать паузы, выделять слова голосом, контролировать тон и тембр.
• Клонирует ЛЮБОЙ голос за секунду — достаточно короткого отрывка.
• Знает РУССКИЙ и еще 22 языка. Можно построить целую беседу.
• Есть огромная библиотека голосов, которые можно использовать в ваших проектах.
• API простейший — легко интегрируется в другие сервисы и программы.
Мегатулза для озвучки — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
В сервисе «Яндекс Музыки» появился новый инструмент
«AI-сеты» сделают из вас полноценного диджея. Вы сможете создавать миксы из разных треков без особых навыков и специальных программ. Выбираем жанр, закидываем любимые треки или исполнителей и наслаждаемся результатом - нейронка создаст идеальные миксы и составит плейлист.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
«AI-сеты» сделают из вас полноценного диджея. Вы сможете создавать миксы из разных треков без особых навыков и специальных программ. Выбираем жанр, закидываем любимые треки или исполнителей и наслаждаемся результатом - нейронка создаст идеальные миксы и составит плейлист.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Google прокачал Gemini — теперь он понимает аудио
Закидываешь подкаст или лекцию — на выходе получаешь:
— Краткую выжимку.
— Полную расшифровку текста.
— Главные тезисы и хайлайты.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
Закидываешь подкаст или лекцию — на выходе получаешь:
— Краткую выжимку.
— Полную расшифровку текста.
— Главные тезисы и хайлайты.
Пробуем тут
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
У Stabitilty AI новый релиз — они выпустили МОЩНЫЙ генератор музыки Stable Audio 2.5
Все еще без текста, но есть крутые и действительно важные особенности:
— Модель разработана совместно со студией звукозаписи amp, поэтому все сгенерированные треки лицензированы и их можно использовать в коммерческих целях;
— А еще они использовали новый метод Adversarial Relativistic-Contrastive (ARC), который уменьшил количество шагов генерации с 50 до 8, что сильно ускорило работу.
Можно пользоваться на Replicate, FalAI или на официальном сайте.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
Все еще без текста, но есть крутые и действительно важные особенности:
— Модель разработана совместно со студией звукозаписи amp, поэтому все сгенерированные треки лицензированы и их можно использовать в коммерческих целях;
— А еще они использовали новый метод Adversarial Relativistic-Contrastive (ARC), который уменьшил количество шагов генерации с 50 до 8, что сильно ускорило работу.
Можно пользоваться на Replicate, FalAI или на официальном сайте.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Cursor для генерации ЛЮБОЙ музыки ВЫШЕЛ. Mozart AI поможет записать и свести всевозможные треки.
• Это буквально домашняя СТУДИЯ звукозаписи со всеми фишками.
• Генерит ЛЮБЫЕ сэмплы и треки с нуля. Достаточно одного запроса.
• Можно загрузить свою музыку и сделать настоящий хит с помощью нейронок.
• КУЧА настроек: можно миксовать треки, задавать жанр, стиль, музыкальные инструменты, вокал и прочее.
Сейчас идет бета, поэтому сервис работает😶 😶 😶 😶 😶 😶 😶 😶 😶
Пробуем скорее — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
• Это буквально домашняя СТУДИЯ звукозаписи со всеми фишками.
• Генерит ЛЮБЫЕ сэмплы и треки с нуля. Достаточно одного запроса.
• Можно загрузить свою музыку и сделать настоящий хит с помощью нейронок.
• КУЧА настроек: можно миксовать треки, задавать жанр, стиль, музыкальные инструменты, вокал и прочее.
Сейчас идет бета, поэтому сервис работает
Пробуем скорее — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Клонируем ЛЮБЫЕ голоса и звуки за один клик — нашли отличный сервис Real-Time Voice Cloning, который за пару секунд копирует всевозможные звуки и сможет нагенерить целую дипфейк-речь.
• Написан на Python и сделан максимально ПРОСТО и понятно.
• Загружаем ЛЮБОЙ короткий отрывок голоса или звука и получаем ТОЧНУЮ копию, с помощью которой можно генерить речь.
• Работает только ЛОКАЛЬНО.
😶 😶 😶 😶 😶 😶 😶 😶 😶
Пробуем — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
• Написан на Python и сделан максимально ПРОСТО и понятно.
• Загружаем ЛЮБОЙ короткий отрывок голоса или звука и получаем ТОЧНУЮ копию, с помощью которой можно генерить речь.
• Работает только ЛОКАЛЬНО.
Пробуем — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Расшифровываем ЛЮБОЕ аудио за секунду — в сети нашли мегасервис Notely Voice, который поможет расшифровать записанные лекции, интервью и заметки.
• Это настоящая ИМБА для школьников, студентов и интервьюеров.
• Вы сможете записать лекции и спикеров, не отвлекаясь на письменные конспекты, а потом расшифровать и переработать их дома.
• Под капотом Whisper — нейронка понимает больше 50 языков и ЗНАЕТ РУССКИЙ.
• Сервис работает только ЛОКАЛЬНО — ни одна ваша запись не улетит в сеть.
• БЕЗ ограничений и БЕСПЛАТНО!
Крутейшая тулза лежит — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
• Это настоящая ИМБА для школьников, студентов и интервьюеров.
• Вы сможете записать лекции и спикеров, не отвлекаясь на письменные конспекты, а потом расшифровать и переработать их дома.
• Под капотом Whisper — нейронка понимает больше 50 языков и ЗНАЕТ РУССКИЙ.
• Сервис работает только ЛОКАЛЬНО — ни одна ваша запись не улетит в сеть.
• БЕЗ ограничений и БЕСПЛАТНО!
Крутейшая тулза лежит — тут.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
• Треки от модели не отличить от работ профи.
• Поддерживает любые жанры — от попсы до тяжёлого метала.
• Встраивает инструменты, вокал и эффекты — полноценная студия звукозаписи в вашем компьютере.
Пробуем — здесь.
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen теперь и текст озвучивает
Alibaba выпустили Qwen-TTS (text-to-speech). Модель поддерживает следующие языки:
—Японский
—Корейский
—Китайский
—Английский
—Немецкий
—Французский
—Итальянский
—Русский
На выбор представляются 17 голосов с разными эмоциональностями и тембрами. Затестить можно на HuggingFace
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
➡️ 🖥 ChatGPT5 Bot
Alibaba выпустили Qwen-TTS (text-to-speech). Модель поддерживает следующие языки:
—Японский
—Корейский
—Китайский
—Английский
—Немецкий
—Французский
—Итальянский
—Русский
На выбор представляются 17 голосов с разными эмоциональностями и тембрами. Затестить можно на HuggingFace
—
@ai_for_audio— самые полезные AI-инструменты для обработки аудио и голоса.
@ai_sklad — а здесь собираем остальные AI-инструменты, удобно разбивая их по категориям.
Please open Telegram to view this post
VIEW IN TELEGRAM