НейроProfit | Соня Pro Ai
16.2K subscribers
566 photos
620 videos
7 files
757 links
Авторский канал про полезные нейросети для бизнеса, учебы и работы ⚛️

https://telega.in/c/NeuralProfit

Реклама и Сотрудничество:@neurosonya и @neiromanager
Обучение Midjourney https://neuralprofit.ru
ИИ для учебы https://neuralprofit.ru/edu
Download Telegram
Создание синтезированного голоса нейросетью. Обзор и сравнение сервисов для озвучки NaturalReader, Еlevenlabs и Resemble

Искусственный интеллект для озвучки текста позволяет создавать подкасты, озвучивать героев игр и фильмов, создавать дубляж и редактировать аудиофайлы. Если вы по какой-то причине не хотите сами озвучивать видео, эти сервисы очень выручат. С воссозданным голосом можно озвучить текст, выбрать язык, на котором он будет воспроизведён, подобрать эмоции для голоса и скорость воспроизведения отдельных слов и другие параметры. Также синтезированный нейросетью голос можно привязать к телефонии для ответов на звонки клиентов или другим облачным сервисам по API.

Сервисы, которые я рассмотрела могут спокойно озвучивать книги - можно настроить озвучку, неотличимую от человеческой. АЕlevenlabs и Resemble могут клонировать голос знаменитости или ваш голос, так что можно сделать озвучку вашим голосом без вашего участия, что очень удобно. Но обо всем по порядку.

NaturalReader

Из русской озвучки есть только Максим и Татьяна, скачать в mp3 можно только по подписке Plus за 20 $ в месяц. Как настроить ударение, я так и не поняла

Крутой инструмент для тех, у кого англоязычный контент. Голоса Plus обеспечивают плавное и естественное звучание текста в речь, которое соответствует шаблонам и интонациям человеческого голоса. Тогда можно подобрать даже интонации от веселого тона повествования до тревожного, правда не в русской озвучке. Отлично подойдет для озвучки книг.

подходит больше для английской озвучки, для русского языка подписка Plus не целесообразна

Еlevenlabs

Очень крутой инструмент! Но опять-таки нет русского языка. Скачивать голос можно бесплатно до 10 000 знаков в месяц.
Есть расширенные настройки - можно выбрать возраст голоса, акцент и степень интенсивности акцента.
Так же есть библиотека голосов, сгенерированных другими пользователями. Их можно использовать и скачивать. Попадаются и голоса знаменитостей вроде Тома Хидлстона.

Но и это еще не главное! За 5 $/мес можно создать 10 голосов - достаточно просто загрузить голос в аудиоформате (более 1 минуты) без посторонних шумов! И можно сгенерировать озвучку голосом знакомого или знаменитости 🤯

Но и это еще не все! В июле открывается доступ в Voice Cloning - где можно создать идентичную ИИ-версию вашего голоса.

крутой профессиональный инструмент
доступная цена
хорошие бесплатные возможности
маркетплейс с голосами
нет русского языка

Одним из возможных применений Еlevenlabs является создание синтезированных голосовых помощников для различных устройств и приложений. Например, вы можете использовать эту технологию для создания голосового помощника для своего мобильного приложения или устройства умного дома.
Также Еlevenlabs может быть полезна в музыкальной индустрии, например, для создания синтезированных голосовых эффектов или имитации голосов знаменитых певцов или актеров.
В целом, Еlevenlabs представляет собой мощный инструмент для создания реалистичных голосовых имитаций на основе коротких отрезков аудио. 

Resemble

Бесплатно дается 300 секунд.
Функция Clone my voice на бесплатном пробном периоде
С Resemble маркетологи, контент-менеджеры, специалисты по рекламе и SMM могут создавать аудиролики, озвученные нейросетью, но звучащие как люди.

Нейросеть поддерживает 62 языка в том числе и русский, но в платной версии. Для создания шаблона персонажа озвучки нужно загрузить образец голоса или прочитать отрывок текста, если хотите использовать свой голос. Нейросеть проанализирует образец и воссоздаст синтезированный голос, похожий на оригинальный.

управление эмоциями при создании записи
перевод голоса на 62 доступных языка
маркетплейс с голосами
есть русский язык в платной версии
в пробном периоде можно бесплатно клонировать свой голос
цена 0,006 $ за секунду 😬

Итоги: Я намеренно не включила в итоги NaturalReader - он дорогой и все функции есть в Resemble и Еlevenlabs. Их и сравним.

#elevenlabs
Сравнение Resemble и Еlevenlabs

У обоих сервисов есть маркетплейсы, где можно скачать уже готовые голоса и бесплатно их использовать. Оба профессиональные инструменты и умеют клонировать голоса. В клонировании голосов лучшим считается Еlevenlabs, но в Resemble можно клонировать свой голос бесплатно, а в Еlevenlabs функция Voice Cloning будет доступна в июле платно. В Resemble в платной версии есть русский язык. Кроме того, в Resemble можно бесплатно поменять интонацию в тексте. А вЕlevenlabs больше выбора акцентов голосов, зато в Resemble есть озвучка шепотом). Кроме того, в Resemble есть возможность локализации языка - можно выбрать голос на одном языке и этот же голос перевести на другой язык.

Итог:
Одним словом, в Resemble больше бесплатных возможностей для старта, аЕlevenlabs лучше клонирует голоса знаменитостей и более доступен по цене.
Если вам хватит функционала попроще, для озвучки вполне подойдет Cybervoice за 100 рублей в месяц, о нем здесь или сервис Speechki, как им бесплатно озвучить я рассказывала здесь

#elevenlabs
Media is too big
VIEW IN TELEGRAM
Друзья, обзор получился объемный, но без воды. Хотелось дать вам годную инфу и разложить ее по полочкам. Вот подробный обзор и сравнение сервисов для озвучки и создания синтезированных голосов NaturalReader, ElevenLabs и Resemble

#elevenlabs
This media is not supported in your browser
VIEW IN TELEGRAM
В обновленном ElevenLabs появился русский язык

В ElevenLabs можно настроить интонацию, сделать голос более или менее эмоциональным и выбрать готовые пресеты. В обновлении 2.0 значительно лучше качество озвучки и появилось более 30 языков, включая русский.

Самое приятное в этом, чтобы протестировать ElevenLabs, не нужно регистрироваться 🔥

#elevenlabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Дубляж видео на русский с сохранением голоса. Сравнение HeyGen с ElevenLabs.

Я уже рассказывала про перевод от HeyGen - он обалденно переводит видео, сохраняя интонации голоса. Единственный минус, переводит видео с русского, на русский пока нет.

Зато одним игроком на рынке дубляжа видео стало больше! ElevenLabs прекрасно переводит на русский. Для примера я скачала интервью Илона Маска на английском языке и перевела его на русский в ElevenLabs .
Сервис переводит на 29 языков, сохраняя оригинальный голос 🔥

Процесс тоже интуитивно понятен, все как и здесь, загружаем видеоролик (можно без лица) - выбираем язык ввода (на каком языке ролик), выбираем язык вывода (на какой язык хотели бы перевести), ждем около минуты и можно скачивать результат

Сравнение ElevenLabs и HeyGen

ElevenLabs, как и HeyGen ,анализирует речь, переводит и синтезирует её в новую звуковую дорожку, так что получается естественная озвучка.

В чем отличия?
Перевод видео в ElevenLabs пока бесплатен, но ограничен 2000 символами, а в HeyGen ролик просто ограничен 500мб, и он платный.
Резюмируя, оба они переводят отлично и очень похоже на оригинальный голос, но HeyGen подстраивает еще и движение губ

UPD: Elevenlabs сейчас стоит от 5$ долларов в месяц

#elevenlabs #heygen #аватар #цифровойаватар #нейросети #нейросеть #сравнение #обзор
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Инновационный прорыв ElevenLabs: заработок в сфере ИИ-дубляжа

Сегодня технологию ElevenLabs используют сотрудники 41% компаний из списка Fortune 500. Компания уже привлекла $80M инвестиций 

Что нового?
Нейродубляж:

ИИ-стартап, который недавно оценили в $1,1 млрд (подробнее в Bloomberg), запустил студию нейродубляжа.

Теперь можно перевести видео на один из 29 языков (в т.ч. русский) с учетом тона голоса говорящего, акцента, фонового шума, сохраняя голос и эмоции оригинального говорящего.
В предыдущей версии, ролик наверху перевелся бы с кучей искажений, голосовых артефактов.Язык вывода я указала Английский, хотя в видео присутствует несколько языков. Не смотря на это, сервис без проблем перевел мне видос на русский, не теряя смысл.

Новые продукты

Dubbing Studio: можно дублировать фильмы целиком, создавать и редактировать их расшифровки, переводы и тайм-коды. 

Voice Library (голосовая библиотека): безопасная платформа для заработка на версиях собственных голосов, созданных ии. Пользователи могут создать свою профессиональную реплику голоса, проверить ее и поделиться ею через голосовую библиотеку. Когда другие используют эти проверенные голоса, создатели получают компенсацию. Пользователи всегда сохраняют контроль над доступностью своего голоса и условиями компенсации. Маркетплейс уже приносит доход небольшой группе альфа-пользователей.

Кстати, у сервиса есть классификатор речи с использованием ии, который может проверить, содержит ли аудиосэмпл контент, созданный ElevenLabs.  Его они тоже улучшат - включат и другие голосовые модели в свой классификатор.

Приложение Mobile Reader: Ранняя предварительная версия мобильного приложения для чтения, которая позволяет мгновенно преобразовывать текст и URL-адреса в аудио, упрощая пользователям доступ к контенту на другом носителе во время движения. В качестве ознакомительной пробной версии приложение будет доступно бесплатно в течение первых трех месяцев, и пользователи смогут зарегистрироваться для получения раннего доступа через список ожидания.

#elevenlabs
Media is too big
VIEW IN TELEGRAM
ElevenLabs добавил возможность заработать на клонировании голоса

В одном из прошлых постов я писала, что ElevenLabs анонсировали возможность заработать пользователям на клонировании голоса. И вот теперь все желающие могут загрузить свой голос и получать деньги за его использование.

Как работает:
Пользователь загружает 30 минут аудио голоса, добавляет описание, затем назначает цену и указывает реквизиты.
Голосом будет озвучиваться реклама и прочий контент, а взамен обещают пассивный доход.

Подать заявку можно здесь

Подробнее про ElevenLabs и сравнения с Resemble и тд в трех частях, начать отсюда

Про обновления и русский язык

Про возможность заработка на созданных голосах и инновации

Про дубляж видео на русский и сравнение с HeyGen

#elevenlabs
Media is too big
VIEW IN TELEGRAM
Еще одна новинка от ElevenLabs: Смешайте свой голос с любым другим и озвучьте на 29 языках⁠⁠

ElevenLabs выпустили новую функцию AI Voice Changer, теперь можно преобразовывать Speech to Speech (речь в речь) и превращать свой голос в другого персонажа, можно управлять его эмоциями и подачей. Сохраняется тембр, тайминги, благодаря чему синтезированная речь звучит ещё реалистичнее, имитируя ваше произношение.

Ваш голос можно преобразовать в любой другой на 29 языках, в том числе на русском. Достаточно будет записи вашей речи и образца чужого голоса.

Легко можно создать собственные AI голоса для своих видео, подкастов, игр и многого другого одним щелчком мыши.

Интересно, можно ли будет продать эти сгенерированные голоса? А так, видно вливание $80M инвестиций, ИИ-стартап развивается стремительно, недаром его недавно оценили в $1,1 млрд.

#elevenlabs
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть для создания звуковых эффектов

ElevenLabs конечно молодцы - везде успели! Анонсировали свою последнюю разработку - нейросеть для создания звуковых эффектов и заодно Заколлабились с нейросетью Sora, которая успела наделать много шума, еще даже не выйдя в широкие массы. (Про нее здесь)

К генерациям Sora появится возможность добавлять реалистичные звуки по текстовому запросу.

Видео, на котором показываются возможности Sora, уже взорвало интернет, показывая, как визуализации превращаются в невероятные звуки.

Вырисовывается хорошая перспектива для sound-дизайнеров, больше не нужно проводить много времени за поисками подходящего звукового эффекта. ElevenLabs все автоматизирует - сама создаст уникальные звуки, которые можно настроить по текстовым подсказкам.

Да в принципе, для всех креативщиков открываются хорошие возможности для творчества - производство фильмов, игр, музыкальную индустрию ждут изменения. Не нужно быть звукорежиссером, чтобы создать свой проект.

ElevenLabs прям радует частотой инноваций, не даром привлекли $80M инвестиций

Записаться на ранний доступ можно здесь, чтобы в числе первых протестировать нейросеть бесплатно, может даже вотермарок не будет

#elevenlabs
Обновление в ElevenLabs - генератор звуковых эффектов 🗣️

ElevenLabs выпустили новую функцию Sounds Effect, которая положит конец аудиостокам. Теперь просто введя описание звукового эффекта можно мгновенно получить сэмплы звука — пение, дождь, взрыв, волны, искры и что угодно. - Посмотрите их промо ролик (второе видео)

Я затестила новую функцию (первое видео), пока работает хорошо на английском, можно совместить чью-то речь и звуковые эффекты. Например, я в своем примере соединила звуки дождя за окном и мужской голос, который говорит на английском “мой дом-моя крепость”.

По-русски пока не очень, если описывать действия на русском, то нейросеть просто озвучит все, что написано. Если совместить описание звуковых эффектов на английском, а саму речь на русском, получится вообще непонятный набор символов.

Что крутого

🟢 Пока бесплатно! Тестите
🟢 Можно настроить уровень креативности и уровень следования тестовой подсказке
🟢 Можно настроить время или предоставить ИИ самому выбрать наилучшую продолжительность

Классная возможность контентмейкерам не платить за soundstock, не тратить время на поиски, а просто самому сгенерировать то, что нужно и забыть про авторские права

Друзья, не скупитесь на реакции 😉

🤝 НейроProfit

#elevenlabs
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Нейросеть для клонирования голоса MARS5. Сравнение с ElevenLabs

Записала для вас видео сравнение двух нейросетей в клонировании голосов. Про ElevenLabs вы в курсе, освежить память можно, нажав #elevenlabs

Новая нейросеть MARS5 доступна бесплатно в GitHub, либо либо на платформе Camb AI. Где на старте дается 5 минут. На самой платформе еще есть видеодубляж с переводом, и это тоже входит в бесплатные 5 минут.
Политика как и у ElevenLabs - те каждый месяц дают бесплатно 10к знаков (10 мин аудио), которые можно потратить на дубляж с переводом, перевести текст в аудио, создать голоса, а звуковые эффекты и вовсе пока бесплатны.

🟣 Клонирование голоса:
Для того, чтобы клонировать голос, загружать аудио нужно в формате .wav, длина от 90 секунд до 10 минут.
Бесплатно дает загрузить 2 голоса для клонирования. Голосами можно озвучить до 400 символов текста за раз.
Работает со 140 языками, включая русский.

Намеренно не стала сравнивать с Whisper Speech и PlayHT, так как они не поддерживают русский язык.
Их возможности представлены в этих постах:

🟣 Бесплатное клонирование с Whisper Speech
🟣 Клонирование с PlayHT

Что скажете? Кто пробовал MARS5, у вас какие результаты?

#elevenlabs #mars5 #text2audio #texttoaudio

НейроProfit
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
В сети набирают популярность короткометражные фильмы ужасов от нейросетей. Их можно создать с помощью нейросетей, про которые я вам рассказывала:

🟣 Udio для музыки. Пост

🟣 Dream Machine для видео. Пост

🟣 ElevenLabs для голоса. #elevenlabs

🟣 Hedra для диалогов. Пост

🟣 Midjourney сделает картинки, из которых делали видео. Пока самый лучший способ получить качественное и реалистичное видео - создать видео из готовых изображений. Midjourney остается самой лучшей нейросетью для генерации реалистчиных изображений высокого качества. Научитесь пользоваться этим инструментом в 🌸Закрытом клубе Midjourney
Please open Telegram to view this post
VIEW IN TELEGRAM
Звуковые эффекты за 8 секунд

Soundeff - это ИИ-генератор звуковых эффектов, наподобие того, который есть в Elevenlabs. Заодно там так же есть библиотека пользовательских звуковых генераций. 👉🏻 Про функцию звуковые эффекты в Elevenlabs

🌸 Действия тоже такие же, как в Elevenlabs - пишете простой запрос по которому создается желаемый звуковой эффект - звук поезда, звуки природы, смех и на что хватит фантазии.
По времени обе нейросети генерирует звуковые эффекты тоже одинаково, примерно за 8 секунд. С чем похожи разобрались, теперь рассмотрим отличия.

Отличия Soundeff от Elevenlabs

🟠 Длина выходного аудио в Elevenlabs 8 секунд, а в Soundeff 5 секунд.

🟠 В Elevenlabs функция звуковых эффектов пока бесплатна для всех пользователей, в Soundeff бесплатно дается 3 генерации звука, далее подписка от 10$ за 400 генераций.

Так же, в платном плане Soundeff генерация звука будет быстрее, хотя итак за 8 секунд генерирует. Длину аудио в платном тарифе скоро увеличат до 10 секунд и добавят пользовательские настройки.
Что касается Elevenlabs, пока именно функция звуковых эффектов бесплатная, будет ли она платной потом, и какая будет цена, неизвестно. А так платформа обширная конечно, только появляется что-то из технологий для звука и голоса, а в ElevenLabs это уже реализовано. Недаром ElevenLabs привлекли $80M инвестиций

НейроProfit

#нейросеть #elevenlabs #soundeff
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Бесплатные нейросети для улучшения звука и удаления шумов

🟡 Adobe Podcast -бесплатный, быстрый, простой, скачивает в mp3, звук похож на студийный, но в качестве моно.

🔴 Resemble - бесплатный, чистит фоновые звуки, корректирует частоту и компрессирует голос. Аудио получаются в стерео. На мой взгляд, лучше Adobe Podcast, но не всегда.

🟣 Voice Isolator в ElevenLabs (на видео) - работает лучше всех, доступен бесплатно. Новый инструмент, который улучшает качество аудио и убирает фоновый шум. Похож на студийный звук. В отличие от Adobe Podcast, загружать можно как аудио и видео, на выходе получаете аудио. Допустимы файлы размером до 500 МБ и длительностью до 1 часа.

Я рекомендую попробовать все, тем более, они бесплатные😉, и составить свое мнение. И желательно поделиться им в комментариях 👇

НейроProfit

#elevenlabs #resemble #adobepodcast #озвучка #звук #enhance
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Решила покреативить (выходные навеяли 🤭) и сделала такой рекламный ролик а-ля 🍔Burger King с помощью 5 нейронок:

Midjourney — изображения референсы
#elevenlabs — голос
Suno — музыка
Dream Machine — видео
ChatGPT - сценарий, песня

Вот так можно быстро сделать видеоролик о своем бизнесе, услугах, блоге, хобби, просто постучав по клавиатуре 😉

Есть тут те, кто занимается видеоконтентом, какая ваша любимая нейросеть для генерации видео🔡

НейроProfit | Обучение Midjourney
Please open Telegram to view this post
VIEW IN TELEGRAM
Нейросеть для работы со звуком и голосом Wondercraft. Сравнение с ElevenLabs

Давненько у ElevenLabs не было достойных конкурентов - чтобы и голос клонировал, и мультиязычный перевод был, и библиотека голосов с редактором. Предаставляю Wondercraft - инструмент для подкастеров, для звукорежиссеров и рекламщиков.

Что может:

🟡 Аудиокниги, подкасты - ИИ запишет подкаст по вашим запросам, можно выбрать из 200 реалистичных голосов, автоматически сделать дубляж на другой язык и сгенерировать сценарий. 
🔴 Аудиореклама - есть ии-генератор рекламы, где можно вставить ссылку на товар, который необходимо прорекламировать и получить аудиорекламу, длительностью 30 или 60 секунд. Ее можно отредактировать по своему вкусу, изменить голос, язык и содержание. Есть бесплатные аудиосемплы и музыка.
🟣 Клонирование голоса - доступно только платных подписках, и нужно сначала подписаться на ElevenLabs за 11$, так как Wondercraft используют их технологии. А Wondercraft ,в свою очередь, покроет стоимость. Здесь подробнее можно почитать
Остальные функции - заявлено, что можно сделать успокаивающие и выразительные медитации и продающие аудио e-mail’s 

😳 Что понравилось:
🌸 Понравилось, что на сайте есть статьи, как расставить паузы и настроить произношение, руководства по использованию
🌸 Нейронка знает много акцентов, 30 языков и в их числе русский.
🌸 Бесплатно — 10 минут на генерацию аудио и 40 голосов.
🌸 Хорошая озвучка

Что не понравилось:
🌸 Платный план начинается от 35$/ мес
🌸 Хоть Wondercraft, в отличие от ElevenLabs, генерирует по текстовому запросу аудиорекламу с уже готовыми звуковыми эффектами и музыкой, все равно я не нашла русский язык🤷🏻‍♀️Кстати, как и многих других, которые представлены на сайте в списке доступных языков

По этой причине не рекомендую, сама использую ElevenLabs

#elevenlabs #звук #озвучка #text2audio

НейроProfit
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Обновление D-ID 🎉Теперь D-ID помимо липсинка переведет аудио и клонирует голос.

D-ID представили инструмент Video Translate для перевода видео на другие языки с использованием технологий ИИ. Elevenlabs давно представила функцию dubbing, благодаря которой можно перевести видео, сохранив голос. А Heygen представил еще и возможность синхронизации движения губ, правда тогда сервис переводил видео с русского, на русский нет.

D-ID решили пойти по пути Heygen и представили инструмент для перевода видео на другие языки с использованием технологий ИИ. Тем более, что в Heygen помимо цифровых аватаров, добавили “говорящие” изображения - визитная карточка D-ID. Словом, и Heygen, и D-ID хорошо друг на друга повлияли)

D-ID также клонирует голос говорящего и изменяет движения его губ в соответствии с переведенными словами.

🌸 Для лучшего результата в кадре должен быть один человек, а лицо должно быть четко видно на протяжении всего видео. Для чистоты звука рекомендуется минимизировать фоновый шум и музыку.

🌸 Поддерживает 30 языков, включая русский.

🌸 Бесплатно дается 20 кредитов, которых хватит примерно на 10 переводов.

D-ID предполагает, что новая технология видео с использованием искусственного интеллекта может помочь клиентам сэкономить на локализации при масштабировании своих кампаний на глобальную аудиторию в таких областях, как маркетинг, развлечения и социальные сети.

#tool #нейросеть #перевод #переводчик #клонирование #heygen #did #elevenlabs

НейроProfit
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM