Нейросеть в реальном времени переводит и распознает любую речь.
Whisper WebGPU - мгновенно распознаёт речь со 100 языков! Можно загрузить файл - как аудио, так и видео, либо вставить ссылку, либо надиктовать в режиме реального времени.
🟣 Преобразует аудио в текст
🟣 Мгновенно переводит распознанный текст на разные языки, может быть полезно для международных видеозвонков.
Или, как вариант, включить запись на совещании на иностранном языке и получить мгновенный перевод. Плюсом текст совещания останется с вами
🟣 Так же хорошо подходит для создания субтитров - за секунды транскрибирует речь из видео и аудио.
🟣 Голосовое управление - использование голосовых команд для управления веб-интерфейсами.
Сервис бесплатный. Модель работает локально, данные останутся на вашем устройстве, скачать можно в🧑💻 Discord , протестировать можно на сайте 🤗 HuggingFace
НейроProfit
#github #whisper #транскрипция #audiototext #audio2text #video2text #нейросеть
Whisper WebGPU - мгновенно распознаёт речь со 100 языков! Можно загрузить файл - как аудио, так и видео, либо вставить ссылку, либо надиктовать в режиме реального времени.
Или, как вариант, включить запись на совещании на иностранном языке и получить мгновенный перевод. Плюсом текст совещания останется с вами
Сервис бесплатный. Модель работает локально, данные останутся на вашем устройстве, скачать можно в
НейроProfit
#github #whisper #транскрипция #audiototext #audio2text #video2text #нейросеть
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👍14❤8🤬1
Бесплатный генератор изображений от разработчиков Kling.
Kolors — открытый генератор изображений, доступен бесплатно, но для коммерческого использования необходимо получить разрешение разработчиков. Я потестила, качество достойное.
Саму нейросеть можно скачать с🧑💻 Github или попробовать на сайте Huggingface.
Сложнее всего генераторам изображений даются реалистичные фото, и можно сразу определить, годная перед нами нейросеть или нет. Поэтому я сразу сгенерировала продуктовые фото.
Я использовала не самый простой промт
Что похоже с👩💻 Midjourney
🟣 Как и в Midjourney, можно указать негативные слова, я указала:
, чтобы получить реалистичное продуктовое фото
🟣 Размер тоже, как и в Midjourney, настраивается.
🟣 Еще тут так же как и в Midjourney за изображением закрепляется seed - число, которое можно указывать для получения результата в таком же стиле.
Я скопировала этот seed и использовала уже другой промт:
Изображение получилось по стилю похоже на предыдущее. С рандомным seed принципиальной разницы я не увидела, но сам факт, что сид есть в бесплатной нейросети уже радует.
Что не может и отличия с👩💻 Midjourney
🟣 Изображения в Kolors скачиваются в webp, в MJ скачиваются в высоком качестве png
🟣 Шрифты и тексты не может.
По запросу
выдал ошибку, когда #midjourney сделала 3 генерации из 4-х без ошибки
🟣 И конечно же, Midjourney реалистичней, пока это самый лучший генератор изображений, картинки сверху это доказывают
🟣 Ну и настроек, в том числе индивидуальных, в Midjourney больше. Например, можно посмотреть на чужой дизайн и через параметр --sref привнести этот стиль своим творениям, примеры тоже во вложении.
На самом деле отличий еще больше, как и настроек Midjourney, подробнее со всеми возможностями Midjourney вы сможете ознакомиться в Закрытом клубе.
Для бесплатной нейросети поиграться Kolors хорош👌 А для профессионалов и тех, кто хочет качественных результатов, лучше Midjourney пока ничего не придумали. Классно, что Midjourney постоянно выкатывают что-то новое, и классно, что мои ученики получают обновленную информацию от меня. Помимо того, что доступ к Закрытому клубу будет у вас навсегда, вы будете регулярно получать обновления по учебной программе, включая методички. А это очень важно, ведь нейросети постоянно обновляются, а с ними и возможности, так что знания
НейроProfit
#freetool #изображения #github #huggingface
Kolors — открытый генератор изображений, доступен бесплатно, но для коммерческого использования необходимо получить разрешение разработчиков. Я потестила, качество достойное.
Саму нейросеть можно скачать с
Сложнее всего генераторам изображений даются реалистичные фото, и можно сразу определить, годная перед нами нейросеть или нет. Поэтому я сразу сгенерировала продуктовые фото.
Я использовала не самый простой промт
food photo of croissants on a plate surrounded by strawberries and cream, indoor photo of French food restaurant, bohemian vibe
Что похоже с
fuzzy photo, unrealistic photo
, чтобы получить реалистичное продуктовое фото
Я скопировала этот seed и использовала уже другой промт:
A product photo of a men's shampoo in black laconic packaging against a backdrop of cliffs and ocean
Изображение получилось по стилю похоже на предыдущее. С рандомным seed принципиальной разницы я не увидела, но сам факт, что сид есть в бесплатной нейросети уже радует.
Что не может и отличия с
По запросу
front view, 3D text saying "Neural Profit" made of purple neon font, with yellow and blue solid color background, rendered in a hyper realistic style, cinema 4D, realflow, octane render
выдал ошибку, когда #midjourney сделала 3 генерации из 4-х без ошибки
На самом деле отличий еще больше, как и настроек Midjourney, подробнее со всеми возможностями Midjourney вы сможете ознакомиться в Закрытом клубе.
Для бесплатной нейросети поиграться Kolors хорош
АКТУАЛЬНЫ БУДУТ ВСЕГДА
.НейроProfit
#freetool #изображения #github #huggingface
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤9🔥6👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Voice-Pro - лучший синтезатор речи с открытым кодом
Voice-Pro — это комплексный инструмент с открытым исходным кодом для обработки аудио. Он включает функции транскрипции, перевода, синтеза речи и многое другое. Подойдет для создателей контента и разработчиков.
Сервис идеально транскрибирует и переводит текст в речь. Этим он и интересен, что способен распознавать сложные диалекты и невнятное произношение. А еще он собрал в себе сразу несколько моделей — Whisper, Google Translator и Edge TTS.
Основные возможности Voice-Pro:
НейроProfit | Закрытый клуб НейроУчеба
#транскрипция #транскрибация #аудио #github #opensource
Voice-Pro — это комплексный инструмент с открытым исходным кодом для обработки аудио. Он включает функции транскрипции, перевода, синтеза речи и многое другое. Подойдет для создателей контента и разработчиков.
Сервис идеально транскрибирует и переводит текст в речь. Этим он и интересен, что способен распознавать сложные диалекты и невнятное произношение. А еще он собрал в себе сразу несколько моделей — Whisper, Google Translator и Edge TTS.
Что крутого🔡 🔴 Мультиязычный, знает более 100 языков, включая русский🔴 Умеет загружать видео с YouTube, конвертировать в аудио и даже обрабатывать его в режиме реального времени🔴 Реализована поддержка реального времени для распознавания и перевода речи, а также пакетная обработка большого количества файлов для создания субтитров, перевода и синтеза речи.
Основные возможности Voice-Pro:
🟣
Транскрипция и перевод:
Использует движки
Whisper
,
Faster-Whisper
и
Whisper-Timestamped
для преобразования речи в текст с поддержкой более 90 языков. Обеспечивает перевод на более чем 100 языков с помощью
Google Translator
.
🟣
Синтез речи (TTS)
: Поддерживает Edge-TTS с более чем 400 голосами на 100+ языках, а также F5-TTS для клонирования голоса с нулевым образцом, что позволяет создавать подкасты с использованием знаменитых голосов.
🟣
Изменение голоса и клонирование:
Предоставляет функции изменения голоса и клонирования голоса с нулевым образцом (E2, F5-TTS), так что можно создавать уникальные голосовые проекты.
🟣
Загрузка с YouTube и изоляция вокала:
Позволяет загружать видео с
📱
YouTube
и извлекать аудио в форматах
mp3
,
wav
,
flac
.
НейроProfit | Закрытый клуб НейроУчеба
#транскрипция #транскрибация #аудио #github #opensource
Please open Telegram to view this post
VIEW IN TELEGRAM
5👍26❤7🔥5👏1