Ирон Common Voice
77 subscribers
7 photos
13 links
Ирон Common Voice-ы ног хабæрттæ
Download Telegram
Channel created
Что мы переводим?

Мы делаем сделали интерфейс для сбора открытого звукового корпуса на сайте Common Voice: https://commonvoice.mozilla.org/ (вы можете зайти поиграться немного с русской или любой другой частью; сейчас осетинского языка там нет, мы хотим, чтобы он был, как уже есть тувинский, башкирский и другие).

Common Voice предоставляет собранные корпуса под удобными свободными лицензиями, так что любые люди и компании могут потом их использовать для развития речевых технологий: распознавания речи и генерации речи по тексту.

То есть на первом этапе мы делаем интерфейс, тогда нам открывают сбор предложений — мы добавляем текстовые предложения на осетинском, волонтёры их «начитывают», получается «руда» для дальнейшей работы удобных современных цифровых средств (умные колонки, чтение экрана для незрячих и слабовидящих, «расшифровка» голосовых сообщений и т. д.)
Перевели уже 57%.

Хъæлæсон рардты æмбырд «набор голосовых данных»
Хъæлæсон æфтуантæ «голосовые приложения»
75% перевода интерфейса готово!
Именно столько требуется для запуска сайта на языке, скоро будут новые ссылки и новая информация.

Осмотреться, что в проекте где, можно по ссылке https://commonvoice.mozilla.org (на русском или любом другом из уже доступных языков).

В проекте есть 4 действия, все увлекательны и полезны:
· предлагать новые фразы,
· проверять фразы, предложенные другими,
· читать под запись предложенные фразы с экрана,
· проверять звуковые записи, сделанные другими.
https://commonvoice.mozilla.org/os/ — скуыста!

Common Voice у дунейы егъаудӕр иумӕйаг бирӕвзагон хъӕлӕсон рардты ӕмбырд. Абонæй кусы ирон æвзагыл дæр.
Стъæлфытæ æвæрын уæ ма ферох уæд!

Ног хъуыдыйæдтæ ис бафтауæн мæнæ ам: https://commonvoice.mozilla.org/os/write
Сейчас озвучивать пока нечего, не хватает текстов, но вы можете добавлять свои предложения письменно или (что проще) одобрять добавленные другими. Вот ссылка — https://commonvoice.mozilla.org/os/review
Если в предложении всё в порядке, жмите левую кнопку и читайте следующее.
Помогайте нам одобрять собранные предложения тут — https://commonvoice.mozilla.org/os/review
Чем быстрее соберём запас предложений, тем скорее откроется возможность записи голосов.
Скуыста æххæстæй!

https://commonvoice.mozilla.org/os
У нас пока только три голоса, а надо хотя бы десяток. Также нет ни одного женского голоса, а в идеале должны быть представлены в равных долях мужские и женские голоса.

Заходите на https://commonvoice.mozilla.org/os и попытайтесь разобраться с интерфейсом, там всё интуитивно понятно. Писать можно как с компьютера, так и с телефона. Можно также прослушивать и одобрять чужие записи (или не одобрять, если заметите огрехи: например, когда диктор, исправляя себя, читает одно слово два раза — это брак).
https://commonvoice.mozilla.org/os/review — поодобряйте предложения по указанным там критериям (отсутствие «левых» символов и цифр, хорошая грамматика).
Сейчас у нас 7 голосов (недавно появился новый роскошный мужской голос — не останавливайся, брат!).
Это нормально для только что открывшегося проекта, но хочется больше. Приглашайте знакомых и близких.

Для сравнения, на башкирском предложения для Common Voice озвучивает 924 человека, на татарском — 251, на армянском — 74, на казахском — 132. Чем больше будет дикторов и чем больше часов речи они запишут, тем лучше будет качество речевых технологий на наколенном материале.

Что такое Common Voice и почему это не только забавно, но и важно, написано тут на русском, и тут на осетинском.
Люди жалуются, что нечего послушать. Если нечего послушать, значит, все записи уже прошли оценку, не хватает новых записей. Пишите звук сами или вовлекайте новых участников в эту увлекательную игру. С приложением CV Project можно в любую свободную минутку писать звук или слушать записи с мобильного телефона.

Зачем это всё, кому нужно, когда и как началось — https://t.iss.one/amikecoru/1614
Мы крутые, записали уже почти полчаса материала, если все записи сложить :)

Много это или мало? Маловато в смысле возможного использования прямо сейчас, но это хороший задел, там осталось-то просто добавить новых записей.

Сайт с этой статистикой и с возможностью внести свой вклад одним из четырёх способов (присылать предложения в письменном виде, проверять предложения других, записывать своим голосом ранее собранные предложения, проверять записи других): https://commonvoice.mozilla.org/os