НЕЙРОСЕТЬ АСПИРАНТА СВФУ НАУЧИЛАСЬ РАСПОЗНАВАТЬ ДИФТОНГИ
Нейросеть аспиранта института математики и информатики Северо-Восточного федерального университета Иннокентия Иванова, которая позволит создавать онлайн-переводчики с якутского языка, научилась распознавать дифтонги в 50% случаев.
В качестве предобученной модели выбрана ruGPT-3 от Сбера. Проект реализуется на средства гранта Российского фонда фундаментальных исследований.
«На сегодня нейросеть, обученная на видеоускорителе RTX 3070 Ti, еще не выдает полностью связный текст, но подходящие дифтонги в 50% случаев подставляет верные. Тем не менее, план работ перевыполнен, поскольку создание нейросети планировалось реализовать в середине 2022 года», – поделился ученый.
Для создания нейронной сети Иннокентий Иванов использовал материалы онлайн-СМИ, а также лингвистического корпуса якутского языка.
Наполнение базы данных должно завершиться к марту-апрелю 2022 года.
В будущем аспирант планирует улучшить качество генерации текста и проработать его практическое применение.
«Следует внимательно отнестись к склонениям слов, дифтонгам. Смысл созданного нейронной сетью текста может исчезнуть после очередного неправильного склонения слов», – отметил он.
По итогам проекта Иннокентий Иванов опубликует модель нейронной сети в открытом доступе – она является многоцелевой и не заточена под конкретную задачу, ее применение возможно в широком спектре программ и приложений. Таким образом сервис можно будет добавить в свой продукт для мгновенного перевода текста с якутского языка, общения с техподдержкой.
#сахатыла #дифтонги #свфу
Нейросеть аспиранта института математики и информатики Северо-Восточного федерального университета Иннокентия Иванова, которая позволит создавать онлайн-переводчики с якутского языка, научилась распознавать дифтонги в 50% случаев.
В качестве предобученной модели выбрана ruGPT-3 от Сбера. Проект реализуется на средства гранта Российского фонда фундаментальных исследований.
«На сегодня нейросеть, обученная на видеоускорителе RTX 3070 Ti, еще не выдает полностью связный текст, но подходящие дифтонги в 50% случаев подставляет верные. Тем не менее, план работ перевыполнен, поскольку создание нейросети планировалось реализовать в середине 2022 года», – поделился ученый.
Для создания нейронной сети Иннокентий Иванов использовал материалы онлайн-СМИ, а также лингвистического корпуса якутского языка.
Наполнение базы данных должно завершиться к марту-апрелю 2022 года.
В будущем аспирант планирует улучшить качество генерации текста и проработать его практическое применение.
«Следует внимательно отнестись к склонениям слов, дифтонгам. Смысл созданного нейронной сетью текста может исчезнуть после очередного неправильного склонения слов», – отметил он.
По итогам проекта Иннокентий Иванов опубликует модель нейронной сети в открытом доступе – она является многоцелевой и не заточена под конкретную задачу, ее применение возможно в широком спектре программ и приложений. Таким образом сервис можно будет добавить в свой продукт для мгновенного перевода текста с якутского языка, общения с техподдержкой.
#сахатыла #дифтонги #свфу