Существующие модели не умеют генерировать национальные костюмы и атрибуты, они изображают костюмы дальневосточных и северных народов.
Вдохновление идеей канала @qunash_anzor
| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥18❤9❤🔥5 1
Lezghian Community дообучили(fine-tune) нейросеть на корпусе из 13.8К параллельных предложений. В качестве базовой модели используется NLLB-200, о которой писал ранее.
По итогам тестирования метрика BLEU показывает отметку в 27 единиц точности перевода с двух сторон (Русский, Лезгинский), что является достойным результатом для столь малого количества данных.
Эти результаты указывают на то, что модель может производить точные переводы для обеих языковых пар. Однако есть планы по дальнейшему улучшению модели путем параллельного выравнивания корпусов для улучшения сопоставления пар предложений. Кроме того, будут предприняты усилия по сбору большего количества обучающих данных для повышения производительности модели, особенно при обработке более разнообразных и сложных лингвистических структур.
— пишут авторы.
Please open Telegram to view this post
VIEW IN TELEGRAM
huggingface.co
Lezghian Nllb 200 Distilled 600M - a Hugging Face Space by leks-forever
Discover amazing ML apps made by the community
⚜️ Обновление Zədzək — Черкесский переводчик ⚜️
Главное изменение: появилась возможность переводить предложения с Кабардино-Черкесского языка на Русский.
🏮 Теперь бот автоматически определяет язык введенного предложения и переводит на целевой. Почему раньше это не было возможным? Проблема заключалась в отсутствии качественного параллельного корпуса, что не позволяло добиться хороших результатов при переводе на русский язык.
🏮Новая версия нейросети — дообученная на 120 тыс. параллельных предложений модель nllb-200. По итогам тестирования метрики BLEU и CHRF++ показывают 26,5 и 48,6 соответственно. Это лучший результат, которого удалось достигнуть после множества попыток обучения. За этот месяц я попробовал десятки подходов к обучению и наконец могу заявить, что нашел оптимальный. Теперь остается только собирать и дальше параллельный корпус.
В настоящий момент ведется работа над глобальным обновлением — ожидайте в ближайшее время...
⚜️ Zədzək — Черкесский переводчик
| itbze |
Главное изменение: появилась возможность переводить предложения с Кабардино-Черкесского языка на Русский.
🏮 Теперь бот автоматически определяет язык введенного предложения и переводит на целевой. Почему раньше это не было возможным? Проблема заключалась в отсутствии качественного параллельного корпуса, что не позволяло добиться хороших результатов при переводе на русский язык.
🏮Новая версия нейросети — дообученная на 120 тыс. параллельных предложений модель nllb-200. По итогам тестирования метрики BLEU и CHRF++ показывают 26,5 и 48,6 соответственно. Это лучший результат, которого удалось достигнуть после множества попыток обучения. За этот месяц я попробовал десятки подходов к обучению и наконец могу заявить, что нашел оптимальный. Теперь остается только собирать и дальше параллельный корпус.
В настоящий момент ведется работа над глобальным обновлением — ожидайте в ближайшее время...
⚜️ Zədzək — Черкесский переводчик
| itbze |
Telegram
Zədzək | Черкесский переводчик
Zədzək | Черкесский переводчик с искусственным интеллектом
Канал — https://t.iss.one/itbze
Для связи — @itbzefeedbackbot
Канал — https://t.iss.one/itbze
Для связи — @itbzefeedbackbot
1❤🔥36👍16🔥12❤3👏1
⚜️ 2 новых языка в BzeGame ⚜️
Черкесский (Кабардинский и Адыгейский)🗡
Карачаево-Балкарский🗡 🗡
Осетинский (Иронский)🤩
☄️ Бот для игры в Элиас(Крокодил) на родном языке, в котором уже был представлен Кабардинский диалект, показал хорошую активность и продемонстрировал интерес людей к играм на родном языке. Они играют, тренируют письменную речь, учатся объяснять слова на родном языке и расширяют словарный запас.
Теперь при добавлении бота в группу он сам предложит выбрать язык. Если захотите сменить язык игры — просто введите /lang
😉 Бот BzeGame — https://t.iss.one/BzeGameBot
| itbze |
Черкесский (Кабардинский и Адыгейский)
Карачаево-Балкарский
Осетинский (Иронский)
Теперь при добавлении бота в группу он сам предложит выбрать язык. Если захотите сменить язык игры — просто введите /lang
| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤🔥15🔥6❤3👍3 2
По запросу Caucasian Culture рисует весьма неплохие шахматные фигуры, стилизованные под национальные костюмы. Оппонента ИИ выбирает сам, в данном случае выбрал Японскую культуру со своими особенностями.
Игра в шахматы со своим стилем — labs.google/genchess
Рекомендуется использовать VPN США
| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18❤🔥7 7❤2👍1
⚜️ В 2024 году совместно с КБРОО "Черкесский ренессанс" при поддержке Министерства по делам национальностей КБР и Министерства просвещения КБР реализовали проекты: «Кабардинский язык для Яндекс.Переводчика» и «Нейросеть как инструмент межнационального общения».
В рамках данных проектов при участии специалистов, преподавателей кабардино-черкесского и карачаево-балкарского языков, были переведены корпуса из 100.000 предложений на два титульных языках КБР для добавления в Яндекс.Переводчик. В предстоящем году оба языка будут включены в платформу.
Параллельно с этим шла работа по обучению нейронных сетей вида LLM (Большая языковая модель), способных генерировать тексты на русском, кабардино-черкесском и балкарском языках.
Проект был презентован в 6 образовательных учреждениях города Нальчик.
⚜️ Данный проект имеет потенциал не только для сохранения титульных языков Кабардино-Балкарии, но и для их развития.
В рамках данных проектов при участии специалистов, преподавателей кабардино-черкесского и карачаево-балкарского языков, были переведены корпуса из 100.000 предложений на два титульных языках КБР для добавления в Яндекс.Переводчик. В предстоящем году оба языка будут включены в платформу.
Параллельно с этим шла работа по обучению нейронных сетей вида LLM (Большая языковая модель), способных генерировать тексты на русском, кабардино-черкесском и балкарском языках.
Проект был презентован в 6 образовательных учреждениях города Нальчик.
⚜️ Данный проект имеет потенциал не только для сохранения титульных языков Кабардино-Балкарии, но и для их развития.
1❤🔥13❤9🔥5👍2
Media is too big
VIEW IN TELEGRAM
СircassianAI — бета-версия модели нейронной сети, способной генерировать текст на русском и кабардино-черкесском языках.
Обучение CircassianAI проводилось на большом массиве данных, включающем как моноязычные тексты, так и параллельные корпусы на русском и кабардино-черкесском языках, что позволяет модели обеспечивать высокий уровень понимания контекста и точность генерации текста на обоих языках.
Обучалась нейронная сеть на 10.000 объемных текстах и 180.000 параллельных предложений на кабардино-черкесском языке. Благодарность хочется выразить преподавателям, помогающим в составлении и проверке корпуса. На основе данных так же был обновлен переводчик @zedzekbot
🏮Основной функционал CircassianAI:
Модель способна отвечать на любые вопросы, включая сложные темы, касающиеся языка, традиций, истории и культуры адыгов. Она станет незаменимым помощником для всех, кто интересуется черкесским наследием.
CircassianAI может составлять тексты на различные темы, будь то статьи, эссе, рассказы или даже деловая переписка. Тексты создаются с учётом заданной тематики и стилистики.
Модель выступает в роли интеллектуального помощника, способного помогать с обучением, переводом, созданием учебных материалов или решением повседневных задач, связанных с языком.
| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤🔥26❤14🔥8👍4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
TauluAI — бета-версия модели нейронной сети, способной генерировать текст на русском и балкарском языках.
Обучалась нейронная сеть на 4.000 объемных текстах и 135.000 параллельных предложений на балкарском языке. Благодарность хочется выразить преподавателям, помогающим в составлении и проверке корпуса.
🏮Примеры использования TauluAI:
Качество генерации на балкарском языке среднее, ввиду нехватки объёма данных, однако модель передает смысл написанного текста. В настоящий момент ведется работа по сбору данных для улучшения качества.
| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥30❤15😁11👍5❤🔥1👀1
Media is too big
VIEW IN TELEGRAM
Tərməsh | Circassian translator | Черкесский переводчик
Для перевода одиночных слов, добавлены 4 словаря (kbd - eng; ady - eng)
Tərməsh | бот | miniapp
| itbze | IT & язык |
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥16❤9 9👍4🔥4🤔1
Media is too big
VIEW IN TELEGRAM
1763 🌟 1864
Please open Telegram to view this post
VIEW IN TELEGRAM
50 42❤24
Сегодня, 5 июня, в Москве на Красной площади в рамках фестиваля национальных литератур народов России буду презентовать проект «Нейросеть как инструмент межнационального общения». Мероприятие пройдёт в 12-м шатре в 15:00. Приглашаю всех желающих. Прямо сейчас в 19-м шатре идёт презентация книги Зарины Кануковой «Уэсрэ Нэсрэ».
❤🔥25🔥8❤3👍1
Видео-трансляция на презентацию. Ссылка для желающих присоединиться https://t.iss.one/itbze?livestream
Telegram
itbze | IT & язык
👋🏻 Добро пожаловать!
Здесь мы публикуем интересные новости из мира IT, NLP, AI и делимся прогрессом в наших проектах.
Здесь мы публикуем интересные новости из мира IT, NLP, AI и делимся прогрессом в наших проектах.
❤🔥9🔥1
Благодарю присутствующих, в центре оборвалась связь и не получилось довести эфир до конца
❤15❤🔥3🔥2