itbze | IT & язык
897 subscribers
15 photos
7 videos
17 links
👋🏻 Добро пожаловать!

Здесь мы публикуем интересные новости из мира IT, NLP, AI и делимся прогрессом в наших проектах.
Download Telegram
⚡️ Первые шаги по дообучению нейросети для генерации изображений.

Существующие модели не умеют генерировать национальные костюмы и атрибуты, они изображают костюмы дальневосточных и северных народов.

☄️ Обучение проводилось на базе модели FLUX, которая сейчас активно набирает популярность и показывает отличные результаты. Данные для обучения составлены из 110 выборочных изображений открытого датасета и дополнительных фотографий из интернета, изображающих национальные костюмы и атрибуты с текстовым описанием каждого из них.

☄️ Для обучения и использования моделей по генерации изображений требуется большое количество вычислительных ресурсов. Релиз модели в открытый доступ пока невозможен, так как необходимо установить цензуру и ограничения по содержанию запросов, которые исходят из этических норм народов Кавказа.

Вдохновление идеей канала @qunash_anzor

| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥189❤‍🔥51
🗡 Первый Лезгинский переводчик

Lezghian Community дообучили(fine-tune) нейросеть на корпусе из 13.8К параллельных предложений. В качестве базовой модели используется NLLB-200, о которой писал ранее.

По итогам тестирования метрика BLEU показывает отметку в 27 единиц точности перевода с двух сторон (Русский, Лезгинский), что является достойным результатом для столь малого количества данных.

Эти результаты указывают на то, что модель может производить точные переводы для обеих языковых пар. Однако есть планы по дальнейшему улучшению модели путем параллельного выравнивания корпусов для улучшения сопоставления пар предложений. Кроме того, будут предприняты усилия по сбору большего количества обучающих данных для повышения производительности модели, особенно при обработке более разнообразных и сложных лингвистических структур.

— пишут авторы.

☄️ Попробовать модель
Please open Telegram to view this post
VIEW IN TELEGRAM
15❤‍🔥7🔥63
⚜️ Обновление Zədzək — Черкесский переводчик ⚜️

Главное изменение: появилась возможность переводить предложения с Кабардино-Черкесского языка на Русский.

🏮 Теперь бот автоматически определяет язык введенного предложения и переводит на целевой. Почему раньше это не было возможным? Проблема заключалась в отсутствии качественного параллельного корпуса, что не позволяло добиться хороших результатов при переводе на русский язык.

🏮Новая версия нейросети — дообученная на 120 тыс. параллельных предложений модель nllb-200. По итогам тестирования метрики BLEU и CHRF++ показывают 26,5 и 48,6 соответственно. Это лучший результат, которого удалось достигнуть после множества попыток обучения. За этот месяц я попробовал десятки подходов к обучению и наконец могу заявить, что нашел оптимальный. Теперь остается только собирать и дальше параллельный корпус.

В настоящий момент ведется работа над глобальным обновлением — ожидайте в ближайшее время...

⚜️ Zədzək — Черкесский переводчик

| itbze |
1❤‍🔥36👍16🔥123👏1
⚜️ 2 новых языка в BzeGame ⚜️

Черкесский (Кабардинский и Адыгейский) 🗡
Карачаево-Балкарский 🗡🗡
Осетинский (Иронский) 🤩

☄️ Бот для игры в Элиас(Крокодил) на родном языке, в котором уже был представлен Кабардинский диалект, показал хорошую активность и продемонстрировал интерес людей к играм на родном языке. Они играют, тренируют письменную речь, учатся объяснять слова на родном языке и расширяют словарный запас.

Теперь при добавлении бота в группу он сам предложит выбрать язык. Если захотите сменить язык игры — просто введите /lang

😉 Бот BzeGamehttps://t.iss.one/BzeGameBot

| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥15🔥63👍32
В честь матча за звание чемпиона мира по шахматам Google запустили в Google Labs возможность поиграть в шахматы с Gemini, стилизовав их по текстовому запросу.

По запросу Caucasian Culture рисует весьма неплохие шахматные фигуры, стилизованные под национальные костюмы. Оппонента ИИ выбирает сам, в данном случае выбрал Японскую культуру со своими особенностями.

☄️ Интересно, что популярная модель по генерации изображений теперь корректно обрабатывает запросы, связанные с Кавказскими национальными костюмами.

Игра в шахматы со своим стилем — labs.google/genchess
Рекомендуется использовать VPN США

| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥18❤‍🔥772👍1
⚜️ В 2024 году совместно с КБРОО "Черкесский ренессанс" при поддержке Министерства по делам национальностей КБР и Министерства просвещения КБР реализовали проекты: «Кабардинский язык для Яндекс.Переводчика» и «Нейросеть как инструмент межнационального общения».

В рамках данных проектов при участии специалистов, преподавателей кабардино-черкесского и карачаево-балкарского языков, были переведены корпуса из 100.000 предложений на два титульных языках КБР для добавления в Яндекс.Переводчик. В предстоящем году оба языка будут включены в платформу.

Параллельно с этим шла работа по обучению нейронных сетей вида LLM (Большая языковая модель), способных генерировать тексты на русском, кабардино-черкесском и балкарском языках.

Проект был презентован в 6 образовательных учреждениях города Нальчик.

⚜️ Данный проект имеет потенциал не только для сохранения титульных языков Кабардино-Балкарии, но и для их развития.
1❤‍🔥139🔥5👍2
Media is too big
VIEW IN TELEGRAM
🌟 CircassianAI — Черкесский Искусственный Интеллект 🌟

СircassianAI — бета-версия модели нейронной сети, способной генерировать текст на русском и кабардино-черкесском языках.

Обучение CircassianAI проводилось на большом массиве данных, включающем как моноязычные тексты, так и параллельные корпусы на русском и кабардино-черкесском языках, что позволяет модели обеспечивать высокий уровень понимания контекста и точность генерации текста на обоих языках.

Обучалась нейронная сеть на 10.000 объемных текстах и 180.000 параллельных предложений на кабардино-черкесском языке. Благодарность хочется выразить преподавателям, помогающим в составлении и проверке корпуса. На основе данных так же был обновлен переводчик @zedzekbot

🏮Основной функционал CircassianAI:

☄️Ответы на вопросы:
Модель способна отвечать на любые вопросы, включая сложные темы, касающиеся языка, традиций, истории и культуры адыгов. Она станет незаменимым помощником для всех, кто интересуется черкесским наследием.

☄️ Генерация текстов:
CircassianAI может составлять тексты на различные темы, будь то статьи, эссе, рассказы или даже деловая переписка. Тексты создаются с учётом заданной тематики и стилистики.

☄️Ассистирование:
Модель выступает в роли интеллектуального помощника, способного помогать с обучением, переводом, созданием учебных материалов или решением повседневных задач, связанных с языком.

🌟 CircassianAI — это не просто модель искусственного интеллекта, это вклад в сохранение уникального культурного наследия адыгов. Благодаря своей гибкости и функциональности она станет незаменимым помощником для носителей языка, исследователей, преподавателей и всех, кто интересуется черкесской культурой.

❗️Это бета-версия. Возможны ошибки, о которых просим писать сюда @itbzefeedbackbot

👍 Telegram бот@circassianAIbot

Web сайтhttps://circassian.ai

| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤‍🔥2614🔥8👍4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 TauluAI — Балкарский Искусственный Интеллект 🌟

TauluAI — бета-версия модели нейронной сети, способной генерировать текст на русском и балкарском языках.

Обучалась нейронная сеть на 4.000 объемных текстах и 135.000 параллельных предложений на балкарском языке. Благодарность хочется выразить преподавателям, помогающим в составлении и проверке корпуса.

🤩 Обновлен бот @sezlukbot — Карачаево-Балкарский переводчик. Добавлен режим перевода полноценных предложений. Четверть взятого корпуса принадлежит Али Берберову и Богдану Теунаеву, который они собирали на протяжении трех лет. Их первый в мире Карачаево-Балкарский переводчик. Результаты их научной работы опубликованные в статье.

☄️ Модель способна отвечать на любые вопросы, включая сложные темы, касающиеся языка, традиций, истории и культуры балкарцев.
☄️ TauluAI может составлять тексты на различные темы, будь то статьи, эссе, рассказы или даже деловая переписка.

🏮Примеры использования TauluAI:

🔵Создание текстов на темы традиций, культуры и истории балкарцев.
🔵Перевод текстов с русского на балкарский и обратно.
🔵Разработка обучающих материалов для изучения языка.
🔵Помощь в подготовке публичных выступлений, написании статей и научных работ.

Качество генерации на балкарском языке среднее, ввиду нехватки объёма данных, однако модель передает смысл написанного текста. В настоящий момент ведется работа по сбору данных для улучшения качества.

❗️Это бета-версия. Возможны ошибки, о которых просим писать сюда @itbzefeedbackbot

👍 Telegram бот@tauluAIbot

Web сайтhttps://taulu.ai

| itbze |
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥3015😁11👍5❤‍🔥1👀1
Media is too big
VIEW IN TELEGRAM
☄️ Возвращаемся с хорошими новостями.

Tərməsh | Circassian translator | Черкесский переводчик

☄️ Добавлен английский язык, как язык интерфейса. Включает словарь, перевод и голосовой режим. Для переключения языка нужно нажать на меню (слева от ввода) и выбрать /lang.

🙃 Добавление английского языка позволит адыгам со всего мира пользоваться переводчиком и изучать родной язык.

Для перевода одиночных слов, добавлены 4 словаря (kbd - eng; ady - eng)

🖥 Новое окно MiniApp(миниприложения) для удобного использования переводчика с графическим интерфейсом. Перевод осуществляется с минимальной задержкой, а при переводе одиночных слов снизу появляются вариации из словаря без переключения режимов. Работает пока только на русском языке. Голосовой режим находится в разработке.

⚠️ При возникновении ошибок или вопросов, просим обращаться в поддержку — @itbzefeedbackbot

Tərməsh | бот | miniapp

| itbze | IT & язык |
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥1699👍4🔥4🤔1
Please open Telegram to view this post
VIEW IN TELEGRAM
504224
Сегодня, 5 июня, в Москве на Красной площади в рамках фестиваля национальных литератур народов России буду презентовать проект «Нейросеть как инструмент межнационального общения». Мероприятие пройдёт в 12-м шатре в 15:00. Приглашаю всех желающих. Прямо сейчас в 19-м шатре идёт презентация книги Зарины Кануковой «Уэсрэ Нэсрэ».
❤‍🔥25🔥83👍1
Live stream scheduled for
Live stream started
Live stream finished (48 minutes)
Благодарю присутствующих, в центре оборвалась связь и не получилось довести эфир до конца
15❤‍🔥3🔥2