Raxys Studios
684 subscribers
120 photos
14 videos
63 links
Made with honor in North Caucasus
https://raxys.app
Download Telegram
Летний выпуск Avzag
С последнего обновления словаря прошло 6 месяцев. За это время размер базы данных увеличился более чем в два раза, приближаясь к отметке в 16 тыс. слов (рис. 1), и в гонку активнее включился Западный Кавказ. Вместе с этим за последние 3 месяца проведена плотная инженерная работа над перестраиванием всех систем приложения, что выразилось в новых функциях и ощутимых улучшениях общего опыта. Выпускаем первое крупное обновление словаря.

При открытии приложения вы сразу же заметите практически мгновенный старт. Мы существенно ускорили работу словаря; как начальный запуск, так и последующие переходы между страницами. Исправлена дюжина ошибок и неточностей по всем интерфейсам.

Теперь на домашнем экране в заголовках языковых карт отображаются родные названия (эндонимы) вместо английских. Также во всём приложении тексты на наших языках приобрели свой, отличный от общего шрифт (рис. 2). Панель выбранных языков переместилась вниз и получила анимацию для большего обзора при просмотра карты (рис. 3). Сама карта теперь со значительно повышенной чёткостью и более отзывчивым управлением.

Экраны просмотра и редактирования слова были воссозданы с нуля и разделены. Опыт показал, что удобное отображение информации и её эффективное редактирование — две разные задачи, требующие двух различных инструментов. Просмотр слова теперь приближен к читабельному виду статьи (рис. 4), а редактор — к модели стандартной формы заполнения (рис. 5).

Ключевая функция обновления — ссылки в приложении (deep-linking). История с Wordle научила нас важности социального элемента. Теперь у всех есть возможность делиться словами из Avzag и переходить к ним по ссылкам. Мы реализовали два типа вывода:

1. Полная словарная статья со всеми метками, формами, описанием, переводами и т.д.:

🌄 Avzag • Iron
https://avzag.raxys.app/dictionary/wdrZUGlDrabjvvKJfQWy

🔖 Æхсидын
#️⃣ verb
📝 Etymology: phonetic and semantic contamination of *xšaud-: xšusta "to melt", "to be liquid" and *xšay- "to shine", "to burn".
🔹 æхсыстон • first person past tense singular
🔹 æхсыстам • first person past tense plural
🔹 æхсыстай • second person past tense singular
🔹 æхсыстат • second person past tense plural
🔹 æхсыста • third person past tense singular
🔹 æхсыстой • third person past tense plural

💡 To Boil
📝 Synonym of фыцын with different collocations
🔹 бæгæны 'хсидын уыд лæгты хъуыддаг. • brewing ["boiling"] beer was the task of men.

💡 To Heal
📝 About broken bones
🔹 бирæгъ 'сдзæбæх, йæ саст фæрсчытæ дæр бахсыстысты. • the wolf got well, its broken ribs grew together, too.

💡 To Temper
🔹 зынджыбардуаг лæджы й' арты бахсыста. • zyndzhybarduag [fire deity] tempered the man in his fire.

💡 To Melt
📝 About metals
🔹 æрзæт 'хсидын • to melt ore

2. Минимальная строка с заглавной формой и списком переводов:

🌄 Avzag • Dargwa
🔖 Някъ — Hand, Arm
https://avzag.raxys.app/dictionary/GOnz1Wgjmy7rUetnRSCj

Нажатие на ссылку откроет точное слово в приложении или браузере. Яркое применение такого функционала — переходы между словами внутри приложения через ссылки в заметках (рис. 4 & 5).

В программировании этого выпуска приняли участие агульские друзья из @ruxavus (saqhuraj, Kattirarinf), и это радует. До конца года по словарю мы запланировали ещё одно большое обновление, и напоминанием, что вся работа по нашим проектам ведется в открытых репозиториях.
Пока грядущее обновление дорисовывается и отлаживается, бросаем взгляд на эволюцию кавказского технологического бренда.
Наш старый и весьма полезный конвертер письменностей наконец переехал на свой сайт: yaziv.raxys.app. Мы также обновили интерфейс и добавили ряд языков. Осетинская латиница, кумыкский аджам, абхазская МФА — вот малое из того, что может этот простой инструмент.
Каждый из трёх флагманских языковых проектов должен стать платформой. Так мы сможем качественно поднять уровень борьбы за языки Кавказа. Требования у этого следующие:

Естественно, что у всех разное количество ресурсов, но каждый язык должен обладать равными возможностями через одинаково полный доступ ко всей инфраструктуре.
Пример: язык Ц имеет словарь в 10 тыс. слов, язык К — в 2 тыс., и оба показывают склонения, имеют поиск по тегам, приводят примеры и т.д.

У всех свои интересы и проблемы, поэтому каждый язык должен быть технически самодостаточен и развиваться децентрализованно.
Пример: язык Ч самостоятельно публикует карточки с походными вещами, язык А — свой набор морских терминов.

Язык — собственность группы, а потому важно формирование сообщества и кооперация через открытые инструменты и публичный доступ к материалам.
Пример: язык О создаёт историю и делится ссылкой в соц. сетях.; носители О сообщают об ошибках, носители Л, просмотрев и оценив историю, переводят и публикуют её на своём языке.
До сих пор Avdan использует синхронную статичную доставку контента, когда редкие большие обновления разом приносят новые языки и карточки. Такая модель имеет ряд весомых недостатков:

1. Все языки хранятся в общем документе что делает их непозволительно сильно связанными друг с другом. На практике это означает, что один язык с полностью готовыми материалами не может быть выпущен до завершения подготовки всех остальных языков. Эта связанность также сильно усложняет добавление собственного, отличительного материала какому-либо языку, так как в таблице всё ссылается на общие ячейки, и подобные расхождения ведут к "провалам".

2. Медиафайлы по каждому из языков также хранятся в общей папке внутри приложения. Скажем, если на текущей стадии в среднем языки весят по 10MB, и в приложении имеется 10 языков, то общий вес приложения, вдобавок к собственно исполняемым файлам (~20MB), увеличивается на 100MB. Со временем суммарный размер будет ощутимо расти, всё более нагружая устройство. Конечно, пользователю совершенно нет нужды держать весь этот объём сверх того, что прямо относится к его языку.

3. Поскольку весь контент статично спаян с установщиком приложения, то единственный способ править материалы — обновление через мобильные магазины. Это лишает нас возможности быстро вносить исправления и оперативно реагировать на обратную связь. Дело в том, что в GooglePlay и AppStore каждое обновление проходит через многодневные проверки перед одобрением к публикации. И хотя безопасность платформ важна, текущий процесс несёт весомые издержки для разработчиков, на что справедливо жалуется и Дуров. Мы считаем, что доставка наших продуктов в Махачкалу или Нальчик не должна зависеть от загруженности офисов Google и Apple в Калифорнии.

Итак, приведённые проблемы не были столь критичны пока приложение имело лишь пару языков. Однако с ростом как количества языков, так и объёма контента в каждом языке, вкупе со стремлением внедрять новые функции, такая операционная модель более не является для нас приемлемой. Поэтому Avdan подвергается полной реконструкции под новую облачную архитектуру.

Не вдаваясь глубоко в детали технической реализации (интересующиеся могут ознакомиться с исходным кодом), перечислим главные улучшения:

1. Громадный общий документ был разбит, и теперь каждый язык имеет собственную таблицу. Наличие каких-либо уникальных карточек или отличающихся переводов более не доставляет неудобств.

2. Все языковые материалы хранятся на полноценных серверах, службы которых в автоматическом режиме пакуют текстовые таблицы переводов и соответствующие им медиафайлы в компактные ZIP-архивы.

3. При первом открытии и выборе языка приложение запрашивает оптимизированные для загрузки наборы карт. Затем, при последующих запусках, приложение сверяет локальные данные с сервером, при необходимости запрашивая обновленные файлы.

4. Наконец, новая облачная архитектура вместе с доработанным клиентом приближает Avdan к статусу платформы, удовлетворяя первые 2 из 3 критериев. И хотя в ближайшие месяцы мы не будем готовы показать открытые инструменты создания пользовательских наборов карт, мы уверенно движемся в этом направлении и продолжаем наращивать технологическую базу.

Сейчас мы находимся на финальной стадии тестирования системы и готовим последние материалы. Надеемся завершить в ближайшие недели, после чего Avdan выходит на новый уровень. На картинке изображена общая схема новой инфраструктуры, а на видео — демонстрация первой полной загрузки кабардинских данных (13 сек. на WiFi пригорода Махачкалы довольно неплохо).
В преддверии релиза напечатали вот такие стикеры для организаторов переводов и озвучек. Посылки отправляются в Аҟәа, Дзæуджыхъæу, ДершлахIяр и другие города Северного Кавказа.
Поздравляем всех причастных, наконец. Подобная проектная коллаборация народов Кавказа от Каспийского до Чёрного морей и результативный IT-продукт — это наша общая большая победа. В этом релизе отдельно выражаю благодарность кумыкской части команды (@b1b1zyana) за assets optimization, а даргинской (@nusayra) — за quality assurance.

И в честь этой победы мы изготовили и разослали языковым представителям ограниченную серию карточек. На передней стороне — логотип "Raxys Studios × Mountain Republic". На обратной — выдержка из книги Халилбека Мусаясула "The land of the last knights", обрисовывающая Андийский съезд 1917 года в Дагестане.
Наверное, сейчас лучший момент для объявления: Raxys Studios завершает свою работу. Напоследок резюмируем статус проектов.

Avdan достиг устойчивого уровня платформы, хотя и закрытой. При наличии инициативы новые языки будут добавляться, а текущие языки будут доступны и дальше.

Технологическое превосходство наших приложений всегда стояло на первом месте, и в то же время мы много вкладывали в эстетическую и концептуальную достаточность своих продуктов. Поэтому Avzag был перефокусирован на словарь и подвергся ребрендингу в Bazur. Дело в том, что старый Avzag технически и идейно имел мало общего с тем, во что развилось это приложение. Да и остальные модули в разной степени покрыты другими нашими проектами. Месяц назад вышло внеочередное обновление на Bazur лишь с незначительной реорганизацией интерфейса вокруг функционала словаря. И могу сказать, что это было второе лучшее решение по словарю с начала его разработки почти полтора года назад.

Три года мы делали то, что могли, с теми возможностями, что имели, создавая ценность и поднимая планки. Эволюция от экспериментального полигона до проектной экосистемы была полностью органичным развитием, наполненным инженерными триумфами. Увы, я не успел довести Andax до статуса полноценного продукта. Вся разработка проекта от сентября 2021 до мая 2022 прошла в академической среде, которая накладывала конкретные требования к тому как и над чем велась работа. И не всегда лучшее для науки является лучшим для рынка. После серии закрытых тестов и показов в мае-июне стало ясно, что приложение не готово. Это была красивая идея, и я надеюсь, что когда-то будет возможность к ней вернуться.

Были и другие эксперименты в совершенно новых направлениях, но их время ещё не пришло. Выпущенные продукты продолжат функционировать как и прежде. На этом всё; спасибо, что проявляли интерес к нашим трудам.
This media is not supported in your browser
VIEW IN TELEGRAM
Ассаламу алейкум, добрый вечер. Нет, Raxys не возвращается. Но я хочу кое-чем поделиться.

В конце мая команда Meta AI* выпустила новые модели работы с речью. Этот большой прорыв для нас важен ещё и потому, что среди 1100+ поддерживаемых языков есть и несколько северокавказских. Кажется, за прошедший месяц мы так не увидели каких-либо применений этих технологий для нашего региона.

После небольшой работы эта технология доступна в нашем конвертере Yaziv для синтеза речи на аварском, даргинском, кумыкском, осетинском, карачаево-балкарском, ногайском, чеченском, агульском и цахурском языках. На видео демонстрация прочтения стихов Р. Гамзатова и К. Хетагурова нейросетью. Да, где-то интонации не те и съедаются буквы, но и то что есть — впечатляет.

Конечно, этим минимумом мы никак не должны довольствоваться, и нам совсем нельзя отставать в этой гонке AI. Но я надеюсь, что этот небольшой эксперимент хоть немного зажжёт искру.

* - признана экстремистской в РФ