На прошлой неделе на сайт был добавлен алфавит Керенского диалекта Агульского языка (баракала, Абдурахӏим). Примечательно то, что данные были добавлены человеком со стороны, к тому же не владеющим какими-либо специальными навыками разработчика.
Это стало возможным благодаря нашим новым веб-интерфейсам редактирования. Редакторы доступны и для раздела фонетики, и для конвертера. Желающие добавить свой язык, или внести правки в уже присутствующий в системе, могут пройти в соответствующий раздел и самостоятельно сформировать JSON-файл, который затем можно отправить нам для загрузки на основной сайт.
Это стало возможным благодаря нашим новым веб-интерфейсам редактирования. Редакторы доступны и для раздела фонетики, и для конвертера. Желающие добавить свой язык, или внести правки в уже присутствующий в системе, могут пройти в соответствующий раздел и самостоятельно сформировать JSON-файл, который затем можно отправить нам для загрузки на основной сайт.
Попытался объяснить как мог. Много говорю про внутреннюю структуру системы. Кому интересна именно демонстрация интерфейса, могут прыгать сразу на 14:16.
А ещё, оказывается, ветки в твиттере крайне удобны для публикации презентаций в форме 1 твит - 1 слайд. К сожалению, не подумал, как это перенести в формат здешних публикаций, поэтому на этот раз просто дам ссылку на текст.
Итого, система работает, всё получилось. На сайте уже есть 4 фразы, каждая доступна для связанного просмотра на кабардинском, акушинском, и кайтагском. Сейчас будет небольшой перерыв, затем работа над веб-редактором для разговорника. Это будет завершено в ноябре. И вот когда уже будет готов редактор, начнётся добавление самих фраз.
Хотелось бы, для начала, перевести фраз 20 на иронский, дигорский, и кабардинский. Наличие двух близких диалектов, и одного языка из другой семьи, будет хорошей проверкой для системы. К тому же, черкесы Кабарды и осетины - соседи, и им это может быть полезно.
А ещё, оказывается, ветки в твиттере крайне удобны для публикации презентаций в форме 1 твит - 1 слайд. К сожалению, не подумал, как это перенести в формат здешних публикаций, поэтому на этот раз просто дам ссылку на текст.
Итого, система работает, всё получилось. На сайте уже есть 4 фразы, каждая доступна для связанного просмотра на кабардинском, акушинском, и кайтагском. Сейчас будет небольшой перерыв, затем работа над веб-редактором для разговорника. Это будет завершено в ноябре. И вот когда уже будет готов редактор, начнётся добавление самих фраз.
Хотелось бы, для начала, перевести фраз 20 на иронский, дигорский, и кабардинский. Наличие двух близких диалектов, и одного языка из другой семьи, будет хорошей проверкой для системы. К тому же, черкесы Кабарды и осетины - соседи, и им это может быть полезно.
Последние функции поверх готового ядра разговорника:
- отключение показа английского перевода;
- локализация отображаемого контекста;
- показ пояснительных заметок;
- параллельный просмотр морфемного глоссирования через IPA и Leipzig Glossing Rules.
Разумеется, дабы не перегружать тех, кому это не нужно, вся эта информация скрываема. На картинках показана одна и та же фраза, сначала с минимальным отображением информации, а затем - с максимальным.
- отключение показа английского перевода;
- локализация отображаемого контекста;
- показ пояснительных заметок;
- параллельный просмотр морфемного глоссирования через IPA и Leipzig Glossing Rules.
Разумеется, дабы не перегружать тех, кому это не нужно, вся эта информация скрываема. На картинках показана одна и та же фраза, сначала с минимальным отображением информации, а затем - с максимальным.
В последней версии разговорника был значительный недостаток: если грамматика языка пользователя кодирует меньшее количество информации, чем другой синхронизируемый язык, то пользователь всё ещё должен был подсматривать в английскую карточку для понимая контекста.
Например, при переключении кайтагского глагола "иду" с мужского рода (вянда) на женский (рянда), кабардинский перевод должен оставаться неизменным (сокӏуэ). Это совершенно верно, но это не даст кабардинцу понять что именно изменилось во фразе до тех пор, пока он не посмотрим на английскую карточку с полным контекстом фразы (изобр. 1).
Чтобы создать по-настоящему прямой разговорник без посредников, к каждой фразе теперь можно добавлять перевод контекста (изобр. 2). По сути своей это маленький независимый словарь, позволяющий показывать перевод английского мета-контекста на локальном языке.
На этом месте возникает новая проблема: большая часть информации в локализованном контексте уже известна носителю из грамматики. Например, в кабардинском переводе видно, как слово "абы" (там) показано дважды (изобр. 3), что совсем не нужно и даже делает поиск новой информации менее удобным.
Для решения этой проблемы система теперь создаёт копию мета-контекста и проходит по каждому видимому блоку перевода, вычитая его условия из этой копии (изобр. 4). По итогу в копии остаётся лишь неявная информация, не переданная видимыми блоками. Перевод лишь этой остаточной информации отображается на экране.
Так что теперь кабардинец может видеть изменения грамматического класса в кайтагском без необходимости прибегать к английскому переводу (изобр. 5, 6). Как и все другие функции на сайте, это работает для любого сочетания языков.
Например, при переключении кайтагского глагола "иду" с мужского рода (вянда) на женский (рянда), кабардинский перевод должен оставаться неизменным (сокӏуэ). Это совершенно верно, но это не даст кабардинцу понять что именно изменилось во фразе до тех пор, пока он не посмотрим на английскую карточку с полным контекстом фразы (изобр. 1).
Чтобы создать по-настоящему прямой разговорник без посредников, к каждой фразе теперь можно добавлять перевод контекста (изобр. 2). По сути своей это маленький независимый словарь, позволяющий показывать перевод английского мета-контекста на локальном языке.
На этом месте возникает новая проблема: большая часть информации в локализованном контексте уже известна носителю из грамматики. Например, в кабардинском переводе видно, как слово "абы" (там) показано дважды (изобр. 3), что совсем не нужно и даже делает поиск новой информации менее удобным.
Для решения этой проблемы система теперь создаёт копию мета-контекста и проходит по каждому видимому блоку перевода, вычитая его условия из этой копии (изобр. 4). По итогу в копии остаётся лишь неявная информация, не переданная видимыми блоками. Перевод лишь этой остаточной информации отображается на экране.
Так что теперь кабардинец может видеть изменения грамматического класса в кайтагском без необходимости прибегать к английскому переводу (изобр. 5, 6). Как и все другие функции на сайте, это работает для любого сочетания языков.
Работа над функциональной частью редакторов разговорника завершена. Получились две страницы. Первая - редактор исходного корпуса. Здесь формируется структура разговорника и задаются контексты для исходных фраз. Вторая страница - редактор пользовательской части разговорника, переводчик. Здесь создаётся представление перевода фраз из исходного корпуса на все другие языки.
Теперь предстоит небыстрый процесс сборки вот этого исходного корпуса фраз, который затем должен быть переведён на наши языки. Очень хочется предоставить материал, который будет полезен обычным людям в реальных сценариях, и который будет извлекать максимальную пользу из технической базы интерактивности.
Пока непонятно, как именно собрать такой языковой материал. Будем думать.
Теперь предстоит небыстрый процесс сборки вот этого исходного корпуса фраз, который затем должен быть переведён на наши языки. Очень хочется предоставить материал, который будет полезен обычным людям в реальных сценариях, и который будет извлекать максимальную пользу из технической базы интерактивности.
Пока непонятно, как именно собрать такой языковой материал. Будем думать.
Да, это Черкесо-Осетино-Даргинский параллельный разговорник. Позволяет миновать английский или русский и играться с языками напрямую. Конечно, вряд ли кто-то будет одновременно просматривать вот такой набор языков, но как испытание для системы - картина впечатляющая. И хотя пока полностью переведена лишь одна фраза, можно уверенно говорить о корректной работе системы. И учитывая, что масштабирование здесь линейное, проблем не предвидится.
А ещё записал видео работы с редактором разговорника, где я добавляю дигорский перевод для этой фразы. Увы, там я неправильно перевёл дигорское местоимение (уже исправил на сайте), и произносил слова как попало, за что прошу осетин простить меня, но в качестве демонстрации процесса это сгодится.
А ещё записал видео работы с редактором разговорника, где я добавляю дигорский перевод для этой фразы. Увы, там я неправильно перевёл дигорское местоимение (уже исправил на сайте), и произносил слова как попало, за что прошу осетин простить меня, но в качестве демонстрации процесса это сгодится.
Потихоньку и другие языки начнут вливаться, если сайт окажется полезным для них.
Сагърай агъулар.
Сагърай агъулар.
Forwarded from ruxavus | агульский язык
Media is too big
VIEW IN TELEGRAM
Ас саламу алейкум.
На сайте https://avzag.app/#/ можно понаблюдать за изменением грамматики предложения в керенском диалекте агульского языка в сравнении с другими языками Кавказа. Сайт находится на стадии разработки и на данный момент внесена информация лишь по одной фразе, но к началу марта инша Аллагь начнется внесение информации по 100 базовым фразам.
На сайте https://avzag.app/#/ можно понаблюдать за изменением грамматики предложения в керенском диалекте агульского языка в сравнении с другими языками Кавказа. Сайт находится на стадии разработки и на данный момент внесена информация лишь по одной фразе, но к началу марта инша Аллагь начнется внесение информации по 100 базовым фразам.