Forwarded from adiga.ai
Завершена работа над первой версией датасета русско-черкесских параллельных текстов. Датасет состоит из около 330 тысяч пар переводов: 220 тысяч на восточном (кабардинском) диалекте и 110 тысяч на западном. Тексты собирались в течение нескольких лет из различных словарей, книг, статей, а также с помощью волонтеров на zedzek.com. Спасибо всем кто принимает участие в сборе данных.
Датасет опубликован в открытом доступе на Hugging Face: https://huggingface.co/datasets/adiga-ai/circassian-parallel-corpus
Любой желающий может использовать его для обучения моделей, в академических и любых других целях.
Главной целью проекта adiga.ai является расширение присутствия черкесского языка в интернете. Поэтому датасет также был передан представителям компаний Яндекс, Гугл и Мета, которые планируют использовать его для обучения своих мультиязычных моделей. Если все пойдет хорошо, то в течение ближайшего года можно рассчитывать на появление черкесского языка в Яндекс Переводчике, Google Переводчике и его поддержку в продуктах компании Meta (facebook, instagram), а также в открытых языковых моделях этих компаний.
* * *
The first version of the Russian-Circassian parallel text dataset has been completed. The dataset consists of ~330,000 translation pairs: 220,000 in the Eastern (Kabardian) dialect and 110,000 in the Western dialect. These texts were compiled over several years from various dictionaries, books, and articles, as well as through contributions from volunteers at zedzek.com. Thanks a lot to everyone who contributed to collecting the data.
The dataset has been made publicly available on Hugging Face:
https://huggingface.co/datasets/adiga-ai/circassian-parallel-corpus
Anyone interested is free to use it for model training, academic research, or any other purposes.
The primary goal of the adiga.ai project is to increase the presence of the Circassian language online. To support this goal, the dataset has also been shared with representatives from Yandex, Google, and Meta, who plan to use it as part of their ongoing projects to train multilingual models. If everything goes well, we can expect Circassian to become available in Yandex Translate, Google Translate, and supported across Meta products (Facebook, Instagram), as well as integrated into open-source language models from these companies within the coming year.
Датасет опубликован в открытом доступе на Hugging Face: https://huggingface.co/datasets/adiga-ai/circassian-parallel-corpus
Любой желающий может использовать его для обучения моделей, в академических и любых других целях.
Главной целью проекта adiga.ai является расширение присутствия черкесского языка в интернете. Поэтому датасет также был передан представителям компаний Яндекс, Гугл и Мета, которые планируют использовать его для обучения своих мультиязычных моделей. Если все пойдет хорошо, то в течение ближайшего года можно рассчитывать на появление черкесского языка в Яндекс Переводчике, Google Переводчике и его поддержку в продуктах компании Meta (facebook, instagram), а также в открытых языковых моделях этих компаний.
* * *
The first version of the Russian-Circassian parallel text dataset has been completed. The dataset consists of ~330,000 translation pairs: 220,000 in the Eastern (Kabardian) dialect and 110,000 in the Western dialect. These texts were compiled over several years from various dictionaries, books, and articles, as well as through contributions from volunteers at zedzek.com. Thanks a lot to everyone who contributed to collecting the data.
The dataset has been made publicly available on Hugging Face:
https://huggingface.co/datasets/adiga-ai/circassian-parallel-corpus
Anyone interested is free to use it for model training, academic research, or any other purposes.
The primary goal of the adiga.ai project is to increase the presence of the Circassian language online. To support this goal, the dataset has also been shared with representatives from Yandex, Google, and Meta, who plan to use it as part of their ongoing projects to train multilingual models. If everything goes well, we can expect Circassian to become available in Yandex Translate, Google Translate, and supported across Meta products (Facebook, Instagram), as well as integrated into open-source language models from these companies within the coming year.
❤6
Forwarded from Tʷaxəbza
This media is not supported in your browser
VIEW IN TELEGRAM
Убыхская песня
Поет Зейшуа Рахми (сын Зейшуа Тефвика)
P.S.
Поправка:
Источник
Поет Зейшуа Рахми (сын Зейшуа Тефвика)
P.S.
К сожалению, перевести всю песню не удалось, потому что Рахми не мог полноценно выговаривать большинство букв. Иногда было трудно понять, какое слово говорил Эсенч.
Пример: apxʲеdәkʷ asfaq(‘?)o:t (я заплачу девушку(?), я ел девушку(?), я зарежу девушку(?) и еще много забавных вариантов).
Можно заметить, что губная tʷ у Рахми не выговаривается, вместо этого используется pʰ.
Šʷ/ sʷ меняется на š, xʲ употребляется как обычная х и т.д.
Поправка:
sʷšandӡa - Стамбул
Источник
⚡3❤2
Forwarded from 2MOOD
Media is too big
VIEW IN TELEGRAM
«Не бояться. Пробовать. Стараться. Даже если мечта кажется недосягаемой», Алина Пекова, альпинистка и первая представительница России, взошедшая на все 14 восьмитысячников.
Расширяя границы направления 2MOOD Club, мы создали коллекцию, в которой уже привычные винтажные силуэты соседствуют с технологичными материалами и аутдор-эстетикой. Прежде всего, это эксперимент: над совместимостью несовместимого, над собственной смелостью и решимостью, над готовностью меняться, не теряя себя. Это история о внутренней свободе, силе духа и способности следовать своей мечте — кто бы что ни говорил.
Идеальной героиней для съемки капсулы 2MOOD Club: Outdoor стала Алина Пекова — не только первая женщина, но и первый человек в России, который совершил восхождение на все 14 восьмитысячников планеты. Ее история легла в основу нашего документального ролика, который был снят в Терсколе — селе в Эльбрусском районе Кабардино-Балкарии. Для команды 2MOOD величественные горы, живописные озера и альпийские луга Приэльбрусья стали настоящим открытием, в то время как для Алины — это родные места.
В разговоре с нами Алина осветила чувственную часть занятий альпинизмом, рассказав, как ощущается подъем на первую вершину и как горы меняют отношение к жизни, учат не бояться и смело идти за своей мечтой.
Расширяя границы направления 2MOOD Club, мы создали коллекцию, в которой уже привычные винтажные силуэты соседствуют с технологичными материалами и аутдор-эстетикой. Прежде всего, это эксперимент: над совместимостью несовместимого, над собственной смелостью и решимостью, над готовностью меняться, не теряя себя. Это история о внутренней свободе, силе духа и способности следовать своей мечте — кто бы что ни говорил.
Идеальной героиней для съемки капсулы 2MOOD Club: Outdoor стала Алина Пекова — не только первая женщина, но и первый человек в России, который совершил восхождение на все 14 восьмитысячников планеты. Ее история легла в основу нашего документального ролика, который был снят в Терсколе — селе в Эльбрусском районе Кабардино-Балкарии. Для команды 2MOOD величественные горы, живописные озера и альпийские луга Приэльбрусья стали настоящим открытием, в то время как для Алины — это родные места.
В разговоре с нами Алина осветила чувственную часть занятий альпинизмом, рассказав, как ощущается подъем на первую вершину и как горы меняют отношение к жизни, учат не бояться и смело идти за своей мечтой.
❤4🔥1
Forwarded from цвет граната (Kariné)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Forwarded from TEST DRIVE (диана диановна)
This media is not supported in your browser
VIEW IN TELEGRAM
"The richness of a fusion between two cultures, when Caucasian culture meets Japanese minimalism"
lizenov on tt
lizenov on tt
❤6
Forwarded from Хэкум иплъыжь мафэхэр
Девушка-черкешенка в старинном платье с прицепными длинными рукавами.
Экспедиция Е.М. Шиллинга.
Кабарда, 1925 года.
❤10
Forwarded from CHAPSH
ФIэхъус!
Вашему вниманию - долгожданный выпуск нашего первого альбома «Щlапщэ». Доступно на всех цифровых платформах. Приятного прослушивания, друзья!
____________________________
Адыгэм ди узыгъуэр укlуэди, мыкlуэдыжын Тхьэм дищl!
Название: Chapsh - ЩIапщэ
Вашему вниманию - долгожданный выпуск нашего первого альбома «Щlапщэ». Доступно на всех цифровых платформах. Приятного прослушивания, друзья!
____________________________
Адыгэм ди узыгъуэр укlуэди, мыкlуэдыжын Тхьэм дищl!
Название: Chapsh - ЩIапщэ
❤3⚡2