Devs.kz
8.45K subscribers
2.63K photos
170 videos
129 files
3.21K links
IT карьера в Казахстане и мире. Воркшопы и митапы Google и др. компаний. Наш офиц. портал devs.kz

Обратная связь @AskarAi Аскар Айтуов

Реклама: https://t.me/devs_kz/5211

Youtube @devs_kz

Курс AI Product engineer: https://t.me/+CG8Tpmy0RtxkZjZi
Download Telegram
как наш тувинский ИИ-переводчик помогает сохранить другие уязвимые низкоресурсные языки

〰️постила эту историю в апреле, но она должна была появиться здесь〰️

низкоресурсный язык — это термин из лингвистики — язык, у которого немного оцифрованного корпуса

весь сыр-бор начался, когда я распечатала мотивашки на тувинском, повесила на магнитную доску и забыла про него. Илья увидел его и сразу им заинтересовался. но перевести без моей помощи он его не смог: даже онлайн-словари ему не помогли.

и меня осенило: как это до сих пор нет тувинско-русского переводчика?

вообще во всем мире множество языков под угрозой исчезновения. в РФ это в основном финно-угорские и сибирские языки. тувинский где-то во второй половине по шкале угрозы исчезновения.

тогда я себе обещала: переводчик обязательно появится.

через пару недель после этого открытия я собрала команду из двух идеальных партнеров для создания ИИ-переводчика, по совместительству близких друзей:

Давида, который в последние пару лет помог собрать прототип эрзянского переводчика после поездки в Мордовию и осознания той же проблемы с эрзянским (дела у эрзянского хуже, чем у тувинского). Он также всю сознательную карьеру занимается языковыми разработками и обучением языковых моделей, а также работой над их свойствами.

Али (я не пишу про Чойгана Ондара и десятков переводчиков, которые собрали параллельный корпус русско-тувинских пар в 200 тыс слов), создал словарь, клавиатуру, перевел Википедию и Вконтакте на тувинский — за последние 10 лет.

многое сошлось: разработки крупных компаний в области сохранения языков, которые мы использовали как опенсорс, опыт Давида за рубежом, корпус, который ждал своего часа, и предобученная модель, которая уже ранее изучила разные тюркские языки и др.

раскачивались мы почти год. мы стартовали 3 октября 2022 года (кстати, до появления ChatGPT), а первую модель Давид обучил 2 октября 2023 года. первая стабильная модель — это первый шаг.

мы привязали модель к сайту, и каждый может сносно переводить предложения. далеко не всегда точно, но это первый шаг. за год переводчиком воспользовались более 80 тыс человек, мы видим активность каждый день.

и главное, что получилось сделать: мы поделились наработками с другими энтузиастами, и теперь модель обучается по подобию для десятков других языков в волонтерском проекте “Код один — языки разные”, включая для башкирского, татарского, чувашского, марийского и тд.

чем можно нам помочь? если вы готовы донатить, помогать с сохранением языков, пишите, помогу соединить с языковыми энтузиастами 💛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14👍1
Российский CodeTalks — теперь CodeFest. Call for speakers!

Вкратце что будет:
- Дата проведения: 16 ноября 2024. Офлайн. Алматы.
- 800 участников
- Регистрация откроется в сентябре.
- Партнёрский движ от крупных ИТ-компаний. Афтепати для всех, сразу после конференции.
- Ключевые направления программы: Backend, Frontend, Management, QA, Data Science, Mobile, Analysis, а также DevOps. И, конечно, Квартирники — наш традиционный формат народных дискуссий. А еще будем рады послушать про что-нибудь научно-популярное.
- Call for Papers открыт и ждет ваши заявки. Они принимаются до 10 сентября здесь: https://codetalks.kz/#CFP

Подавайте заявки и выступайте, а опытный программный комитет поможет довести выступление до идеала. @devs_kz
3🔥3👍2
Автор утверждает написал о логистической регрессии на понятном языке. @devs_kz
15👍5🤯5😁4❤‍🔥1
🤣70😁7
Анонсируем первых крутых спикеров алматинского митапа 11 июля. Евгений Адамов и Евгений Степченко, Senior Delivery Менеджера T-Bank. Регистрация и детали здесь Также будет онлайн трансляция. Но митап оффлайн. @devs_kz
🔥12
#vacancy #tiktok #swe actively hiring software engineers:

Pay: 190,000 - 280,000 USD
Level: New grad/Mid-level
Location: Seattle/Bay Area
Tech stack: Go, Python, TypeScript

-Direct referrals offered
-AI/ML roles available
-Free breakfast/lunch/dinner
-On-site gym
-RTs appreciated https://careers.tiktok.com/s/ijKmNjxh
🔥9👍1
Advances in Human-AI interaction is a topic of Alina Gutoreva @a_gutoreva, Warwick University PhD, and a Professor at Kazakh-British Technical University. See you at Google I/O Extended 2024 - Almaty. Register here / Online streaming is available as well. #IOExtended #GDG #GDGCloudAlmaty
🔥131
А знаете что такое говнокод на самом деле?
- это код который только делает вид что реализует требования
- это реализация одного и того же требования дважды в разных местах

Есть только одна причина это нарушать:
- соблюдения уровни производительность согласно требованиям

. Автор Сергей Андреев. @devs_kz
4🤷‍♂1
Перед Астана Хабом собрались фанаты Дурова 🌚. Прислал аноним. @devs_kz
🥰19🎉5👍3👎2😁211
Организаторы GDG c Центральной Азии вчера посетили Google I/O Connect в городе Берлин. На фото не все. На фото слева направо Meerim Januzakova (GDG Бишкек), Асель Романова (GDG Almaty), Елизат Абакирова и Бегимай Амантаева (WTM Bishkek). Также на конфе были Дара Туменбаева (doro-ai.com, GDG Almaty), Maral Khudaybergenova (GDG Ashgabat) @devs_kz
13
[Алматы] Гемификация бизнес процессов. Александр Мезин. Старший научный сотрудник GameLab KBTU. Автор книги "Как превратить удаленную работу в преимущество". Видео трансляция тут. @devs_kz
🔥7👍1🦄1
[I/O Extended Almaty] Модертор от GDG Cloud Almaty - Amina Imanbay, Продакт менеджер. Регистрация тут. @devs_kz
🔥8
#vacancy #iOSAndroid #Senior developer for the US startup. Starting remotely part-time, and if all goes well, then the relocation to the US with full-time job is possible.

Please send your CVs to qazybekbeken@gmail.com @devs_kz
🔥1
😁232
[I/O Extended Almaty] Новые компетенции и процессы. Co-Founder Hello IT Safari и Vice-СТО Kanda CA Oman Abishev про управление процессами и продуктами. Регистрация тут. @devs_kz
4
😁35👍1🤡1
Адаптивная ИТ архитектура. Денис Перов, ИТ архитектор и предприниматель расскажет детали на Google I/O Extended 2024 - Almaty. Регистрация тут. https://gdg.community.dev/events/details/google-gdg-cloud-almaty-presents-google-io-extended-2024-almaty/ @devs_kz
🔥4
#opensource #NLP #LLM #Academic Для тех кто увлекается научными исследованиями в NLP Google запустил программу с бесплатным доступом к Google cloud чтобы тренировать модели на ультра новой Gemma 2. Ссылка на форму https://ai.google.dev/gemma#research @devs_kz
🔥123👍2