Cramer blog
186 subscribers
46 photos
1 video
30 links
Пишем о данных: ресуры, инструменты. Data science, AI, визуализация данных и все, что делает нашу жизнь эффективнее

~~~~~~~
Вопросы: @timur_turat
Download Telegram
Ух! На сегодняшней презентации Microsoft Build (тоже своего рода презентация про все новинки, инновации и тд) сделали большой акцент на плагинах. Теперь все плагины будут работать и с поисковиком Bing. Теперь точно будет большой пост про плагины😎
Хорошие новости для Кыргызстана!
Открывается AI Research Institute🤖💻💣

Институт обещает стать центром, где будут проводиться исследования и мероприятия для развития и распространения работы с ИИ.

Первыми важными проектами AI Research Institute будут:
* Создание первого корпуса кыргызского языка;
* Исследование и создание датасетов по кыргызскому языку;
* Продолжение проекта Akyl AI - голосового ассистента на кыргызском языке.

Миссия института стать ведущим центром AI-исследований и инноваций в Центральной Азии, способствуя развитию страны и повышению ее конкурентоспособности в глобальном масштабе.

О первых шагах: "Мы верим, что создание корпуса кыргызского языка, исследование и разработка датасетов по кыргызскому языку, а также продолжение проекта Akyl AI принесут значительный вклад в нашу страну и глобальное научное сообщество. Эти проекты помогут укрепить кыргызскую языковую и культурную идентичность, способствуя развитию интеллектуальных ресурсов и повышению научного потенциала."

AI Research Institute будет сотрудничать с академическими и научными учреждениями и правительственными организациями для обмена знаниями, опытом и внедрения передовых технологий в области искусственного интеллекта.

Приглашаем всех присоединиться к AI Research Institute и вместе с нами содействовать развитию AI в Кыргызстане.

AI Research Institute будет представлять отчеты о своих исследованиях и прогрессе внедрения искусственного интеллекта. Следите за нашими новостями!🫶
🔥Приглашаем всех на наш третий DATATHON и первый под эгидой Kyrgyz AI Research Institute (KAIRI) в рамках проекта AkylAI.
😎На этот раз мы будем учить искусственный интеллект понимать кыргызский язык.

📌В чем задача?
Создать модель, которая будет извлекать (выделять) именованные сущности (NER) из текста на кыргызском языке.
Это первый датасет по NER для кыргызского языка. Возможно станет золотым 🙏

Датасет мы собирали абсолютно с нуля с помощью студентов КГТУ и волонтеров. Где-то 100 человек нам помогали лейблить и готовить датасет. Мы имена всех участников выложим на нашем github. Всем участникам огромный респект 🫶

Задача извлечения именованных сущностей (Named Entity Recognition, NER) состоит в выделении в тексте именованных сущностей (которыми являются отдельные слова и последовательности слов) и их классификации по предопределенным категориям, например, личности (PERSON), организации (ORGANIZATION), географические объекты (LOCATION) и другие.

Например, дан текст на русском языке «Чынгыз Айтматов родился в селе Шекер в 1928 году». Здесь
- Чынгыз Айтматов — PERSON
- Шекер — LOCATION
- 1928 год — PERIOD



📅Даты проведения: 28-29 июля
🏢Compass College

🤗Хочешь участвовать?
https://forms.gle/KQCwEwkPGHTbGXtN9
👋🎉 Привет, друзья! Завершён наш двухдневный Datathon III по кыргызскому языку! 📚🌐

🚩Стояла задача создать модель, которая будет извлекать (выделять) именованные сущности из текста на кыргызском языке.
Задача извлечения именованных сущностей (Named Entity Recognition, NER) состоит в выделении в тексте именованных сущностей (которыми являются отдельные слова и последовательности слов) и их классификации по предопределенным категориям, например, личности (PERSON), организации (ORGANIZATION), географические объекты (LOCATION) и другие.

Было загружено 46 сабмишнов! 📈👏 Все результаты оценивались автоматически с помощью метрики F1 score. 📊🏅

Победители дататона:
🥇 "Adis Davletov" - 66.5% F1.
🥈 "Ya Mashina" - 65.2% F1.
🥉 "Team 121" - 62.9% F1.

Над датасетом работали команда из опытных AI-исследователей и 100 волонтеров, которые помогали с разметкой в течение 3-х месяцев. Все детали можно найти по ссылке.

Но это не все!

На хакатоне презентовали первый корпус кыргызского языка со 100 млн слов - tilcorpusu.org.

Спасибо всем участникам за активное участие и вклад в развитие ИИ! 🙏💡

🔥Особая благодарность нашим партнёрам: Compass College - за все предоставленные условия для проведения дататона и Парк Высоких Технологий @htp__kg - наш незаменимый партнёр, поддерживающий нас с самого начала! 🤝🏢

Спасибо вам за поддержку в развитии ИИ в Кыргызстане! 💖🌐
Ну и пара фоточек
Есть идея записать серию подкастов на тему AI

1️⃣ Первый подскаст посвящен Computer Vision. Будет крутой спикер 🔥
📅 О дате и времени сообщим позже.

Ну а пока мы собираем вопросы, которые мы зададим спикеру:
https://tally.so/r/mY0Wkv
😎 Салам, менин атым Акылай!


👋 Знакомимся с бета версией AkylAI.

https://akylai.thecramer.com/


AkylaI - аналог ChatGPT на кыргызском языке, который может вести полноценный диалог на кыргызском языке.


Прдлагаю вам пообщаться с AkylAI. Не забываем ставить звездочки в зависимости от ответа.

Это, конечно, неполнеценный ассистент и нужно дообучать, поэтому пока

- не запоминает контекст

- отвечает только на последние вопросы или сообщения. То есть не надо разбивать вопрос на подвопросы.
🎙️Друзья, привет!

🔥 Мы сняли наш ПЕРВЫЙ подкаст на тему об AI.

Тема подкаста - Computer Vision

🎤 Спикеры:
1️⃣ Адиль Аденов - Senior Machine Learnign Engineer в области компьютерного зрения в 360.tech

2️⃣ Антон Мальцев - Senior Machine Learning Engineer, больше 15 лет опыта в Computer Vision. Он также head of ML в Cherry labs и CTO в Rembrain.ai


🗣️Обсудили много вопросов от технологий и инноваций до проблем и перспектив в мире AI


Ссылка на подкаст:
https://youtu.be/8VZeTTmxlgM?si=Wd1u-GkAMh8hDs9l