IOAI Russia
387 subscribers
9 photos
4 videos
1 file
15 links
Download Telegram
Channel created
Channel photo updated
Всем привет! В этом канале мы будем рассказывать про отбор и подготовку к межнару по AI (https://ioai-official.org) в России. В 2024 и 2025 наши сборные успешно выступили на этой олимпиаде и мы решили, что пришло время для более централизованного источника информации по олимпиаде, чем личные каналы тренеров сборной:) Для историчности и для тех, кому интересно узнать про это больше, я репостну ключевые сообщения с прошедших межнаров.
❤‍🔥2
IOAI Russia pinned «Всем привет! В этом канале мы будем рассказывать про отбор и подготовку к межнару по AI (https://ioai-official.org) в России. В 2024 и 2025 наши сборные успешно выступили на этой олимпиаде и мы решили, что пришло время для более централизованного источника…»
Forwarded from Жизнь и датка (Alexander Guschin)
Наши ребята победили на IOAI - заняв первое место по ML и CV задачам и второе по NLP задаче. В общем зачете мы получили 99 баллов из 100, при этом у следующей команды уже 75 баллов. Мы все немного в шоке, и команда, и тренеры 🙂

В этом году в финале участвовало 42 команды. От России поехала только наша, но от некоторых стран (США, Китай, Япония) было по несколько команд. Был большой разброс в степени подготовки: некоторые команды собирались буквально за месяц до финала, а некоторые начинали готовиться с начала весны. Изначальный уровень команд тоже был разный: в некоторых странах проходил полноценный отборочный этап, а в некоторых команды собирались без него из участников IOI. Получилось так, что знания ML сильно отличались по командам (а одна даже была составлена из олимпиадников-лингвистов).

Задачи были около-kaggle формата (нужно получить лучший скор), но были наложены существенные ограничения по времени исполнения/моделям/подходам которые можно использовать, поэтому получилось уменьшить роль брутфорса и состязания "у кого больше видеокарт" и сделать больше акцента на знаниях и находчивости участников. В ML задаче нужно было создать лучшие фичи для небольшого DecisionTree. В NLP задаче нужно было зафайнтюнить mBERT для нового языка (при этом тексты на языке были зашифрованы). В CV задаче нужно было заставить miniSD всегда дорисовывать гидрант, если на картинке есть корова. В общем, прикольно и необычно 🙂

Финальный этап длился 8 часов, и на нем команде из 4 человек требовалось решить 3 задачи. Можно было использовать два ноутбука. Для ML это сложно, много времени уходит на то, чтобы войти в контекст задачи и подготовить бейзлайн решение. Тут мне понравилось, что целый месяц до финала проходил предварительный этап решения задач, где участникам выдали похожую задачу. Например, в CV задаче на дом нужно было заставить miniSD рисовать зебру на промт "жираф" и наоборот.

Конечно победа участников это также и победа тренеров (во всяком случае нам хочется так думать 🙂 - Александра Дьяконова @smalldatascience, Тани Гайнцевой @dl_stories, Димы Ульянова, команды ЦУ, ну и меня конечно 🙂

Трансляция награждения должна быть в 16 часов по Мск, ждем! https://www.youtube.com/live/UbU6BOzICqo
Forwarded from Жизнь и датка (Alexander Guschin)
Первое место и золотая медаль по scientific раунду
Forwarded from Жизнь и датка (Alexander Guschin)
И special award за первое место по сумме scientific раунда и practical раунда (раунда по generative art)
Теперь 2025 год:
Forwarded from Жизнь и датка (Alexander Guschin)
На межнаре
1
Forwarded from Жизнь и датка (Alexander Guschin)
This media is not supported in your browser
VIEW IN TELEGRAM
Forwarded from Жизнь и датка (Alexander Guschin)
Тим челенж закончился, ребята обошли 80 команд со всего мира и ВТОРЫЕ на ЛБ 🥹

Be aware, что Лб на фото не до конца актуальный - на третьем месте на самом деле вторая команда Польши, но больше изменений вроде нет. Опубликую ссылку, когда будут финальные результаты, но уже можно праздновать победу и второе место в мире в team challenge IOAI этого года.

Илья Осокин и Сережа Арефьев готовили ребят к Тим челенжу - это и их победа тоже 🤓

Теперь ждём результатов индивидуального раунда - кто взял какие медали мы узнаем уже на днях.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Жизнь и датка (Alexander Guschin)
Вот, кстати, общая таблица. Спасибо тебе, неизвестный мастер экселя 🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Жизнь и датка (Alexander Guschin)
Топ-10 по среднему баллу участников в команде
Forwarded from Жизнь и датка (Alexander Guschin)
Пыль немного улеглась, и кажется, школьники, главный тренер и ЦУ получили достаточно внимания. Я бы хотел в меру своих сил восстановить справедливость и сказать спасибо всем, кто участвовал в подготовке сборной. Когда меня просили написать заметку для пресс-релиза, я постарался никого не забыть, но длинные списки не нравятся новостным агенствам и поэтому в большинстве новостей его нет.

Во-первых, спасибо нашим замечательным тренерам.

Серёже Арефьеву, который буквально жил с ребятами три недели на кампусе в Москве и занимался с ними почти каждый день. По своему импакту на результаты Серёжу стоило бы называть главным тренером) Сережа преподаватель факультатива Competitive ML в Центральном университете, топ-11 в общем рейтинге Kaggle Competitions Grandmaster (2022), победитель ML-контестов на различных площадках: Kaggle, Sberbank Data Science Journey, VK CUP, IDAO, «Цифровой прорыв», ЛЦТ, Zindi, Topcoder. (я буду копировать этот долгий подробный список, чтобы вы узнали про ребят побольше. Он немного топорный, но это просто невозможно вычитать и причесать, поэтому вам придется с этим мириться:)

Тане Гайнцевой @dl_stories, которая отвечала за подготовку к CV и даже (!) угадала одну из задач с межнара - ее задача с отбора на NEOAI (https://www.kaggle.com/competitions/neoai-2025-cuties-segmentation) была очень похожа на последнюю задачу с межнара. Таня руководитель Deep Learning School и AI Researcher в лондонском Huawei, получает докторскую степень в Университете Королевы Марии в Лондоне, преподаватель ML-курсов в МГУ, МФТИ, ШАД.

Ильсеяр Алимовой, которая готовила ребят к задачам по NLP. В этом году на межнаре была только одна задача на NLP, ждем больше в следующем году) Ильсеяр NLP Researcher в Сколтехе, действующий преподаватель курса NLP в Центральном университете и КФУ, кандидат технических наук, бывший сотрудник R&D-центра Т-Банка, Wildberries и Huawei.

Они участвовали и в курсе подготовки с января по апрель, готовили задачи на NEOAI, и потом тренировали сборную, то есть буквально участвовали во всей подготовке этого года. Кажется, каждый вложил очень много сил и надеюсь теперь может немного почилить)

А еще специальное спасибо МЭРИ ХУСАИНОВОЙ. Без нее мы бы не организовали ни курса подготовки, ни отбора, не прилетели бы в Китай, а если бы прилетели, то обязательно бы где-нибудь потерялись) Мэри просто организовала тут почти всё 🙏
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Forwarded from Жизнь и датка (Alexander Guschin)
Во-вторых, всем, кто разбирал отдельные темы, вел пары или помогал ребятам:

Илье Осокину, который учил ребят решать Team Challenge, показывал свою лабу на физтехе и объяснял за кватернионы) Илья - ведущий инженер Лаборатории Волновых Процессов и Систем Управления МФТИ, преподаватель магистратуры «Робототехника и Искусственный Интеллект» МФТИ, робототехник, и просто классный парень)

Георгию Апарину @AparinAI, который хоть и не отвечал за конкретную тему в подготовке, прошел вайбчек тренерской команды и совершенно органично в нее влился, а также сделал классную задачу на NEOAI) и даже приехал в Китай на межнар! Георгий - исследователь в Russian Research Institute.

Даниилу Кашину, который провел сборной пары по сегментации и детекции. Даниил - руководитель команды претрейна VLM в Яндексе.

Саше Рогачеву, который проводил ребятам пары по GAN и генеративным моделям. Саша - кандидат компьютерных наук; Руководитель RnD группы компьютерного зрения, VK AI, старший преподаватель ФКН, НИУ ВШЭ, а также один из постоянных организаторов Всероса по ИИ (который РСОШ)!

Ване Стельмаху, который проводил ребятам пару по Adversarial Attacks. Ваня - директор по продукту Центрального университета.

Максиму Шаланкину @ml_maxim, который дал ребятам порешать свои задачи в стиле межнара (мало времени, много задач), а потом разбирал с ребятами их решения и давал им ценный фидбек. Максим - Data Science Team Lead в MWS.

Андрею Кузнецову, который решал домашки и обсуждал с школьниками их решения и жалел, что он уже не школьник и не может поехать на межнар 🙃. Андрей - студент ВШЭ, победитель ML-контестов на различных площадках.

Борису Шапошникову @bshannel, который провел ребятам пару по RLHF (в силлабусе не было, но мы перестраховались:). Борис - руководитель направления Alignment в T-Bank AI Research и преподаватель ЦУ.

Егору Колодину, который записывал лекции и делал дз для курса подготовки с января по апрель. Егор - преподаватель NLP в Центральном университете, разработчик в команде GigaChat, выпускник МФТИ и ШАД.

Владимиру Черному, который записывал лекции и выдавал домашки на курс подготовки ребят с января по апрель. Владимир - выпускник МФТИ x Сколтех и CV-инженер в VK.

Никите Бондаренко @JohnyLibrarian и Федору Захарову @inner_celena, которые помогали готовить задачи на NEOAI.

Артему Селёзневу @AIartem, Ване Загорулько @vanya_zag0rulko, Ване Сазанову @iwance_tgc и Илье Галюкшеву, которые помогли нам провести NEOAI

Маше Бочаровой и ее ребятам, которые вели трек софт скиллз на курсе с января по апрель.

Ну и конечно Александру Дьяконову) @smalldatascience Хотя Александр не преподавал ребятам ничего в этом году, мне было важно получить от него фидбек на программу подготовки и благословение на поездку 😅

P.S. я точно где-то накосячил с регалиями, но зато постарался никого не забыть и указать тг каналы ребят 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from konstanta
Media is too big
VIEW IN TELEGRAM
Forwarded from DLStories
Но давайте про саму олимпиаду и задачи.

Олимпиада в этом году была устроена так: 2 дня индивидуальных раундов, на каждом дается 3 задачи на 6 часов. Задачи, в целом, были сделаны по такому же принципу, как и в прошлом году: вам дается какая-то задача, которую нужно решить, данные и метрика к ней, бейзлайн решение и ограничения. Вам нужно сделать что-то в рамках ограничений, чтобы получить лучшую метрику на тестовом датасете. Ограничения обычно формулируются так, что можно использовать только определенные модели и/или данные, нельзя менять определенный код, есть ограничение по времени выполнения, и т.п.
В целом, почти Kaggle-like задачи, только ограничений побольше, чтобы задача не решалась простым fit-predict, перебором моделей и stacking, а нужно было немного подумать. Правда, в этом году многие задачи (особенно первого дня) все равно хорошо решались перебором параметров/сменой модели, что лично мне очень не понравилось. Но, как я писала выше, сделать такие задачи, которые будут достаточно интересными, но в которых простые бездумные переборы или подобные вещи не будут давать результата, довольно сложно, поэтому тут сильно ныть не буду

Еще момент: как и в прошлом году, до самой олимпиады (где-то в начале июля) всем странам открывались at-home задачи. Это три задачи по типу тех, которые будут на олимпиаде. А точнее, три задачи первого дня олимпиады — это некоторые модификации at-home задач. То есть, at-home задачи — это возможность понять, какого типа задачи будут на олимпиаде, и подготовиться к ним.

Задачи обоих дней олимпиады — в файлах к посту. Подробно все 6 задачи разбирать пока не буду: во-первых, еще не выложены авторские решения, а во-вторых, у нас с Сашей был план сделать вебинар с разбором задач. На вебинар обязательно позову)

Скажу только про два веселых момента:
- в первой задаче второго дня было всего 10 примеров на паблике, и 30 на привате. В итоге большинство наших школьников выбили 1 (максимум) на паблике, а на привате укатились ниже бейзлайна. Скоры за каждую задачу после контеста нормализовались так, что бейзлайн считался за 0 баллов, а лучший из скоров участников — за 100. В итоге приват по этой задаче получился оочень неожиданным. Если бы не эта задача, у нас было бы первое абсолютное место в индивидуальном зачете)
- третья задача второго дня — это практически моя задача Cuties Segmentation с отбора (NeoAI), который мы проводили в мае (вот она на Kaggle, а вот GitHub с решением). Я поняла это сразу, как услышала ее условие, а потом еще на всякий спросила у оргов, какое там авторское решение. И да, оно такое же, как у Cuties Segmentation. И обидно тут то, что при подготовке к межнару я рассказывала решение этой задачи минимум два раза, но никто из наших школьников ее все равно таким способом на IOAI не решил ¯\_(ツ)_/¯

Самое веселое, что когда я рассказывала идею решения этой задачи, школьники мне и до, и после IOAI говорили что-то вроде "да это слишком сложно, так задачи на AI контестах не решаются" ("сложность", в их понимании, там в том, что надо копаться в attention механизме модели CLIP). Ну и на IOAI, в итоге, трое из восьми человек придумали более простое решение, которое давало сопоставимое с авторским решением количество баллов, а пять остальных получили скор ниже. И, опять же, если бы пара из этих пяти человек реализовали решение с NeoAI, то было бы второе абсолютное место и 7 золотых медалей, а не 6.
Честно, мне из-за этого было прям пипец обидно 😢😣
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from DLStories
Кроме индивидуальных туров на IOAI был еще team challenge. В нем каждой команде надо было программировать робота складывать разные предметы в корзинку, и потом отвезти эту корзинку на полку (не с нуля, стартовый код был дан). Чем точнее и быстрее робот все сделает, тем лучше. Результаты team challenge считались отдельно, в общий зачет не шли. У одной из двух наших команд — второе место, с разницей в 0.1 балла от первого))))

Team challenge шел три дня. В первый день все команды всех стран писали код для робота без реального робота. По результатам первого дня выбирались 10 команд, которые прошли в финал. Во второй день эти 10 команд отлаживали свой код на реальном роботе, а в третий день были контрольные забеги и замеры. Во второй и третий день ребята шли делать робота после индивидуальных туров (которые занимали 6-8 часов в зависимости от количества технических проблем), так что они вообще герои

Организаторы сказали, что этот team challenge задумывался как что-то зрелищное, что можно показать (а не эти ваши задачки в VS Code, где непонятно что и почему это вообще AI). По зрелищности вышло действительно неплохо. Единственное, реальный робот ездит оочень медленно🥴

Первое видео к посту — ускоренный run команды из Венгрии (не очень удачный, правда). Второе и третье — это я снимала нашу команду (на втором еще можно оценить всю площадку и атмосферу)