Экспедиция. Data Science
291 subscribers
5 photos
4 files
26 links
Информационный канал технологического конкурса «Экспедиция. Data Science».

Вся информация носит справочно-информационный характер и не может быть приравнена к официальным разъяснениям организаторов.

Регистрация: https://expds.upgreat.one/
Download Telegram
Напоминаем командам!

Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).

📌 Для участия в финале одному из членов команды необходимо загрузить на платформу минимум одно решение со значением метрики больше нуля.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники, по итогам проведения сессии вопросов и ответов хотим обратить ваше внимание:

1. Рекомендуем провести синхронизацию обучающей выборки:

- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;

- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;

- в описание задачи на платформе добавлена инструкция по синхронизации датасета.

2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:

Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.

3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:

Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.

Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.

Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".

Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»

Информируем вас о следующих обновлениях материалов конкурса:

1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:

- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).

2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.

Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.

Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.

Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.

3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
👍2👏1
Уважаемые участники, обращаем ваше внимание:

1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.

Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.

2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.

Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.

На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
Уважаемые участники!

Важные объявления на сегодня:

1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:

- до 6 успешных попыток
- до 20 попыток всего

- обнуление происходит каждые сутки

2. Обновлены датасет и разметка обучающей выборки:

- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)

3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.
Уважаемые участники!
🔔 Напоминаем, что для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» одному из членов команды необходимо загрузить на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени) решение со значением метрики больше нуля.

⚠️ Настоятельно рекомендуем командам, которые еще не загрузили свое решение, сделать это как можно скорее, чтобы избежать технических сложностей или перегрузки платформы в последние часы перед дедлайном.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 Финальные испытания конкурса «Экспедиция DS. Обнаружение»!

Испытания финального этапа конкурса пройдут с 11 ноября 00:00 до 13 ноября 23:59 по московскому времени. В этот период команды смогут загрузить свои решения на платформу для расчета метрики на закрытой валидационной выборке.

Основные условия финального этапа:
✔️ Лимиты попыток: каждой команде предоставляется возможность осуществить 2 успешные попытки загрузки решения и до 10 любых попыток на весь этап.
✔️ Формирование финального рейтинга: результаты, полученные на закрытой валидационной выборке, определяют финальный рейтинг команд. Итоговые результаты будут опубликованы на платформе после завершения финального этапа.
✔️ Конфиденциальность результата: финальный скор, который будет отображаться в личном кабинете команды, является конфиденциальной информацией и не подлежит разглашению до официального объявления результатов.
✔️ Проверка результата: после окончания испытаний финального этапа командам на правах конфиденциальной информации по электронной почте будут направлены закрытая валидационная выборка и скрипт метрики.

❗️ Обращаем внимание, если команда самостоятельно не загрузит решение в срок, платформа автоматически выберет два решения, показавшие наилучший результат на публичной валидационной выборке квалификационного этапа, из числа последних трёх загруженных на платформу.

Желаем успехов на испытаниях финального этапа! 🔝
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡1
Уважаемые участники!

Важная информация о финальном этапе:
1️⃣ В финальной валидационной выборке будут представлены объекты класса «караванные пути», примеры доступны в папке 078_Египет обучающей выборки.

2️⃣ Для команд, допущенных к финальному этапу, открыта возможность загружать решения на платформу для тестирования и расчета скора на публичной валидационной выборке:

Лидерборд остаётся без изменений, полученный скор отображается только локально.
Возможность загрузки решений необходима только для тестирования моделей и не идёт в зачёт финального этапа.
Лимит на количество попыток идентичен квалификационному этапу: в сутки 6 успешных и 20 любых попыток.

⚠️ Расписание технических окон, в которые стабильная работа платформы не гарантируется:
- 06.11 - 09.11 (18:00 - 02:00 МСК);
- 10.11 (08:00 - 23:59 МСК).
*️⃣До загрузки решения в указанные слоты рекомендуем обновить страницу и обратить внимание на текст над кнопкой — информация будет там.


В любое время вне технических окон можно загружать решения для тестирования без риска получения ошибки. Об изменениях в расписании будет сообщено заранее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Оргкомитет утвердил результаты квалификации конкурса «Экспедиция DS. Обнаружение»

Завершился квалификационный этап конкурса, по результатам которого в финал прошли 59 команд.

118 командам было отказано в допуске к финальному этапу в связи с несоответствием установленным критериям или отсутствием загруженных решений.

📌 Таблица с результатами доступна по ссылке: https://disk.yandex.ru/d/sUnoqdS9QsaEWw.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники!

1. Открыта возможность загрузки решений в рамках испытаний финального этапа. Дедлайн — 13 ноября 23:59 МСК. В ходе испытаний можно получить до 2 значений метрики на закрытой валидационной выборке для учёта в финальном рейтинге команд.

2. Просим обратить особое внимание на следующие аспекты при формировании файла result.geojson для корректного расчёта метрики:
- Файл result.geojson содержит корректные имена регионов (region_name) в формате region_XXXX
- В файле result.geojson вы указываете подрегионы (sub_region_name) там, где они присутствуют в датасете
- Используете систему координат EPSG:3857 для всех полигонов
- Координаты в result.geojson находятся в ожидаемом диапазоне согласно UTM.json

Даже если модель предсказывает небольшое количество объектов, корректность метаданных (имена регионов, подрегионы) критична для правильного расчёта метрики.

3. В финальной выборке представлены египетские караванные пути, которые могут быть размечены участниками как «dorogi» и «karavannye_puti» — оба варианта будут считаться корректными в рамках текущего соревнования и рассчитываться с весом 3.0 класса «караванные пути» согласно приложению 4 ТР.

Желаем всем удачи в финальных испытаниях!
1
🔜 Дедлайн приема решений финального этапа конкурса

Напоминаем, что прием решений в рамках финального этапа конкурса «Экспедиция DS. Обнаружение» завершается сегодня, 13 ноября 2025 года, в 23:59 по московскому времени.

❗️ Просим все команды заблаговременно загрузить финальные решения на платформу и не откладывать загрузку на последние минуты, особенно если ещё не была использована ни одна попытка, во избежание технических сложностей или возможной перегрузки платформы непосредственно перед дедлайном.

⚠️ Обращаем внимание, что в случае, если команда не загрузит решение в установленный срок, платформа автоматически выберет два решения, показавшие наилучший результат на Публичной валидационной выборке в рамках квалификационного этапа, из числа трёх последних решений, загруженных на платформу.
Please open Telegram to view this post
VIEW IN TELEGRAM
Уважаемые участники!

Экспертной группой конкурса с учётом мониторинга текущей нагрузки на инфраструктуру платформы принято решение увеличить общий лимит любых попыток в рамках испытаний финального этапа до 20. Количество успешных попыток (запуска финальной версии исходного кода) остаётся без изменений и ограничено 2 (двумя) попытками на этап согласно пункту 7.11 Технического регламента.

Если вы ещё не использовали ни одной успешной попытки, рекомендуем осуществить загрузку решения в разделе «Data Science» в ближайшее время, так как ближе к дедлайну может возникнуть очередь.
🔝 Благодарим все команды за активное участие в конкурсе «Экспедиция DS. Обнаружение»!

📌 Решения команд, претендующих на получение премии, в настоящий момент проходят процедуру экспертизы судейской группой, по результатам которой будет сформирован Финальный рейтинг команд и объявлены результаты конкурса.

Следите за новостями 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
⚡️ Завершён финальный этап конкурса «Экспедиция. Data Science. Обнаружение»

Уважаемые участники! Утверждены итоговые результаты и определены победитель и призёры конкурса:
🥇 «Северная звезда» (г. Москва)
🥈 «Family» (г. Омск)
🥉 «Орбис» (г. Владикавказ)

🔗 Для ознакомления:
Выписка из протокола № 1 заседания Жюри
Таблица результатов Финальных испытаний КОЗ № 1
(также размещена на платформе конкурса в разделе «Data Science»)


📌 Электронные сертификаты участников будут размещены на платформе конкурса на следующей неделе, ожидайте уведомления.

🔥 Благодарим все команды за участие в конкурсе и проявленный профессионализм!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍3👏2
Уважаемые участники!

Завершён КОЗ №1 «Обнаружение», входящий в состав масштабного технологического конкурса «Экспедиция. Data Science». Благодарим всех за участие — работа была насыщенной и продуктивной!

Phystech.Genesis совместно с Фондом НТИ рад был провести для вас данный конкурс.

🔝 У команды Phystech.Genesis есть сообщество, где публикуются анонсы конкурсов, хакатонов и айдиатонов, а их победители делятся различными лайфхаками — будет полезно для профессионального развития👇

🚀 Присоединяйтесь: https://t.me/phystech_genesis
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
🔥 Электронные сертификаты

Уважаемые участники! Сообщаем вам, что на платформе конкурса размещены сертификаты участников конкурса «Экспедиция DS. Обнаружение».

📍 Для скачивания сертификатов перейдите в раздел «Статус» и нажмите на кнопку «Скачать сертификат участника».
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Уважаемые участники!

Обращаем внимание, что данный чат предназначен исключительно для коммуникаций в рамках конкурса «Экспедиция. Data Science». Просим соблюдать следующие правила:

1. Только по делу. Обсуждаем вопросы конкурса, задачу, данные, организационные моменты.
2. Запрещён спам и реклама в любом виде (ссылки, услуги, проекты, каналы, вакансии и т.п.).
3. Недопустима нецензурная лексика, оскорбления, переходы на личности, троллинг в любую сторону.
4. Запрещены обсуждения политики, религии и иных тем, не относящихся к конкурсу.
5. Соблюдайте уважительный и профессиональный тон общения, даже в спорных ситуациях.
6. Не злоупотребляйте сообщениями (флуд, оффтоп, серии коротких сообщений).

Нарушение правил может привести к удалению сообщений, ограничению доступа к чату или отстранению команды от участия в конкурсе.

Напоминаем, что свои вопросы и претензии Вы можете направлять на официальную почту конкурса: ds_analytics@upgreat.one.

Мы ценим порядок, конструктивный диалог и взаимное уважение. Благодарим за понимание и ждём ваших заявок на КОЗ №2 «Сканирование», о старте приёма заявок будет объявлено в канале конкурса @expds.
3