Экспедиция. Data Science
291 subscribers
5 photos
4 files
26 links
Информационный канал технологического конкурса «Экспедиция. Data Science».

Вся информация носит справочно-информационный характер и не может быть приравнена к официальным разъяснениям организаторов.

Регистрация: https://expds.upgreat.one/
Download Telegram
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!

Публикуем главные новости:
1️⃣ Сессия вопросов и ответов: пройдёт завтра, 22 октября с 17:00 до 18:00 МСК, ссылка на регистрацию: https://leader-id.ru/events/579058. На встрече эксперты по археологии готовы ответить на вопросы по данным и разметке.

2️⃣ UTM-зоны: в каждую папку с данными обучающей выборки добавлено указание UTM-зон в формате json-файла (UTM.json), в валидационную выборку добавлены аналогичные файлы.

Структура файла UTM.json
{
"utm": "36N", -- UTM зона
"crs": "urn:ogc:def:crs:EPSG::32636" -- CRS, соответствующая зоне
}


3️⃣ Обновление метрики квалификации: по результатам обсуждения экспертной группой принято решение в рамках квалификационного этапа не штрафовать за false positive по разметке классов «пашни» и «дороги».

Обращаем ваше внимание, что финальная закрытая валидационная выборка будет размечена полностью по всем классам объектов, а метрика на финальных испытаниях будет соответствовать Техническому регламенту.

4️⃣ Разметка пересекающихся объектов: допускается сохранение двух пересекающихся полигонов, так как в реализованном алгоритме метрика по разным классам разметки в рамках одного региона считается отдельно, после чего суммируется. Поэтому допустимо наложение разметки разных классов без вычитания масок, штраф за это не предусмотрен. Пункт 2.1 приложенного к материалам задачи документа с ответами по разметке скорректирован.

5️⃣ Обновление материалов: обращаем внимание, что в связи с изменениями выше обновлены следующие материалы задачи:

- обучающая выборка (добавлены UTM.json)
- реализация алгоритма расчёта метрики (добавлена отдельно для квалификации)
- пример исходного кода для случайных данных

❗️Также сегодня с 20:00 до 22:00 МСК будут проведены технические работы на платформе по обновлению метрики и валидационной выборки.
Please open Telegram to view this post
VIEW IN TELEGRAM
📌 Сессия вопросов и ответов

Уже через 30 минут начнется сессия вопросов и ответов для участников конкурса «Экспедиция DS. Обнаружение».

На встрече эксперты по археологии ответят на вопросы по данным и разметке.

Подключайтесь по ссылке: https://expds.ktalk.ru/sx722ntymxgs
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!

Мы начинаем сессию вопросов и ответов с археологами, подключайтесь по ссылке: https://expds.ktalk.ru/sx722ntymxgs
👍1
Приложение №6 к ТР (проект).pdf
105.2 KB
Обновление требований к интерфейсу для работы с исходным кодом

Уважаемые участники, публикуем проект обновлённого Приложения 6 к Техническому регламенту. Данный проект будет утверждён на ближайшем заседании Оргкомитета конкурса, просим внимательно ознакомиться с документом и задать ваши вопросы, если они у вас возникнут.

Все вопросы, которые поступят сегодня и завтра, мы постараемся сразу разобрать и учесть необходимые пояснения в финальной версии приложения.

Напоминаем, что в соответствии с пунктом 3.12 Технического регламента интерфейс для работы с алгоритмом обнаружения предоставляют команды, которые уже заняли 1 или 2 место в финальном рейтинге команд и претендуют на получение премии по итогам конкурса.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!

Завершилась сессия вопросов и ответов с археологами, спасибо всем, кто присоединился и задал свои вопросы.

📍 Для ознакомления с записью сессии перейдите по ссылке.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
Напоминаем командам!

Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).

📌 Для участия в финале одному из членов команды необходимо загрузить на платформу минимум одно решение со значением метрики больше нуля.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники, по итогам проведения сессии вопросов и ответов хотим обратить ваше внимание:

1. Рекомендуем провести синхронизацию обучающей выборки:

- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;

- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;

- в описание задачи на платформе добавлена инструкция по синхронизации датасета.

2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:

Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.

3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:

Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.

Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.

Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".

Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»

Информируем вас о следующих обновлениях материалов конкурса:

1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:

- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).

2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.

Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.

Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.

Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.

3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
👍2👏1
Уважаемые участники, обращаем ваше внимание:

1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.

Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.

2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.

Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.

На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
Уважаемые участники!

Важные объявления на сегодня:

1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:

- до 6 успешных попыток
- до 20 попыток всего

- обнуление происходит каждые сутки

2. Обновлены датасет и разметка обучающей выборки:

- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)

3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.
Уважаемые участники!
🔔 Напоминаем, что для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» одному из членов команды необходимо загрузить на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени) решение со значением метрики больше нуля.

⚠️ Настоятельно рекомендуем командам, которые еще не загрузили свое решение, сделать это как можно скорее, чтобы избежать технических сложностей или перегрузки платформы в последние часы перед дедлайном.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 Финальные испытания конкурса «Экспедиция DS. Обнаружение»!

Испытания финального этапа конкурса пройдут с 11 ноября 00:00 до 13 ноября 23:59 по московскому времени. В этот период команды смогут загрузить свои решения на платформу для расчета метрики на закрытой валидационной выборке.

Основные условия финального этапа:
✔️ Лимиты попыток: каждой команде предоставляется возможность осуществить 2 успешные попытки загрузки решения и до 10 любых попыток на весь этап.
✔️ Формирование финального рейтинга: результаты, полученные на закрытой валидационной выборке, определяют финальный рейтинг команд. Итоговые результаты будут опубликованы на платформе после завершения финального этапа.
✔️ Конфиденциальность результата: финальный скор, который будет отображаться в личном кабинете команды, является конфиденциальной информацией и не подлежит разглашению до официального объявления результатов.
✔️ Проверка результата: после окончания испытаний финального этапа командам на правах конфиденциальной информации по электронной почте будут направлены закрытая валидационная выборка и скрипт метрики.

❗️ Обращаем внимание, если команда самостоятельно не загрузит решение в срок, платформа автоматически выберет два решения, показавшие наилучший результат на публичной валидационной выборке квалификационного этапа, из числа последних трёх загруженных на платформу.

Желаем успехов на испытаниях финального этапа! 🔝
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡1
Уважаемые участники!

Важная информация о финальном этапе:
1️⃣ В финальной валидационной выборке будут представлены объекты класса «караванные пути», примеры доступны в папке 078_Египет обучающей выборки.

2️⃣ Для команд, допущенных к финальному этапу, открыта возможность загружать решения на платформу для тестирования и расчета скора на публичной валидационной выборке:

Лидерборд остаётся без изменений, полученный скор отображается только локально.
Возможность загрузки решений необходима только для тестирования моделей и не идёт в зачёт финального этапа.
Лимит на количество попыток идентичен квалификационному этапу: в сутки 6 успешных и 20 любых попыток.

⚠️ Расписание технических окон, в которые стабильная работа платформы не гарантируется:
- 06.11 - 09.11 (18:00 - 02:00 МСК);
- 10.11 (08:00 - 23:59 МСК).
*️⃣До загрузки решения в указанные слоты рекомендуем обновить страницу и обратить внимание на текст над кнопкой — информация будет там.


В любое время вне технических окон можно загружать решения для тестирования без риска получения ошибки. Об изменениях в расписании будет сообщено заранее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Оргкомитет утвердил результаты квалификации конкурса «Экспедиция DS. Обнаружение»

Завершился квалификационный этап конкурса, по результатам которого в финал прошли 59 команд.

118 командам было отказано в допуске к финальному этапу в связи с несоответствием установленным критериям или отсутствием загруженных решений.

📌 Таблица с результатами доступна по ссылке: https://disk.yandex.ru/d/sUnoqdS9QsaEWw.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники!

1. Открыта возможность загрузки решений в рамках испытаний финального этапа. Дедлайн — 13 ноября 23:59 МСК. В ходе испытаний можно получить до 2 значений метрики на закрытой валидационной выборке для учёта в финальном рейтинге команд.

2. Просим обратить особое внимание на следующие аспекты при формировании файла result.geojson для корректного расчёта метрики:
- Файл result.geojson содержит корректные имена регионов (region_name) в формате region_XXXX
- В файле result.geojson вы указываете подрегионы (sub_region_name) там, где они присутствуют в датасете
- Используете систему координат EPSG:3857 для всех полигонов
- Координаты в result.geojson находятся в ожидаемом диапазоне согласно UTM.json

Даже если модель предсказывает небольшое количество объектов, корректность метаданных (имена регионов, подрегионы) критична для правильного расчёта метрики.

3. В финальной выборке представлены египетские караванные пути, которые могут быть размечены участниками как «dorogi» и «karavannye_puti» — оба варианта будут считаться корректными в рамках текущего соревнования и рассчитываться с весом 3.0 класса «караванные пути» согласно приложению 4 ТР.

Желаем всем удачи в финальных испытаниях!
1
🔜 Дедлайн приема решений финального этапа конкурса

Напоминаем, что прием решений в рамках финального этапа конкурса «Экспедиция DS. Обнаружение» завершается сегодня, 13 ноября 2025 года, в 23:59 по московскому времени.

❗️ Просим все команды заблаговременно загрузить финальные решения на платформу и не откладывать загрузку на последние минуты, особенно если ещё не была использована ни одна попытка, во избежание технических сложностей или возможной перегрузки платформы непосредственно перед дедлайном.

⚠️ Обращаем внимание, что в случае, если команда не загрузит решение в установленный срок, платформа автоматически выберет два решения, показавшие наилучший результат на Публичной валидационной выборке в рамках квалификационного этапа, из числа трёх последних решений, загруженных на платформу.
Please open Telegram to view this post
VIEW IN TELEGRAM
Уважаемые участники!

Экспертной группой конкурса с учётом мониторинга текущей нагрузки на инфраструктуру платформы принято решение увеличить общий лимит любых попыток в рамках испытаний финального этапа до 20. Количество успешных попыток (запуска финальной версии исходного кода) остаётся без изменений и ограничено 2 (двумя) попытками на этап согласно пункту 7.11 Технического регламента.

Если вы ещё не использовали ни одной успешной попытки, рекомендуем осуществить загрузку решения в разделе «Data Science» в ближайшее время, так как ближе к дедлайну может возникнуть очередь.
🔝 Благодарим все команды за активное участие в конкурсе «Экспедиция DS. Обнаружение»!

📌 Решения команд, претендующих на получение премии, в настоящий момент проходят процедуру экспертизы судейской группой, по результатам которой будет сформирован Финальный рейтинг команд и объявлены результаты конкурса.

Следите за новостями 👍
Please open Telegram to view this post
VIEW IN TELEGRAM