⏰ Напоминаем командам!
Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).
📌 Для участия в финале одному из членов команды необходимо загрузить на платформу минимум одно решение со значением метрики больше нуля.
Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники, по итогам проведения сессии вопросов и ответов хотим обратить ваше внимание:
1. Рекомендуем провести синхронизацию обучающей выборки:
- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;
- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;
- в описание задачи на платформе добавлена инструкция по синхронизации датасета.
2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:
Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.
3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:
Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.
Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.
Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".
Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
1. Рекомендуем провести синхронизацию обучающей выборки:
- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;
- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;
- в описание задачи на платформе добавлена инструкция по синхронизации датасета.
2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:
Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.
3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:
Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.
Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.
Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".
Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»
Информируем вас о следующих обновлениях материалов конкурса:
1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:
- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).
2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.
Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.
Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.
Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.
3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
Информируем вас о следующих обновлениях материалов конкурса:
1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:
- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).
2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.
Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.
Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.
Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.
3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
👍2👏1
Уважаемые участники, обращаем ваше внимание:
1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.
Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.
2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.
Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.
На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.
Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.
2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.
Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.
На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
Уважаемые участники!
Важные объявления на сегодня:
1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:
- до 6 успешных попыток
- до 20 попыток всего
- обнуление происходит каждые сутки
2. Обновлены датасет и разметка обучающей выборки:
- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)
3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.
Важные объявления на сегодня:
1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:
- до 6 успешных попыток
- до 20 попыток всего
- обнуление происходит каждые сутки
2. Обновлены датасет и разметка обучающей выборки:
- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)
3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.
Уважаемые участники!
🔔 Напоминаем, что для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» одному из членов команды необходимо загрузить на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени) решение со значением метрики больше нуля.
⚠️ Настоятельно рекомендуем командам, которые еще не загрузили свое решение, сделать это как можно скорее, чтобы избежать технических сложностей или перегрузки платформы в последние часы перед дедлайном.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Испытания финального этапа конкурса пройдут с 11 ноября 00:00 до 13 ноября 23:59 по московскому времени. В этот период команды смогут загрузить свои решения на платформу для расчета метрики на закрытой валидационной выборке.
Основные условия финального этапа:
Желаем успехов на испытаниях финального этапа!
Please open Telegram to view this post
VIEW IN TELEGRAM
🫡1
Уважаемые участники!
Важная информация о финальном этапе:
1️⃣ В финальной валидационной выборке будут представлены объекты класса «караванные пути», примеры доступны в папке 078_Египет обучающей выборки.
2️⃣ Для команд, допущенных к финальному этапу, открыта возможность загружать решения на платформу для тестирования и расчета скора на публичной валидационной выборке:
➖ Лидерборд остаётся без изменений, полученный скор отображается только локально.
➖ Возможность загрузки решений необходима только для тестирования моделей и не идёт в зачёт финального этапа.
➖ Лимит на количество попыток идентичен квалификационному этапу: в сутки 6 успешных и 20 любых попыток.
⚠️ Расписание технических окон, в которые стабильная работа платформы не гарантируется:
- 06.11 - 09.11 (18:00 - 02:00 МСК);
- 10.11 (08:00 - 23:59 МСК).
В любое время вне технических окон можно загружать решения для тестирования без риска получения ошибки. Об изменениях в расписании будет сообщено заранее.
Важная информация о финальном этапе:
- 06.11 - 09.11 (18:00 - 02:00 МСК);
- 10.11 (08:00 - 23:59 МСК).
*️⃣ До загрузки решения в указанные слоты рекомендуем обновить страницу и обратить внимание на текст над кнопкой — информация будет там.
В любое время вне технических окон можно загружать решения для тестирования без риска получения ошибки. Об изменениях в расписании будет сообщено заранее.
Please open Telegram to view this post
VIEW IN TELEGRAM
Оргкомитет утвердил результаты квалификации конкурса «Экспедиция DS. Обнаружение»
Завершился квалификационный этап конкурса, по результатам которого в финал прошли 59 команд.
118 командам было отказано в допуске к финальному этапу в связи с несоответствием установленным критериям или отсутствием загруженных решений.
📌 Таблица с результатами доступна по ссылке: https://disk.yandex.ru/d/sUnoqdS9QsaEWw.
Завершился квалификационный этап конкурса, по результатам которого в финал прошли 59 команд.
118 командам было отказано в допуске к финальному этапу в связи с несоответствием установленным критериям или отсутствием загруженных решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники!
1. Открыта возможность загрузки решений в рамках испытаний финального этапа. Дедлайн — 13 ноября 23:59 МСК. В ходе испытаний можно получить до 2 значений метрики на закрытой валидационной выборке для учёта в финальном рейтинге команд.
2. Просим обратить особое внимание на следующие аспекты при формировании файла result.geojson для корректного расчёта метрики:
- Файл result.geojson содержит корректные имена регионов (region_name) в формате region_XXXX
- В файле result.geojson вы указываете подрегионы (sub_region_name) там, где они присутствуют в датасете
- Используете систему координат EPSG:3857 для всех полигонов
- Координаты в result.geojson находятся в ожидаемом диапазоне согласно UTM.json
Даже если модель предсказывает небольшое количество объектов, корректность метаданных (имена регионов, подрегионы) критична для правильного расчёта метрики.
3. В финальной выборке представлены египетские караванные пути, которые могут быть размечены участниками как «dorogi» и «karavannye_puti» — оба варианта будут считаться корректными в рамках текущего соревнования и рассчитываться с весом 3.0 класса «караванные пути» согласно приложению 4 ТР.
Желаем всем удачи в финальных испытаниях!
1. Открыта возможность загрузки решений в рамках испытаний финального этапа. Дедлайн — 13 ноября 23:59 МСК. В ходе испытаний можно получить до 2 значений метрики на закрытой валидационной выборке для учёта в финальном рейтинге команд.
2. Просим обратить особое внимание на следующие аспекты при формировании файла result.geojson для корректного расчёта метрики:
- Файл result.geojson содержит корректные имена регионов (region_name) в формате region_XXXX
- В файле result.geojson вы указываете подрегионы (sub_region_name) там, где они присутствуют в датасете
- Используете систему координат EPSG:3857 для всех полигонов
- Координаты в result.geojson находятся в ожидаемом диапазоне согласно UTM.json
Даже если модель предсказывает небольшое количество объектов, корректность метаданных (имена регионов, подрегионы) критична для правильного расчёта метрики.
3. В финальной выборке представлены египетские караванные пути, которые могут быть размечены участниками как «dorogi» и «karavannye_puti» — оба варианта будут считаться корректными в рамках текущего соревнования и рассчитываться с весом 3.0 класса «караванные пути» согласно приложению 4 ТР.
Желаем всем удачи в финальных испытаниях!
❤1
Напоминаем, что прием решений в рамках финального этапа конкурса «Экспедиция DS. Обнаружение» завершается сегодня, 13 ноября 2025 года, в 23:59 по московскому времени.
Please open Telegram to view this post
VIEW IN TELEGRAM
Уважаемые участники!
Экспертной группой конкурса с учётом мониторинга текущей нагрузки на инфраструктуру платформы принято решение увеличить общий лимит любых попыток в рамках испытаний финального этапа до 20. Количество успешных попыток (запуска финальной версии исходного кода) остаётся без изменений и ограничено 2 (двумя) попытками на этап согласно пункту 7.11 Технического регламента.
Если вы ещё не использовали ни одной успешной попытки, рекомендуем осуществить загрузку решения в разделе «Data Science» в ближайшее время, так как ближе к дедлайну может возникнуть очередь.
Экспертной группой конкурса с учётом мониторинга текущей нагрузки на инфраструктуру платформы принято решение увеличить общий лимит любых попыток в рамках испытаний финального этапа до 20. Количество успешных попыток (запуска финальной версии исходного кода) остаётся без изменений и ограничено 2 (двумя) попытками на этап согласно пункту 7.11 Технического регламента.
Если вы ещё не использовали ни одной успешной попытки, рекомендуем осуществить загрузку решения в разделе «Data Science» в ближайшее время, так как ближе к дедлайну может возникнуть очередь.
Следите за новостями
Please open Telegram to view this post
VIEW IN TELEGRAM
Уважаемые участники! Утверждены итоговые результаты и определены победитель и призёры конкурса:
🔗 Для ознакомления:
• Выписка из протокола № 1 заседания Жюри
• Таблица результатов Финальных испытаний КОЗ № 1
(также размещена на платформе конкурса в разделе «Data Science»)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥12👍3👏2
Уважаемые участники!
Завершён КОЗ №1 «Обнаружение», входящий в состав масштабного технологического конкурса «Экспедиция. Data Science». Благодарим всех за участие — работа была насыщенной и продуктивной!
Phystech.Genesis совместно с Фондом НТИ рад был провести для вас данный конкурс.
🔝 У команды Phystech.Genesis есть сообщество, где публикуются анонсы конкурсов, хакатонов и айдиатонов, а их победители делятся различными лайфхаками — будет полезно для профессионального развития👇
🚀 Присоединяйтесь: https://t.me/phystech_genesis
Завершён КОЗ №1 «Обнаружение», входящий в состав масштабного технологического конкурса «Экспедиция. Data Science». Благодарим всех за участие — работа была насыщенной и продуктивной!
Phystech.Genesis совместно с Фондом НТИ рад был провести для вас данный конкурс.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
Phystech.Genesis | Channel
Мы про хакатоны, ML-соревнования, стажировки
💬 Вступай в закрытую группу нашего сообщества:
https://t.me/joinchat/CN0_CVJysRmwYKNEv9j-yw
По вопросам сотрудничества:
@semkannn
По вопросам рекламы: @nadezhdalozovik
💬 Вступай в закрытую группу нашего сообщества:
https://t.me/joinchat/CN0_CVJysRmwYKNEv9j-yw
По вопросам сотрудничества:
@semkannn
По вопросам рекламы: @nadezhdalozovik
🔥7
Уважаемые участники! Сообщаем вам, что на платформе конкурса размещены сертификаты участников конкурса «Экспедиция DS. Обнаружение».
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
Уважаемые участники!
Обращаем внимание, что данный чат предназначен исключительно для коммуникаций в рамках конкурса «Экспедиция. Data Science». Просим соблюдать следующие правила:
1. Только по делу. Обсуждаем вопросы конкурса, задачу, данные, организационные моменты.
2. Запрещён спам и реклама в любом виде (ссылки, услуги, проекты, каналы, вакансии и т.п.).
3. Недопустима нецензурная лексика, оскорбления, переходы на личности, троллинг в любую сторону.
4. Запрещены обсуждения политики, религии и иных тем, не относящихся к конкурсу.
5. Соблюдайте уважительный и профессиональный тон общения, даже в спорных ситуациях.
6. Не злоупотребляйте сообщениями (флуд, оффтоп, серии коротких сообщений).
Нарушение правил может привести к удалению сообщений, ограничению доступа к чату или отстранению команды от участия в конкурсе.
Напоминаем, что свои вопросы и претензии Вы можете направлять на официальную почту конкурса: ds_analytics@upgreat.one.
Мы ценим порядок, конструктивный диалог и взаимное уважение. Благодарим за понимание и ждём ваших заявок на КОЗ №2 «Сканирование», о старте приёма заявок будет объявлено в канале конкурса @expds.
Обращаем внимание, что данный чат предназначен исключительно для коммуникаций в рамках конкурса «Экспедиция. Data Science». Просим соблюдать следующие правила:
1. Только по делу. Обсуждаем вопросы конкурса, задачу, данные, организационные моменты.
2. Запрещён спам и реклама в любом виде (ссылки, услуги, проекты, каналы, вакансии и т.п.).
3. Недопустима нецензурная лексика, оскорбления, переходы на личности, троллинг в любую сторону.
4. Запрещены обсуждения политики, религии и иных тем, не относящихся к конкурсу.
5. Соблюдайте уважительный и профессиональный тон общения, даже в спорных ситуациях.
6. Не злоупотребляйте сообщениями (флуд, оффтоп, серии коротких сообщений).
Нарушение правил может привести к удалению сообщений, ограничению доступа к чату или отстранению команды от участия в конкурсе.
Напоминаем, что свои вопросы и претензии Вы можете направлять на официальную почту конкурса: ds_analytics@upgreat.one.
Мы ценим порядок, конструктивный диалог и взаимное уважение. Благодарим за понимание и ждём ваших заявок на КОЗ №2 «Сканирование», о старте приёма заявок будет объявлено в канале конкурса @expds.
❤3