Уважаемые участники конкурса «Экспедиция. Data Science. Обнаружение», у нас отличные новости!
На сайте опубликован проект технического регламента: https://expds.upgreat.one/
Обращаем ваше внимание, что это проект технического регламента, он будет дополняться, в том числе с учётом обратной связи участников. На данный момент запланированы следующие обновления, которые будут доступны во время квалификационного этапа:
— описание метрики расчёта качества решений
— регламентация аннотаций к данным
— конфигурация вычислителя для запуска ПКК
— формат представления данных, выходного файла ПКК
— алгоритм запуска ПКК и ограничения на платформе
— требования к описанию финального ПКК, описание процедуры экспертизы
📄 Обязательно ознакомьтесь с документом, чтобы не пропустить важные детали!
Также сообщаем, что решением оргкомитета продлен срок приема заявок:
- регистрация участников на платформе конкурса доступна до 14.10.2025 (23:59 МСК);
- подача командных заявок в едином личном кабинете Фонда НТИ доступна до 16.10.2025 (23:59 МСК).
На сайте опубликован проект технического регламента: https://expds.upgreat.one/
Обращаем ваше внимание, что это проект технического регламента, он будет дополняться, в том числе с учётом обратной связи участников. На данный момент запланированы следующие обновления, которые будут доступны во время квалификационного этапа:
— описание метрики расчёта качества решений
— регламентация аннотаций к данным
— конфигурация вычислителя для запуска ПКК
— формат представления данных, выходного файла ПКК
— алгоритм запуска ПКК и ограничения на платформе
— требования к описанию финального ПКК, описание процедуры экспертизы
📄 Обязательно ознакомьтесь с документом, чтобы не пропустить важные детали!
Также сообщаем, что решением оргкомитета продлен срок приема заявок:
- регистрация участников на платформе конкурса доступна до 14.10.2025 (23:59 МСК);
- подача командных заявок в едином личном кабинете Фонда НТИ доступна до 16.10.2025 (23:59 МСК).
✍5❤2
Уважаемые участники конкурса «Экспедиция. Data Science. Обнаружение»!
Мы рады сообщить, что 6 октября стартует квалификационный этап конкурса «Экспедиция. Data Science. Обнаружение», который продлится до 10 ноября.
Начиная с 6 октября участникам, допущенным к квалификационному этапу, будет предоставляться доступ к разделу «Data Science» на платформе конкурса.
Там вы сможете загружать свои решения, а также ознакомиться с материалами задачи:
- датасетом обучающей выборки;
- реализацией алгоритма расчёта метрики;
- примером загружаемого решения;
- конфигурацией GPU-вычислителей.
Обращаем внимание, что после завершения тренировочных дней, с 17 октября станет доступен публичный рейтинг команд в квалификационном этапе, а обучающий датасет будет дополнен и окончательно зафиксирован.
❗️Важно: рейтинг команд по итогам квалификационного этапа не влияет на распределение призовых мест. Его основная цель - дать участникам возможность разработать решение и протестировать его корректную загрузку на платформу. Закрытая валидационная выборка финального этапа не пересекается ни с обучающим датасетом, ни с публичной выборкой квалификационного этапа.
❗️Напоминаем, что для допуска к финальному этапу одному из членов команды необходимо до 2 ноября включительно (до 23:59 по московскому времени) загрузить на платформу минимум одно решение с ненулевым значением метрики.
Также напоминаем, что участие в конкурсе могут принимать только совершеннолетние налоговые резиденты Российской Федерации.
Если в вашей команде есть участники, не соответствующие этим требованиям, просим незамедлительно сообщить об этом организаторам по адресу: ds_analytics@upgreat.one.
Мы рады сообщить, что 6 октября стартует квалификационный этап конкурса «Экспедиция. Data Science. Обнаружение», который продлится до 10 ноября.
Начиная с 6 октября участникам, допущенным к квалификационному этапу, будет предоставляться доступ к разделу «Data Science» на платформе конкурса.
Там вы сможете загружать свои решения, а также ознакомиться с материалами задачи:
- датасетом обучающей выборки;
- реализацией алгоритма расчёта метрики;
- примером загружаемого решения;
- конфигурацией GPU-вычислителей.
Обращаем внимание, что после завершения тренировочных дней, с 17 октября станет доступен публичный рейтинг команд в квалификационном этапе, а обучающий датасет будет дополнен и окончательно зафиксирован.
❗️Важно: рейтинг команд по итогам квалификационного этапа не влияет на распределение призовых мест. Его основная цель - дать участникам возможность разработать решение и протестировать его корректную загрузку на платформу. Закрытая валидационная выборка финального этапа не пересекается ни с обучающим датасетом, ни с публичной выборкой квалификационного этапа.
❗️Напоминаем, что для допуска к финальному этапу одному из членов команды необходимо до 2 ноября включительно (до 23:59 по московскому времени) загрузить на платформу минимум одно решение с ненулевым значением метрики.
Также напоминаем, что участие в конкурсе могут принимать только совершеннолетние налоговые резиденты Российской Федерации.
Если в вашей команде есть участники, не соответствующие этим требованиям, просим незамедлительно сообщить об этом организаторам по адресу: ds_analytics@upgreat.one.
🔥5❤2
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Стартовал квалификационный этап конкурса и для предварительно допущенных команд был открыт доступ к разделу «Data Science» на платформе конкурса, где они могут ознакомиться с описанием задачи и датасетом обучающей выборки.
Дополнительные материалы задачи и загрузка решений будут открыты в течение текущей недели, после чего руководителям команд будет направлено соответствующее уведомление на электронную почту.
Стартовал квалификационный этап конкурса и для предварительно допущенных команд был открыт доступ к разделу «Data Science» на платформе конкурса, где они могут ознакомиться с описанием задачи и датасетом обучающей выборки.
Дополнительные материалы задачи и загрузка решений будут открыты в течение текущей недели, после чего руководителям команд будет направлено соответствующее уведомление на электронную почту.
❤5
Консультация по техническому регламенту конкурса «Экспедиция DS. Обнаружение».
15 октября (среда) в 17:00 (по московскому времени) состоится онлайн консультационное мероприятие, на котором будут разобраны:
- основные нововведения в Технический регламент;
- формат данных и разметки для решения конкурсной задачи;
- работа с платформой для тестирования решений.
Регистрация обязательна и доступна по ссылке: https://leader-id.ru/events/577071.
🔗 Ссылка на подключение онлайн будет разослана на почты зарегистрированных участников за 1 час до начала консультации!
15 октября (среда) в 17:00 (по московскому времени) состоится онлайн консультационное мероприятие, на котором будут разобраны:
- основные нововведения в Технический регламент;
- формат данных и разметки для решения конкурсной задачи;
- работа с платформой для тестирования решений.
Регистрация обязательна и доступна по ссылке: https://leader-id.ru/events/577071.
🔗 Ссылка на подключение онлайн будет разослана на почты зарегистрированных участников за 1 час до начала консультации!
leader-id.ru
Консультация №2 по вопросам участия в конкурсе «Экспедиция. Data Science. Обнаружение»
Leader-ID — платформа для лидеров. Здесь 4+ млн пользователей, бесплатные образовательные мероприятия и коворкинги. Leader-ID помогает запускать технологические проекты.
Обновления_Технического_регламента_от_10_10_2025.pdf
151.4 KB
📑 Утвержден Технический регламент КОЗ №1 «Обнаружение»
На официальном сайте конкурса опубликован утвержденный Технический регламент конкурса «Экспедиция DS. Обнаружение». Ключевые изменения относительно проекта документа:
- обновлен перечень терминов,
- добавлено требование к пользовательским интерфейсам,
- уточнены основания дисквалификации команд,
- закреплено право Оргкомитета вносить корректировки в Технический регламент,
- внесены приложения, которые детализируют техническую реализацию конкурса.
Для вашего удобства все нововведения отражены в отдельном файле (во вложении).
Вопросы по техническому регламенту можно оставить в комментариях к этому посту.
На официальном сайте конкурса опубликован утвержденный Технический регламент конкурса «Экспедиция DS. Обнаружение». Ключевые изменения относительно проекта документа:
- обновлен перечень терминов,
- добавлено требование к пользовательским интерфейсам,
- уточнены основания дисквалификации команд,
- закреплено право Оргкомитета вносить корректировки в Технический регламент,
- внесены приложения, которые детализируют техническую реализацию конкурса.
Для вашего удобства все нововведения отражены в отдельном файле (во вложении).
Вопросы по техническому регламенту можно оставить в комментариях к этому посту.
⚡1👍1
Загрузка решений на платформе конкурса «Экспедиция DS. Обнаружение»
Сообщаем, что на платформе конкурса открыта возможность загрузки решений в разделе «Data Science», а также добавлены дополнительные материалы:
- реализация алгоритма расчёта метрики;
- пример выходного файла;
- пример исходного кода для случайных данных.
Дополнительно сообщаем, что в ближайшее время станет доступно для ознакомления бейзлайн-решение, следите за обновлениями в канале конкурса: @expds.
Напоминаем, что для допуска к финальному этапу одному из членов команды необходимо до 2 ноября включительно (до 23:59 по московскому времени) загрузить на платформу минимум одно решение со значением метрики больше нуля.
Также напоминаем, сегодня (15 октября) с 17:00 до 19:00 (МСК) состоится онлайн-консультация по Техническому регламенту конкурса.
Регистрация доступна по ссылке: https://leader-id.ru/events/577071.
Сообщаем, что на платформе конкурса открыта возможность загрузки решений в разделе «Data Science», а также добавлены дополнительные материалы:
- реализация алгоритма расчёта метрики;
- пример выходного файла;
- пример исходного кода для случайных данных.
Дополнительно сообщаем, что в ближайшее время станет доступно для ознакомления бейзлайн-решение, следите за обновлениями в канале конкурса: @expds.
Напоминаем, что для допуска к финальному этапу одному из членов команды необходимо до 2 ноября включительно (до 23:59 по московскому времени) загрузить на платформу минимум одно решение со значением метрики больше нуля.
Также напоминаем, сегодня (15 октября) с 17:00 до 19:00 (МСК) состоится онлайн-консультация по Техническому регламенту конкурса.
Регистрация доступна по ссылке: https://leader-id.ru/events/577071.
Завершена регистрация на платформе конкурса «Экспедиция DS. Обнаружение»
Регистрация на платформе конкурса завершилась 14 октября в 23:59 (МСК).
Обращаем внимание, что в соответствии с п. 6.5.11 Технического регламента для команд, зарегистрированных на платформе конкурса в указанный срок, предоставлена возможность до 16 октября до 23:59 (МСК) подать заявку в едином личном кабинете Фонда НТИ для завершения регистрации на конкурс «Экспедиция DS. Обнаружение».
Заявки от команд, которые не прошли регистрацию на платформе конкурса в соответствии с п.6.5.1 - 6.5.5 Технического регламента, приниматься не будут (п. 6.5.13 Технического регламента).
Регистрация на платформе конкурса завершилась 14 октября в 23:59 (МСК).
Обращаем внимание, что в соответствии с п. 6.5.11 Технического регламента для команд, зарегистрированных на платформе конкурса в указанный срок, предоставлена возможность до 16 октября до 23:59 (МСК) подать заявку в едином личном кабинете Фонда НТИ для завершения регистрации на конкурс «Экспедиция DS. Обнаружение».
Заявки от команд, которые не прошли регистрацию на платформе конкурса в соответствии с п.6.5.1 - 6.5.5 Технического регламента, приниматься не будут (п. 6.5.13 Технического регламента).
Консультация_№2_Экспедиция_DS_Обнаружение.pdf
6.3 MB
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Завершилась онлайн-консультация №2 по Техническому регламенту конкурса. Благодарим всех, кто присоединился!
Запись консультации размещена по ссылке.
Презентация с консультации прикреплена во вложении.
Завершилась онлайн-консультация №2 по Техническому регламенту конкурса. Благодарим всех, кто присоединился!
Запись консультации размещена по ссылке.
Презентация с консультации прикреплена во вложении.
🙈2
О рейтингах и их влиянии на результаты конкурса
1. Публичный рейтинг команд — формируется по итогам проведения квалификационного этапа, который проходит в настоящий момент:
- учитывает скор команд только по основной метрике конкурса (см. пункт 1 в Приложении 4 к ТР)
- в квалификационном этапе метрика рассчитывается на публичной валидационной выборке
- доступен участникам в ходе проведения квалификационного этапа (ожидайте уведомления о публикации в канале)
- не учитывается при определении призёров
2. Финальный рейтинг команд — формируется по итогам проведения испытаний финального этапа, которые пройдут после 10 ноября:
- аналогично учитывает скор команд только по основной метрике конкурса
- в финальном этапе метрика рассчитывается на закрытой валидационной выборке
- закрытая выборка не пересекается с публичной и обучающей
- не доступен участникам в ходе проведения финального этапа
- каждой команде будет доступен собственный скор до официального оглашения результатов конкурса (на правах конфиденциальной информации)
- будет опубликован после экспертизы исходного кода претендентов на премию и заседания жюри
- нахождение команды на 1 месте в финальном рейтинге не гарантирует автоматической победы (необходимо пройти экспертизу кода в соответствии с п. 8.5.2 ТР)
- скор команд по основной метрике на закрытой выборке определяет финальный рейтинг, только он имеет ненулевой вес в оценке
3. Пользовательский интерфейс в соответствии с п.3.12 ТР необходимо предоставить только командам, занявшим 1 и 2 место, после завершения финального этапа конкурса (Приложение 6 к ТР будет скорректировано в ближайшее время).
Итого:
- публичный рейтинг команд откроется всем участникам со следующей недели, но он имеет только демонстрационный характер
- финальный рейтинг команд будет опубликован после завершения конкурса и утверждения его результатов
- интерфейс предоставляют только команды, занявшие 1 и 2 места
1. Публичный рейтинг команд — формируется по итогам проведения квалификационного этапа, который проходит в настоящий момент:
- учитывает скор команд только по основной метрике конкурса (см. пункт 1 в Приложении 4 к ТР)
- в квалификационном этапе метрика рассчитывается на публичной валидационной выборке
- доступен участникам в ходе проведения квалификационного этапа (ожидайте уведомления о публикации в канале)
- не учитывается при определении призёров
2. Финальный рейтинг команд — формируется по итогам проведения испытаний финального этапа, которые пройдут после 10 ноября:
- аналогично учитывает скор команд только по основной метрике конкурса
- в финальном этапе метрика рассчитывается на закрытой валидационной выборке
- закрытая выборка не пересекается с публичной и обучающей
- не доступен участникам в ходе проведения финального этапа
- каждой команде будет доступен собственный скор до официального оглашения результатов конкурса (на правах конфиденциальной информации)
- будет опубликован после экспертизы исходного кода претендентов на премию и заседания жюри
- нахождение команды на 1 месте в финальном рейтинге не гарантирует автоматической победы (необходимо пройти экспертизу кода в соответствии с п. 8.5.2 ТР)
- скор команд по основной метрике на закрытой выборке определяет финальный рейтинг, только он имеет ненулевой вес в оценке
3. Пользовательский интерфейс в соответствии с п.3.12 ТР необходимо предоставить только командам, занявшим 1 и 2 место, после завершения финального этапа конкурса (Приложение 6 к ТР будет скорректировано в ближайшее время).
Итого:
- публичный рейтинг команд откроется всем участникам со следующей недели, но он имеет только демонстрационный характер
- финальный рейтинг команд будет опубликован после завершения конкурса и утверждения его результатов
- интерфейс предоставляют только команды, занявшие 1 и 2 места
По результатам дополнительных проверок разметки обучающей выборки были внесены следующие корректировки:
- исправлена разметка полигонов, имеющих самопересечения.
- удалены полигоны с пустыми координатами.
- проверена система координат в разметке (EPSG:3857 — WGS 84 Pseudo-Mercator) для корректного отображения полигонов.
Настоятельно рекомендуем заново скачать всю разметку и провести синхронизацию данных.
Обращаем внимание, что файлы изображений не изменялись, но были замечены ошибки в работе Яндекс Диска, в настоящий момент полностью перепроверена целостность файлов через контрольные суммы. Также обновлён скрипт для загрузки датасета с S3-хранилища.
Для скачивания датасета рекомендуется использовать файловые клиенты с контролем загрузки (rclone, cyberduck и другие).
- исправлена разметка полигонов, имеющих самопересечения.
- удалены полигоны с пустыми координатами.
- проверена система координат в разметке (EPSG:3857 — WGS 84 Pseudo-Mercator) для корректного отображения полигонов.
Настоятельно рекомендуем заново скачать всю разметку и провести синхронизацию данных.
Обращаем внимание, что файлы изображений не изменялись, но были замечены ошибки в работе Яндекс Диска, в настоящий момент полностью перепроверена целостность файлов через контрольные суммы. Также обновлён скрипт для загрузки датасета с S3-хранилища.
Для скачивания датасета рекомендуется использовать файловые клиенты с контролем загрузки (rclone, cyberduck и другие).
👍2
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Записана видеоинструкция по работе с QGIS, для ознакомления перейдите по ссылке.
Записана видеоинструкция по работе с QGIS, для ознакомления перейдите по ссылке.
rutube.ru
Видеоинструкция по работе с QGIS
Видео — RUTUBE
❤4😁2❤🔥1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Публикуем главные новости:
1️⃣ Сессия вопросов и ответов: пройдёт завтра, 22 октября с 17:00 до 18:00 МСК, ссылка на регистрацию: https://leader-id.ru/events/579058. На встрече эксперты по археологии готовы ответить на вопросы по данным и разметке.
2️⃣ UTM-зоны: в каждую папку с данными обучающей выборки добавлено указание UTM-зон в формате json-файла (UTM.json), в валидационную выборку добавлены аналогичные файлы.
Структура файла UTM.json
3️⃣ Обновление метрики квалификации: по результатам обсуждения экспертной группой принято решение в рамках квалификационного этапа не штрафовать за false positive по разметке классов «пашни» и «дороги».
Обращаем ваше внимание, что финальная закрытая валидационная выборка будет размечена полностью по всем классам объектов, а метрика на финальных испытаниях будет соответствовать Техническому регламенту.
4️⃣ Разметка пересекающихся объектов: допускается сохранение двух пересекающихся полигонов, так как в реализованном алгоритме метрика по разным классам разметки в рамках одного региона считается отдельно, после чего суммируется. Поэтому допустимо наложение разметки разных классов без вычитания масок, штраф за это не предусмотрен. Пункт 2.1 приложенного к материалам задачи документа с ответами по разметке скорректирован.
5️⃣ Обновление материалов: обращаем внимание, что в связи с изменениями выше обновлены следующие материалы задачи:
- обучающая выборка (добавлены UTM.json)
- реализация алгоритма расчёта метрики (добавлена отдельно для квалификации)
- пример исходного кода для случайных данных
❗️ Также сегодня с 20:00 до 22:00 МСК будут проведены технические работы на платформе по обновлению метрики и валидационной выборки.
Публикуем главные новости:
Структура файла UTM.json
{
"utm": "36N", -- UTM зона
"crs": "urn:ogc:def:crs:EPSG::32636" -- CRS, соответствующая зоне
}Обращаем ваше внимание, что финальная закрытая валидационная выборка будет размечена полностью по всем классам объектов, а метрика на финальных испытаниях будет соответствовать Техническому регламенту.
- обучающая выборка (добавлены UTM.json)
- реализация алгоритма расчёта метрики (добавлена отдельно для квалификации)
- пример исходного кода для случайных данных
Please open Telegram to view this post
VIEW IN TELEGRAM
Уже через 30 минут начнется сессия вопросов и ответов для участников конкурса «Экспедиция DS. Обнаружение».
На встрече эксперты по археологии ответят на вопросы по данным и разметке.
Подключайтесь по ссылке: https://expds.ktalk.ru/sx722ntymxgs
Please open Telegram to view this post
VIEW IN TELEGRAM
expds.ktalk.ru
Сессия вопросов и ответов в рамках конкурса «Экспедиция DS. Обнаружение»
Подключиться к видеоконференции
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Мы начинаем сессию вопросов и ответов с археологами, подключайтесь по ссылке: https://expds.ktalk.ru/sx722ntymxgs
Мы начинаем сессию вопросов и ответов с археологами, подключайтесь по ссылке: https://expds.ktalk.ru/sx722ntymxgs
expds.ktalk.ru
Сессия вопросов и ответов в рамках конкурса «Экспедиция DS. Обнаружение»
Подключиться к видеоконференции
👍1
Приложение №6 к ТР (проект).pdf
105.2 KB
Обновление требований к интерфейсу для работы с исходным кодом
Уважаемые участники, публикуем проект обновлённого Приложения 6 к Техническому регламенту. Данный проект будет утверждён на ближайшем заседании Оргкомитета конкурса, просим внимательно ознакомиться с документом и задать ваши вопросы, если они у вас возникнут.
Все вопросы, которые поступят сегодня и завтра, мы постараемся сразу разобрать и учесть необходимые пояснения в финальной версии приложения.
Напоминаем, что в соответствии с пунктом 3.12 Технического регламента интерфейс для работы с алгоритмом обнаружения предоставляют команды, которые уже заняли 1 или 2 место в финальном рейтинге команд и претендуют на получение премии по итогам конкурса.
Уважаемые участники, публикуем проект обновлённого Приложения 6 к Техническому регламенту. Данный проект будет утверждён на ближайшем заседании Оргкомитета конкурса, просим внимательно ознакомиться с документом и задать ваши вопросы, если они у вас возникнут.
Все вопросы, которые поступят сегодня и завтра, мы постараемся сразу разобрать и учесть необходимые пояснения в финальной версии приложения.
Напоминаем, что в соответствии с пунктом 3.12 Технического регламента интерфейс для работы с алгоритмом обнаружения предоставляют команды, которые уже заняли 1 или 2 место в финальном рейтинге команд и претендуют на получение премии по итогам конкурса.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»!
Завершилась сессия вопросов и ответов с археологами, спасибо всем, кто присоединился и задал свои вопросы.
📍 Для ознакомления с записью сессии перейдите по ссылке.
Завершилась сессия вопросов и ответов с археологами, спасибо всем, кто присоединился и задал свои вопросы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2
⏰ Напоминаем командам!
Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).
📌 Для участия в финале одному из членов команды необходимо загрузить на платформу минимум одно решение со значением метрики больше нуля.
Для допуска к финальному этапу конкурса «Экспедиция DS. Обнаружение» необходимо загрузить решение на платформу конкурса в разделе «Data Science» до 2 ноября 23:59 (по московскому времени).
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
Уважаемые участники, по итогам проведения сессии вопросов и ответов хотим обратить ваше внимание:
1. Рекомендуем провести синхронизацию обучающей выборки:
- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;
- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;
- в описание задачи на платформе добавлена инструкция по синхронизации датасета.
2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:
Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.
3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:
Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.
Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.
Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".
Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
1. Рекомендуем провести синхронизацию обучающей выборки:
- в названиях файлов лидарных изображений исключены кириллические символы при указании типа хилшейда;
- в папке 006_МАКЕЕВО_FINAL исключены противоречия UTM-зон, корректная UTM-зона — 36N;
- в описание задачи на платформе добавлена инструкция по синхронизации датасета.
2. Как учет разных типов разметки (markup_type) влияет на расчёт метрики:
Все полигоны из разных типов разметки (LiDAR, аэрофотосъемка, спутниковая съемка) объединяются в рамках одной географической области и класса объектов, после чего расчет метрики ведется по объединенному набору. Тип разметки (markup_type) математически не влияет на итоговую метрику, так как IoU, precision, recall и взвешивание остаются неизменными независимо от дополнительной группировки.
3. Что будет с метрикой, если полигоны дублируются с небольшим смещением:
Когда несколько полигонов пересекаются с одним объектом из ground truth, только один становится True Positive, остальные - False Positive. Это снижает Precision и итоговый F2-score пропорционально количеству дублей. Каждый дополнительный дубль увеличивает FP и ухудшает метрику.
Участники могут использовать собственный алгоритм объединения пересекающихся полигонов с некоторым порогом IoU, либо применять алгоритм Non-Maximum Suppression (NMS) с учётом confidence scores.
Крайне важно учитывать различные источники данных для улучшения качества сегментации модели. Разные источники данных (LiDAR, аэрофото, параметр markup_type) в метрике не учитываются, все объекты региона и подрегиона обрабатываются вместе. Группировка идет по ключам "region_name", "sub_region_name" и "class_name".
Обязательно объединяйте полигоны из разных источников на вашей стороне перед отправкой, чтобы не получать штрафы за дубликаты распознанных с различных источников данных объектов.
👍1
Уважаемые участники конкурса «Экспедиция DS. Обнаружение»
Информируем вас о следующих обновлениях материалов конкурса:
1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:
- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).
2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.
Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.
Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.
Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.
3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
Информируем вас о следующих обновлениях материалов конкурса:
1. Опубликован обновлённый Технический регламент, изменения коснулись Приложений 4 и 6:
- Приложение 4: в рамках квалификационного этапа при расчёте метрики теперь отсутствуют штрафы за false positive по разметке классов «пашни» и «дороги».
- Приложение 6: обновлены требования к интерфейсу управления исходным кодом команд, занявших 1 или 2 место и претендующих на выплату премии (предоставляется в соответствии с п. 3.12).
2. На платформе опубликовано бейзлайн-решение, которое даёт ненулевой скор на публичной валидационной выборке, обязательно ознакомьтесь с ним.
Решение основано на ultralitycs yolo-segmentation и обучалось на датасете, конвертированном из обучающей выборки «как есть», без дополнительной разметки и фильтрации, с аугментациями по умолчанию в течении 50 эпох на Nvidia GeForce 3060 12Gb.
Оно призвано показать участникам минимальный базовый подход для работы с реальными геопривязанными данными на примере набора хилшейдов. Показаны основные типовые шаги решения задачи: дайнскейлинг и выравнивание изображений, менеджмент CRS и UTM зон, нарезка на тайлы с перекрытием, пересчет контуров растровых масок в векторные полигоны, дедупликация и объединение полигонов, обратная конвертация в географические координаты, формирование итогового файла, который корректно считается метрикой.
Обращаем внимание, что у выбранного подхода множество недостатков, и нет обязательства его использовать.
3. Обновление датасета: в папке обучающей выборки 038_ЕЛИЗАВЕТИНСКОЕ_FINAL заменён tif-файл современного ортофотоплана на оригинал без разметки в высоком разрешении.
👍2👏1
Уважаемые участники, обращаем ваше внимание:
1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.
Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.
2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.
Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.
На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
1. Для корректной работы алгоритма расчёта метрики в рамках одного markup_type (например, 3 объекта немецкой аэрофотосьемки) нужно объединять полигоны в точках пересечения между разными снимками, то есть вы должны получить маску объектов, которая лежит на всех трёх изображениях.
Для разных markup_type полигоны объединять НЕ нужно, даже если эти полигоны где-то пересекаются, их объединение приведет к ошибкам в расчёте метрики.
2. Некоторые участники сталкиваются с ошибкой, по которой файл объединенной разметки .geojson обрывается посередине Feature из‑за принудительной остановки контейнера при использовании в скрипте solution.py json.dump() с инкрементальной записью. При прерывании контейнера файл result.geojson остаётся незакрытым и сохраняется, но является невалидным.
Мы рекомендуем в таком случае использовать подход атомарной записи, предварительно сформировав result.geojson в памяти целиком, а затем сохранив его за один раз через with open(...): f.write(). И напоминаем, что для сохранения любых файлов, в том числе и файлов логов, необходимо использовать специально отведенную для этого папку tmp.
На платформе опубликован модуль для безопасного сохранения GeoJSON файлов save_geojson.py, который реализует корректную функцию атомарного сохранения файла, его можно использовать в решении.
Уважаемые участники!
Важные объявления на сегодня:
1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:
- до 6 успешных попыток
- до 20 попыток всего
- обнуление происходит каждые сутки
2. Обновлены датасет и разметка обучающей выборки:
- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)
3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.
Важные объявления на сегодня:
1. Лимит попыток в рамках квалификационного этапа увеличен в два раза до окончания приёма решений 2 ноября 23:59 МСК, решение принято экспертной группой:
- до 6 успешных попыток
- до 20 попыток всего
- обнуление происходит каждые сутки
2. Обновлены датасет и разметка обучающей выборки:
- 006_Макеево — удалена дублирующаяся разметка
- 048_Тимерево — добавлены точки .las более высокого разрешения
- 075_Изборск — удалена дублирующаяся разметка
- 081_Челюскинец — файлы данных заменены на корректные (SpOr)
3. Отдельно обращаем ваше внимание, что в валидационной выборке финального этапа присутствуют группы объектов, которые размечены одним полигоном, по классам «архитектура» и «ямы». Все остальные классы размечены отдельными полигонами. Примеры групповой разметки из обучающей выборки представлены на приложенных скриншотах.