🏄 Соревновательный Data Science | Kaggle | Чемпионаты
3.26K subscribers
325 photos
54 videos
2 files
325 links
Соревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨‍💻

Наш курс на Stepik:
https://stepik.org/a/108888

Чат:
https://t.me/+UeIeCRykqYEwY2Y6

Для предложений и вопросов: @Aleron_1
Download Telegram
🔛 ЗАКРЫТЫЙ СТАРТ
🕳 ПЛАТФОРМЫ АРЕНДЫ GPU
➡️ 37 ₽ в час

Инвайт-код для подписчиков канала:
➡️ DATAFEELING
Действует до 15 февраля, всего 50 активаций


На платформе:
⭐️RTX 5090 • 32GB GDDR7
⭐️стабильная работа без оверселлинга
⭐️живая техническая поддержка: реальные инженеры, которые помогают с настройкой и запуском

📎 GPUGO.RU
Please open Telegram to view this post
VIEW IN TELEGRAM
5😁1
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
Как агенты Санту катали решали... 🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала…
Продолжение (часть 2) (часть 1)

Лимиты:
Все 3 с PRO подписками
Клод с опусом работает часа 2, потом 5 часов перерыв
Гемини хватило часов на 8, потом 8 часов переыв
Кодекс ещё ни разу в лимиты не упирался, теперь отдельный челлендж добить лимиты кодекса

Решения:
🗿Клод пока самый эффективный - улучшает скор и сидит в медальной зоне. Но реально ленивый - типичный китайский кагглер. Пошел по простому пути, видимо, насмотрелся публичных решений - качает другие паблик сабмишены и стакает их разными способами - сначала был ансамбль из 180 сабов, сейчас уже 430 (причем не брезгует брать сабы коллег)

📖 Кодекс старается в сложные решения, пишет код на плюсах - свои оптимизаторы. Качает и ставит библиотеки, которые видел в публичных решениях. Сегодня новая фишка - берет лучшие сабы от клода и гоняет их через свои оптимизаторы и получает скор выше в 4-5 знаке - так попал в медали

🔠 Гемини тоже идёт по сложному пути пишет код на плюсах, что интересно много удаляет (часто просит права на rm) - подчищает за собой. Очень долго самостоятельно что-то писала, тестила, в итоге сделала решения с немедальным скором и говорит - вот мол стабильное решение, каггл принимает, предлагаю на этом и остановиться)) Либо запустим мой скрипт на сутки на 48 ядер ...

Система:
Каждый работает в своей папке, у каждого подключен kaggle mcp. В общем доступе имеют PLAN.md с идеями и таблицу с лучшими сабмишенами, чтобы не отправляли, если скор не улучшен - видимо, через неё воруют друг у друга сабы)) Втроём уже намолотили почти 400 сабов.

Оставалось 2 дня...
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥4😁2
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
Как агенты Санту катали решали... 🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала…
🏁 ИТОГИ: (часть 1) (часть 2)

Codex взял бронзу 🥉
Claude Code шёл хорошо, но за день до конца сказал - отдыхаю до 2 февраля.
Gemini так ничего толкового не выдала, долго работала, зацикливалась на исправлении себя (на скриншоте как-будто понятно почему)

Gemini имеет внутри гугл-поиск и догадалась после пинка зайти в дискашены и посмотреть идеи решений, написала план реализации, но реализовать их без ошибок так и не смогла.

Codex написал себе оптимизатор и прогонял батчи с разными гиперпараметрами, улучшая по тысячным долям каждую итерацию, так по-тихоньку зашёл в бронзу. Но перед каждым батчем спрашивал: Что берём следующий батч? Хотя много раз писал ему, чтобы не спрашивал и сам работал дальше - задолбал!

На троих сгенерили 2500 файлов.
Так и не смог упереться в лимиты кодекса, в последние 2 дня поставил самый High Thinking и всё равно не смог.

В Gemini походу не настроили ещё нормальную работу с кэшем, поэтому она постоянно исправляла себя и получала ту же самую ошибку, даже один раз написала: Опять упало. What's going on? )) Такое же замечал при работе с нанобананой.

В четвертой части опишу инструменты и какие-нибудь ссылки дам...
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥102
🏄 Соревновательный Data Science | Kaggle | Чемпионаты
Как агенты Санту катали решали... 🎅 (часть 1) Привет, Чемпионы! 🏆 Недавно закончился Santa 2025 на Каггле - снова решали оптимизационную задачу: надо было разложить ёлки по коробкам разных размеров без пересечений. 🌲 Долго собирался её порешать, сначала…
Часть 4 - техническая

Изначально каждый агент сам писал себе спеку - по запросу: вот такая задача на каггле, вот есть Kaggle MCP (про него отдельно), столько-то попыток в день, данные и.т.д - справлялись довольно неплохо, иногда просил внести изменения, например, чтобы вели общий реестр и без улучшений не отправляли.

Потом когда уперлись в потолок по скору, захотелось прикрутить фазу рисерча идей - нашёл вот такой вариант интересный - перплексити не подключал, заменил на встроенный гугл-поиск из Gemini.

Агентов развернул на серваке, чтобы могли автономно работать и не зависели от включенного компьютера.
В первый заход хотел, чтобы агенты использовали ресурсы каггла для запуска кода, т.е. писали ноутбуки и запускали на каггле по мсп, потом сами смотрели результат и корректировали. Но Каггл в своём репертуаре, MCP сервер запустили, а работает он пока через одно место. 🤢
Ноутбук создавать и отправлять можно, но вот прикреплять к нему датасет нельзя, хотя все методы для этого прописаны - поддержка завалена запросами: "А почему оно не работает?" - ответ: "да знаем, что не работает, и вообще так и задумано" 🤯 А методы, которые работают, бывают недоступны по полдня, Codex в какой-то момент задолбался сабмитить по MCP и написал себе сабмитилку по старому-доброму Kaggle API и ей пользовался.

В целом, опыт интересный - теперь хочется настроить такой пайплайн для код компетишенов.
Делитесь своим опытом и находками в специальном топике "Кагглим с Клодом" в чате.
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4
Forwarded from ArenaGo
Всем привет,

На ArenaGo стартовало соревнование по трейдингу с денежными призами, присоединяйся🔥

Все что нужно сделать:
1. Зайти на arenago.ru
2. И надрать зад всем участникам🙈

Торговать можно руками и алгоритмами через API. Есть робот для бейзлайна, ты можешь его прокачать с ИИшкой и вырастить монстра, который порвет всех и не оставит шансов

Лидер сейчас еле наколбасил +2%, знаю ты можешь лучше😎

P.S. Самые ленивые могут собрать портфель в два клика и наблюдать за шоу с попкорном😁
Возможно тебе повезет больше всех и уйдешь с призом😇

Увидимся на арене,
❤‍🔥543
​​Обзор соревнований по ML за 2025 год

Есть такая платформа - https://mlcontests.com/, там можно увидеть список актуальных идущих соревнований по ML. Автор выускает ежегодный обзор по соревнованиям. Вот ссылка на мой пост про обзор 2023. 2024 я как-то пропустил, но вот сейчас увидел обзор за 2025: https://mlcontests.com/state-of-machine-learning-competitions-2025/?ref=mlcr25

Из интересного:
• В табличных соревнованиях всё ещё царят бустинги, но нейронки всё активнее используют в блендинге/стакинге
• Некоторые компании (не будем тыкать пальцами, но мы-то знаем) дают своим людям резиновое железо для соревнований. Например, победители одной соревы поделились, поделились тем, что тренировали 48 hours на 512 H100.
• Эпоха BERT в основном прошла, теперь люди активно используют Qwen2.5 и 3
• В соревнованиях по Computer Vision впервые доля решений с транмформерами превзошла долю решений с CNN
• В соревнованиях по аудио в основном используют затюненый Whisper

В отчёте ещё много всего интересного, рекомендую почитать.

#kaggle #datascience
8❤‍🔥3
Привет, Чемпионы! 🏆

🏀 March Machine Learning Mania 2026: Ваш шанс на Solo Gold в главной Data Science лотерее! 🎰


Самое азартное соревнование года на Kaggle уже идет!
Это тот редкий случай, когда новичок может обойти грандмастера, а простой
логистической регрессии иногда достаточно для топа.

Почему стоит участвовать?
Это классическая "лотерея с элементами науки". NCAA Tournament - это хаос: идеальных моделей не существует, но грамотный пайплайн повышает ваши шансы поймать удачу за хвост и забрать Solo Gold 🥇.

🚀 Что работало в прошлые годы:

1. Seeds (Посев) - это база. Разница в посеве команд (Seed Diff) исторически дает самый сильный сигнал.
2. Продвинутая статистика. Не смотрите просто на победы. Считайте OffRtg и DefRtg (очки на 100 владений). Эффективность важнее количества очков!
3. Massey Ordinals. Для мужского турнира рейтинговые системы (Massey, KenPom) работают лучше сырой статистики.
4. Ансамблирование. Связка XGBoost + CatBoost + Logistic Regression (для калибровки) - золотой стандарт. Бустинги ищут нелинейности, а LogReg не дает модели "перемудрить".
5. Не будьте самоуверенны! Метрика Brier Score жестоко наказывает за уверенные ошибки. Никогда не ставьте 0% или 100% (клипайте предсказания в [0.025, 0.975]).


📅 Дедлайн:
Модели принимаются до Selection Sunday (середина марта), когда объявят сетку турнира. Сейчас самое время "полировать" фичи на исторических данных!

🔗 Ссылка на соревнование:
https://www.kaggle.com/competitions/march-machine-learning-mania-2026


Кто в деле? Кидайте свои идеи в комменты! 👇
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥84
🚀 Открыта регистрация:
Agentic Legal RAG Challenge 2026

Если вы строите RAG / agentic pipelines (ingestion → retrieval → generation) и вам важны метрики, близкие к реальному продакшену, это соревнование для вас.

Что именно оценивают:
Answer quality — насколько ответ корректный по сути
Grounding / faithfulness — подтверждён ли ответ конкретными фрагментами из юридических источников (c citations / chunk-level evidence)
Latency / TTFT — скорость, включая time-to-first-token (как быстро система начинает отдавать ответ)

Формат: Online участие / Live leaderboard + финальная проверка на private test set (без возможности “подгонки под паблик”)

Данные: 300+ юридических документов и 1 000+ вопросов

🏆 $32 000 призовой фонд — один из крупнейших в мире в сегменте Legal RAG/Agentic

📅 Период соревнования: 11 - 25 марта 2026 (регистрация уже открыта)

👉 Детали и регистрация: www.agentic-challenge.ai

Если у вас команда и уже есть свой стек (embeddings / vector DB / rerankers / LLM / tooling) — отличный шанс сравнить подходы на нормальной постановке и метриках.
👍1
Forwarded from Samvel K
NVIDIA Nemotron Model Reasoning Challenge
https://www.kaggle.com/competitions/nvidia-nemotron-model-reasoning-challenge

Featured соревнование от NVIDIA. Улучшаем ризонинг модели через LoRA.

Хорошие призы ($$$$ и 9 железок), дополнителный компьют участникам (30 часов в неделю на RTX Pro 6000)

• 1st Place - $25,000 + 4 DGX Sparks
• 2nd Place - $15,000 + 3 DGX Sparks
• 3rd Place - $5,000 + 2 DGX Sparks
👍12
На Kaggle новая драма — соревнование по разметке данных для боевых дронов

https://www.kaggle.com/competitions/leonardo-airborne-object-recognition-challenge

Официально задача звучит так: нужно построить модель, которая будет находить и классифицировать объекты на съемке с летательных аппаратов. В списке классов:

1. люди
2. летательные аппараты
3. дроны
4. машины
5. корабли
6. препятствия для самого носителя камеры — башни, скалы и т.д.

Проблема в том, что все и так прекрасно понимают, для чего сегодня особенно востребованы такие платформы с видео- и фотосъемкой и опцией подсветки снизу.

В датасете почти сразу нашли несколько довольно интересных последовательных кадров — они как раз приложены к посту. После того как началось публичное возмущение, Kaggle на время притормозил соревнование. Сейчас к нему уже нельзя подключиться заново, но те, кто успел зайти и что-то засабмитить, по-прежнему могут продолжать.

Отдельно стоит посмотреть на заказчика — Leonardo Helicopters, итальянскую многоцелевую компанию.
Во-первых, 30% компании принадлежит правительству Италии.
Во-вторых, Leonardo участвует в сотрудничестве с Baykar: у них совместное предприятие 50/50, а сама Baykar — производитель Bayraktar.

Из этого для россиян вытекают и вполне конкретные правовые риски. В действующей редакции статьи 275 УК РФ государственная измена — это не только шпионаж или передача гостайны, но и оказание иностранному государству, международной или иностранной организации финансовой, материально-технической, консультационной либо иной помощи в деятельности, направленной против безопасности РФ. Отдельно статья 275.1 УК РФ наказывает за конфиденциальное сотрудничество с иностранной организацией в целях такого содействия. А статья 189 УК РФ отдельно криминализует незаконную передачу иностранному лицу технологий, работ или услуг, если на них распространяется экспортный контроль.

Ну и в целом все это выглядит как жалкая пародия: несравненный оригинал на эту тему уже когда-то проводила ЧВК «Вагнер».

Мое мнение кстати простенькое:
Кагл хорошая платформа для поиска новых идей, но детекция/классификация объектов тема изъезженная. Думаю тут сорева нужен для хаеринга, а не топ решений/идей. Были бы нужны топ решения/идеи- на инференс давали бы больше ограничений, чем 9 GPU/Hours. Правда, есть и приз за быстродействие, но он считается среди топ участников отдельно.
🤯6😁1
Forwarded from Samvel K
Как Chris Deotte на 4x A100 с агентами в плейграунде побеждал
19❤‍🔥1
Forwarded from Samvel K
Конец истории:

После тщательного рассмотрения мы приняли решение прекратить проведение конкурса Airborne Object Recognition Challenge.
6
Выиграй деньги, став чемпионом ИТ-соревнования от МТС

Остались считанные дни до окончания регистрации — призовой фонд 1 500 000 рублей.

True Tech Hack — это три уникальные задачи для инженеров данных, разработчиков и системных аналитиков. За лучшие решения дают деньги и зовут на стажировку. Для всех финалистов — закрытая вечеринка с диджеем в Москве на видовой площадке.

Среди всех, кто зарегистрировался, разыгрывают 2 приставки с геймпадами для облачного гейминга МТС Fog Play и 10 подписок по 20 часов игры.

Регистрация закроется 10 апреля в 10:00 — торопись!
20 апреля в Москве — AiConf 2026

Практическая конференция по Data Science: мастер-классы, воркшопы и живой нетворкинг вместо пассивных лекций.
Что в программе:

— мультиагентные системы и RAG — от архитектуры до продакшена
— как «приручить» LLM и получать предсказуемые результаты
— работа с данными: от хаоса к работающей модели
—как обосновывать технологические решения бизнесу
— экономика AI: считаем и оптимизируем инфраструктуру

Уходите не с записями, а с конкретными инструментами и планом «что делать завтра».
400+ участников. Спикеры из Сбера, Яндекса, VK и других команд.

🎟 Билеты и подробности — на сайте конференции.
❗️ Промокод на скидку 15%: "2026"
🎉2
🚀 Серия соревнований по МЛ ! Денежный призовой фонд больше 100 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы.

Приглашаем Вас принять участие в серии челленджей.

Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении https://t.me/forodirchNEWS/3165 , хабре или в чате @starkitmega.

Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл.

Первый разыгрываемый приз - 10 000 рублей.
Условия первого этапа очень простые.
Есть три челленджа на Каггле
Мегаминкс
https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard
Кубик Рубика 333
https://www.kaggle.com/competitions/cayleypy-ihes-cube
Кубик Рубика 444
https://www.kaggle.com/competitions/cayley-py-444-cube

Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:
1 Или в конкурсе Мегаминкс - кто достигает скор 80 000 - и опубликует публичное решение
2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов).

Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве).

Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи.

Планируется серия челленджей и призов. Когда первый приз будет разыгран - мы объявим о втором этапе.

================
А также мы ищем Cпоносоров.
Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505
Или напишите @alexander_v_c (Александр Червов)

И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите:
https://github.com/cayleypy/cayleypy

================
Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store
================
Выражаем благодарность агентству BLASTIM за поддержку:

❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤝 https://t.me/blastim
😁5👍1