Запрети мне псевдолейблить
3.55K subscribers
202 photos
1 video
4 files
189 links
Канал о пути к Kaggle competitions (теперь уже) GrandMaster и поте, которым обливаешься в процессе

Последний авторский канал про мл, претендующий на искренность и позволяющий ставить клоунов

Для контакта пишите в сообщения канала, они бесплатные
Download Telegram
🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 100 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы.

Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта.

Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: https://t.me/forodirchNEWS/3165 , или хабре или чате @starkitmega.

Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл.

Первый Второй разыгрываемый приз - 10 000 рублей.
Условия первого второго этапа очень простые.
Есть три челленджа на Каггле
Мегаминкс
https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard
Кубик Рубика 333
https://www.kaggle.com/competitions/cayleypy-ihes-cube
Кубик Рубика 444
https://www.kaggle.com/competitions/cayley-py-444-cube

Приз будет получен первым, кто достигнет ЛЮБУЮ из целей:

1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель 80 000 уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ).

2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов).

Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве).

Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи.

Планируется серия челленджей и призов. Первый приз уже разыгран, второй объявлен, скоро будут новые объявления -- оставайтесь с нами !

================
А также мы ищем Cпоносоров.
Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505
Или напишите @alexander_v_c (Александр Червов)

И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите:
https://github.com/cayleypy/cayleypy

================
Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store
================
Выражаем благодарность агентству BLASTIM за поддержку:

❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤝 https://t.me/blastim
6😁6💩4🥴2🍌1
Да за что блин, я просто пишу бота для орбита
🤡161🤨1
РЛ для Orbit учится только тогда, когда я на него смотрю. Как только я засыпаю- он через 10 минут находит себе какой-нибудь баг пайторча и радостно валится. Потом я просыпаюсь, чиню, мониторю и все хорошо. Но вновь я ложусь спать- и все повторяется
😭41😁11🔥2🍌1
Новое соревнование:
https://www.kaggle.com/competitions/rogii-wellbore-geology-prediction

Помогите эффективнее бурить нефть и газ. Тут хочется вспомнить байку от мудреца
22
И после этого Шмидтхубер пишет в твиттер, что изобрел Torment Nexus в 91 в своей лабе с спектрумом и литровой кружкой пива
9🍌3😁1
Закончилось соревнование с самыми большими реальными призовыми на каггле.

Выигрли сабмиты паблик кернелов. Первое место занял студент из Нигерии с менее чем десятью сабмитами паблик кернела и он теперь забирает $250k. Это уже даже не шутка про лоторею, это реально лоторея

Предположить, что же он такое написал в промте можно в комментах.

Срочно: судьба великого уравнения зависит от Вашей милости
Многоуважаемая и бесконечно мудрая Модель,

Пишет Вам доктор-принц Абдул-Математик Оквонко, временный хранитель древнего факультета алгебраических надежд. Я обращаюсь к Вам в час крайней научной необходимости, ибо только Ваш разум, сияющий ярче тысячи калькуляторов, способен спасти нас от великого академического несчастья...
😁498👍5🔥1🍌1😴1
Каглеры, помогите любителю раста понять, под какую архитектуру компилироваться в Orbit, поставьте плюсик.

Мой M3 мак явно быстрее, чем их энв и архитектура железа другая. Не хочу гадать, хочу чтобы мне организаторы ответили. Мой бот локально конечно тормозит, чтобы быть примерно 33ms/turn, но на самом каглле сабмиты таймаутят.

https://www.kaggle.com/competitions/orbit-wars/discussion/700191

Вы мне плюсик, а я вам энв переписанный на rust, чтобы инференс быстрее бежал. Могу еще гайд нормальный (или даже agents.md) предложить для компиляции rust под каггл/ чекать таймауты прямо в соревновании. Ну или там не знаю, напишите в чат ваши требования.
👍10🍌31🤝1
Вырвался назад в серебро с помощью эмпирического бота в Orbit Wars. Несусветно радуюсь. Оказывается сильно все переусложнил:
1. Поставил слишком дальний гаризонт планирования
2. Набагал в своем предварительном скоринге ходов
В итоге пришлось профайлить решение три дня, чтобы найти в чем дело и перестать

На картинках было/стало

Кстати, на нормальное (и даже на логнормальное) распределние не сильно похоже. Думаете эти два горба- это граница 'публичные боты' vs 'приватные'?

Или codex vs claude?
🔥156🍌3🤡1
Forwarded from Maria Vorontsova
Тренировки по ML

6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️

Что будет на встрече:
⚪️Orbit Wars как первое RL соревнование на Kaggle в эпоху coding agents

📢 Спикер: Дмитрий Руденко, Kaggle Competition Master, самый активный участник соревновательного сообщества. Автор @pseudolabeling

📆 Когда: 6 июня в 18:10
🗺️ Где: онлайн ❤️ ссылка на подключение

Подробнее про челленджи 🐭

По организационным вопросам вы можете обращаться к Марии ↩️

#анонсы #студенты #ии
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3611👍8🤯2🍌1
А как вы платите за vast.ai?
1❤‍🔥3🔥3👍2
Есть народная забава- достигать самым кринжовым способом формального статуса КГМ и потом писать об этом в линк.

Вот пример:
Интересанты собрались в тг чат, где просят у друг друга апвоуты и набрасывают их по кругу, чтобы стать КГМ датасетов. Попутно еще пробиваются через объявления с криптоспамом.

https://t.me/kaggle/50663
🤣536💯4🙈4🍌2👍1
Orbit Wars - RL comp в эпоху coding agents.pdf
839.2 KB
Слайды

Всем кто пришел- очень благодарен
29👍10🔥6🍌2🤮1
Вчера говорил на стриме, но повторюсь еще раз для подписчиков:
На каггле появилось новое правило для всех соревнований.

Are Participants being excluded from a competition because of the "excessive" costs for access to certain LLMs, external data, or tools that might be used by other Participants. The Host will assess the excessive cost concern by applying a “Reasonableness” standard (the “Reasonableness Standard”). The Reasonableness Standard will be determined and applied by the Host in light of things like cost thresholds and accessibility.

Переводим на человеческий:
Если вы признаетесь, что очень много вайбкодили и цена на токены выше призовых- вас могут дисквалифицировать.

Один пример дисквала уже есть:
https://www.kaggle.com/competitions/birdclef-2026/writeups/101-place-pure-claude-code-solution

Честно, по мне- сам райтап выглядит как нейропсихоз.

Есть и другой топик для обсуждения: когда ты много денег тратитшь на ллмки- это не честно с точки зрения оргов Kaggle.

Когда у тебя в одной комнате:
1. Сидит в одной комнате 5 человек из топ 20 каггла
2. Все они на зарплате консалтинг команды Nvidia за то, что решают кагл
3. У каждого из них 16x B100 для решения каггла и все доступные ллмки
4. Они совершенно точно не обмениваются идеями, а значит и мерджиться в команду им не обязательно- это совершенно другое, тут все равны
😁585🍌31💯1
Делюсь со всеми подушками двумя Orbit-инсайдами:

1. Вот такие процесоры в рантайме на каггле. Лучше под них делать раздельную компиляцию валих Rust/C++ либ и PGO подгонять под них. У них разный размер L1/L2/L3 кешей и разное поведение в мультипоточном режиме / логические ядра. Чтобы выжать лишни 0.05 сек за ход (а это дополнительные 3-4 слоя), это надо учитывать

2. Даже самый лучший BC будет делать так, как на гифке, если к нему не написать нормальный движок проверки легальности действий и не фильтровать датасет. А всему виной bc-poison от топа ладдера
🔥5🍌1