LightAutoML framework
3.22K subscribers
31 photos
3 videos
6 files
119 links
Download Telegram
Live stream started
Live stream finished (2 hours)
Media is too big
VIEW IN TELEGRAM
Доброе утро, коллеги!

Делимся с вами записью вебинара про AutoML Grand Prix, прошедшего в пятницу, в двух форматах - в формате видео и формате подкаста.

Еще раз спасибо за интересные вопросы и рады, что вы провели эти незабываемые 2 часа с нами 😍

Happy Kaggling 🦙
21👍10🔥5🎉2
🚀 LightAutoML снова покоряет вершины! 🚀

Мы рады сообщить, что LightAutoML ворвался в ТОП-5 самых популярных решений в категории "ML и алгоритмы" по мнению исследователей из ИТМО, заняв почетное второе место!

Но это еще не все! LightAutoML также стал лидером среди самых часто используемых решений Сбера — одного из ключевых игроков в сфере Data/ML, который активно создает свои открытые решения и участвует в опенсорс-разработках.

Присоединяйтесь к нам и открывайте новые возможности в мире машинного обучения! 🌟
🔥276👍5
Forwarded from Maxim.ML - канал
Как новички в Data Science решают сложные задачи: результаты моих студентов в ML соревновании 📊

Какие подходы пробуют применять стажеры и джуны в Data Science соревнованиях с табличными данными? Я принёс инфографику моих студентов, которая иллюстрирует их работы в финальном соревновании курса 📈

🔍 Предыстория
В прошлом учебном году я вел блок занятий по Machine Learning на одном из курсов. Чтобы отработать навыки студентов, я запустил inclass соревнование. Студенты решали задачу бинарной классификации — для многих это был первый подобный опыт.

Почти все подходы студентов были связаны с алгоритмами градиентного бустинга. В топ 3 решений попали ансамбли, automl и catboost 🏆

Если вам понравилась визуализация, python код для ее воспроизведения доступен на моем GitHub. Сделать такую же инфографику проще, чем вы думаете!
🔥12👍65
🚀Команда Сбера🚀выложила в open-source самый большой датасет, содержащий мультимодальные банковские данные ЮЛ.

🔥Multimodal Banking Dataset (MBD)🔥

Датасет состоит из обезличенных исторических данных, содержащих следующую информацию по клиентам ЮЛ за 12-24 месяцев:
📌транзакционная активность (transactions);
📌эмбеддинги диалогов (dialogs);
📌гео-активность (geostream).

Таргет: предсказать для каждого пользователя взятие каждого из четырех продуктов в течение месяца после отчетной даты. Исторические данные за 2022 находятся в targets.

Датасет на HuggingFace:

🖥https://huggingface.co/datasets/ai-lab/MBD (14,6 GB, основной датасет)
🖥https://huggingface.co/datasets/ai-lab/MBD-mini (3,38 GB, уменьшенная версия, 10% клиентов из основного датасета)

Датасет опубликован под лицензией Creative commons 4.0, доступен для использования в научных работах, экспериментах итд.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥504👍4🤩2🎉1
Доброе утро мир 😎

Интересное событие для студентов появилось на горизонте в оооочень близкой перспективе - хакатон от Альфа-банка по написанию своего AutoML (хотя думаю можно использовать и некоторые заготовки 🦙)

Подробная информация ниже 👇
👍6🔥4🤩2😱1🎉1
Forwarded from Нескучный Data Science (Евгений Смирнов)
🚀 Запускаем соревнование по AutoML для студентов

🌿 Настало время оправдать название курса AutoML in Practice и закрепить полученные в нем знания. Каждый курс от Лаборатории обязательно подкрепляется соревнованием по анализу данных и в этом году мы не стали делать исключение. Уверен, оно вам точно зайдет, ведь на этот раз его готовили исключительно kaggle-мастера из нашей команды. Соревнование будет состоять из отборочного онлайн-этапа и очного офлайн-этапа.

1️⃣ В отборочном испытании вам предстоит решить одну из трех наших актуальных задач:

🔹Кредитный скоринг ЮЛ (вероятность дефолта, PD модели)
🔹Склонность физических лиц к инвестициям (Look-alike модели)
🔹Отток юридических лиц из расчётно-кассового обслуживания (CLTV модели)

2️⃣ В финальном этапе участники соревнования напишут свой AutoML, который сможет решить 15 различных задач.

Распределение призовых:
🥇1 место - 250 000 ₽
🥈2 место - 150 000 ₽
🥉3 место - 100 000 ₽

🗓Ключевые этапы:
🔹 22-31.10 — Подача заявок (дедлайн)
🔹 1-12.11 — Отборочный этап - онлайн
🔹 18.11-7.12 — Финальный этап -онлайн
🔹 7-8.12 — Финальный этап - офлайн

🚫Ограничения: К участию допускаются студенты 18-25 лет.

👉 Регистрируйся по ссылке на соревнование сейчас, чтобы закрепить полученные знания из нашего курса.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍42👎2🤩1
👋 Всем привет!

🎁 Принесли вам под елочку релиз LightAutoML 0.4.0, в котором:
* Поддержка Pandas v2+, LightGBM v4+, python: 3.8 - 3.12
* Добавлен XGBoost в качестве MLAlgo
* Автоматический маппинг колонок на выходе мультикласса (теперь не нужно использовать руками длинные конструкции с class_mapping)
* Автосохранение модели сразу после обучения (path_to_save в fit_predict) -- больше вы не потеряете результаты обучения
* OptunaTuner толерантнее к падениям триалов (параметр fail_tolerance)
* Автоматическая подстройка параметра кросс-валидации для работы в малым числом исходов
* HypEx выделился в отдельную библиотеку
* И много-много фиксов небольших багов

🎄с наступающим Новым годом!
32🔥21🎉8🤩3
Добрый день, коллеги!

От лица команды LightAutoML поздравляю всех с наступающим 2025 годом! Хотим пожелать вам всем побольше качественных датасетов, ML моделей и счастливых бизнес-заказчиков 🎄

Со своей стороны мы подвели итоги 2024 года, среди которых можно отметить следующие:

1) Победа на Kaggle AutoML Grand Prix 2024, где мы были единственной командой, выигравшей 2 из 5 этапов

2) Фактически двукратный рост на основном GitHub репозитории sb-ai-lab/LightAutoML

3) Чуть более трети от всех 230k загрузок LightAutoML с PyPI произошли в 2024 году

4) В 2024 году в журнале JMLR вышла статья по прогону OpenML AutoML benchmark, в которой мы попали в топ-3 общемирового рейтинга AutoML решений для различных задач

5) В мае 2024 более недели находились в топе рейтинга Trending Research на сайте paperswithcode.com

6) Руководитель команды LightAutoML Александр Рыжков полностью прошел Kaggle - стал 4x Kaggle Grandmaster (теперь их 10 человек по миру)

Счастливого 2025-ого года и спасибо, что вы с нами 🦙

P.S. Верю в силу 6 рукопожатий - если вдруг кто-то из ваших друзей/коллег еще не знает про lama, приглашайте к нам в канал 🙃
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
37🔥28🎉13
Forwarded from HypEx (Дмитрий Тихомиров)
🚩🚩Последний рабочий день года — пора запасаться полезным чтивом на праздники! 🚩🚩

Иван Юрашку снова радует нас своими статьями на Хабре. 💡 Сегодня вышла вторая часть цикла о Causal Inference. В ней вы узнаете всё про рандомизированные контролируемые испытания (РКИ) — метод, который лежит в основе A/B-тестов и помогает проводить эксперименты правильно. 📊 Примеры на Python включены! 👩‍💻

📌 Читать статью: Ссылка на Хабр🤗

🎄 Почему это стоит прочитать?
Эти статьи идеально подходят для праздничных вечеров с чашкой чая или какао. ☕️ Вместо просмотра бесконечных фильмов — разберитесь, как тестировать гипотезы и оценивать причинно-следственные связи.

💬 А теперь немного магии:
— Накидайте ❤️ реакций, чтобы мы поскорее опубликовали третью статью!
— И поставьте ⭐️ на наш GitHub, чтобы вдохновить нас на новые проекты в 2025 году.👩‍💻

С Новым годом, друзья! Пусть ваш праздник будет не только весёлым, но и полезным.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1510
🎄 С наступающим Новым годом, друзья!

Пусть 2025 станет годом технологических прорывов, гениальных идей и амбициозных исследований!

Создавайте, экспериментируйте, меняйте мир — и пусть ваша нейронка счастья всегда выдаёт 100%!

Спасибо, что вы с нами! 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥29🎉2210🤩2
Всем привет!

Подъехали новости о LAMA из нашего научного канала Лабы ИИ - опубликована статья в журнале уровня Q1, где в экспериментах участвовали модели из LightAutoML 🔥

В канале будем радовать вас интересными новостями из мира AI, делиться обзорами и кейсами.
Подписывайтесь, чтобы быть в курсе! ❤️

Лайк, шер, подписка приветствуются 💬
Please open Telegram to view this post
VIEW IN TELEGRAM
18🔥7🤩3👍2🎉2
Всем привет!

🏆 Коллеги из ICT.Moscow опубликовали подборку из 80 Open Source решений для ИИ-разработки, в которую вошли многие наши open-source проекты:

- Py-Boost
- Stalactite
- RePlay
- Sim4Rec
- RIDE
- ESGify
- MedBench

К сожалению, по неведомым нам причинам в эту подборку не попали еще два флагманских продукта нашей лаборатории (но мы-то о них помним 🙃) - LightAutoML и PyTorch-LifeStream

Также хотел бы сказать спасибо всем тем, кто пользуется нашими решениями и делится обратной связью по ним, позволяя делать их лучше 🫶
25👍10🔥7
This media is not supported in the widget
VIEW IN TELEGRAM
🔥3316🤩8👍6😢5
Привет! Мы очень рады, что вы с нами и хотим отблагодарить вас за ваше внимание! 💚

В честь этого разыгрываем 5 подписок Telegram Premium на год 🔥🔥🔥

Никаких сложных условий! 🎉
Для участия в розыгрыше необходимо:

— Быть подписанным на канал ИИ песочница
— Быть подписанным на канал LightAutoML
— Дождаться результатов

Итоги подведем 12 февраля в 16:00, так что следите за новостями, вдруг именно вы заберёте приз! 🎁
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31🤩6👍5🎉2
🔝Как опыт Avito подтверждает ценность наших open-source продуктов

Команда Avito рассказала на Хабре, как использовала нашу либу AutoWoE для повышения ликвидности объявлений на площадке.

Модель анализирует успешные объявления и подсказывает, что можно улучшить: добавить фото, скорректировать цену, активнее отвечать или включить продвижение. AutoWoE разбивает фичи на бины, оценивает их влияние на отклики и формирует скор-карту инструментов, переведённую в рекомендации пользователям.

A/B-тесты показали рост целевых контактов и увеличение числа сделок.

Круто, когда open-source находит применение в реальных задачах!


#новости
@sb_ai_lab
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥30👍107😢2