LightAutoML framework
3.21K subscribers
32 photos
3 videos
6 files
120 links
Download Telegram
Всем привет, коллеги! Хотел бы поделиться важной инфой, о которой мб не все в курсе - для того, чтобы радовать других людей своими апвоутами (и чтобы их засчитывал Kaggle и учитывал в общем количестве), вам необходимо добраться до статуса Contributor из изначального статуса Novice. Как это сделать, рассказывает прикрепленная к посту картинка
Доброе утро, товарищи! Quick reminder: сегодня в 19.00 пройдет второй вебинар курса, на котором я расскажу о практическом примерении LightAutoML для решения различных задач (в том числе и активных на текущий момент соревнований на Kaggle). Также будет разобран better_baseline для текущей домашки по предсказанию стоимости машин. Приходите - будет интересно 😎
Через 10 минут начинаем наш второй вебинар с Александром Рыжковым: "Практикум по решению основных ML-задач"

Ждем всех по ссылке в 19.00
Добрый вечер всем!

Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки

Ну и на закуску ссылка на датасет с конфигами ламы.

P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩
Всем привет, коллеги!

Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).

В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать automl.reader.class_mapping, который будет None, если замены не было, и dict-ом в случае замены.

Будьте внимательны 🧐🤓😎
👍1
Всем привет!

Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.

Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.

Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓
Через 10 минут начинаем наш третий вебинар с Дмитрием Симаковым «NLP и CV пресеты LightAutoML: теория и практика»! 
Ждем вас в 19.00 по ссылке
AutoNLPandCV.pdf
1.7 MB
Добрый день!

По мотивам вебинара про NLP:

Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента 'path_to_save' нейронной сети. Кроме того, ноутбук демонстрирует работу методов интерпретации. Интересный вывод, что на сложность восприятия текста сильно влияют артикли и местоимения.
2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).

Скор на паблике: 505.

А также презентация с первой части вебинара.
Всем привет! Сегодня ночью завершилось наше первое домашнее задание соревнование. В топ-5 вошли:
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry

Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍

Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.

Аппетит приходит во время еды :)
Привет! Напоминаем, что в 19.00 сегодня у нас будет вебинар про отчеты, мониторинги в LightAutoML - радости разработчика моделей 📊📈.

Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!

Ждем всех в 19!
Начинаем через 10 минут!
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.

Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!

Ждем вас в 19.00 по ссылке.
Ребят, всем добрый вечер! Очень большая просьба писать в репозитории (в ишьюсах, в пуллреквестах, в комментах и т.п.) на английском. Нас там читает весь мир и хочет понимать 🙏
Большое спасибо всем, кто сегодня вырвался из трудовых будней послушать как за пару-тройку строчек кода построить иногда такие срочно-необходимые🚨 в работе отчеты по моделям.

Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость

Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов

Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨‍💻.

- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!


Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉
Всем привет.

Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space

Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new

без регистрации и смс, и выложат в записи думаю позже
Привет. ❗️Напоминаем, сегодня в 19.00 состоится наш вебинар: Что находится под капотом LighAutoML?

Расказывать о внутренностях, препарировать LightAutoML будет Антон Вахрушев, буквально после майских праздников получивший заслуженное звание Kaggle GrandMaster!🎖

Приходите, задавайте вопросы об устройстве пресетов, алгоритмов, как вытаскивать при необходимости нужную инфу из отработавшего пайплайна LightAutoML!🚀
🔥НЕ ПРОПУСТИ! Присоединяся по ссылке через 5 минут разбирать на чаcти LightAutoML с Антоном Вахрушевым!

Стартуем вебинар LightAutoML: что под капотом?🚀
LAMA_from_inside_v1.pdf
19.8 MB
Привет!
Пермутейшн, селектор, бэндинг, стэкинг - как на самом деле работает LightAutoML? Почему результат так прекрасен и хорош в сочетании с ДатаСатанистом? 🤔

Ловите презентацию👇 Антона Вахрушева о том, как устроена LAMA, и что стоит за быстрым качеством.

Пользуйся, спрашивай - задавай повестку для лекции про кастомные пайплайны🤖
Всем хорошего вечера пятницы 😎
Сегодня открылось очень короткое (на выходные) , но супер подходящее нам соревнование - Jobathon от Analytics Vidhya (ссылка на соревнование).
Требуется предсказывать по банковским данным будет ли клиент заинтересован в оформлении кредитки.
Данных довольно много - ~250к строк в трейне
Метрика ROC-AUC

It's LightAutoML time 🤩
Всем добрый вечер! С днем защиты детей от ручного data science :)

Сегодня классически началось новое соревнование Tabular Playground Series June 2021 - инкласс соревнование на табличных данных. Большой датасет, целочисленные фичи, мультикласс классификация на 9 классов - вкуснятина. Пример на LightAutoML уже готов и висит в топе среди кернелов - самое время залетать и искать необычные паттерны в фичах.

Важный момент: кернел является примером использования LightAutoML на GPU. Правда фокус в том, что делать вам ничего не придется, кроме включения GPU в кернеле - LightAutoML сам поставит Catboost в режим GPU расчета.