LightAutoML framework

Доброе утро, товарищи! Quick reminder: сегодня в 19.00 пройдет второй вебинар курса, на котором я расскажу о практическом примерении LightAutoML для решения различных задач (в том числе и активных на текущий момент соревнований на Kaggle). Также будет разобран better_baseline для текущей домашки по предсказанию стоимости машин. Приходите - будет интересно 😎

1.29K viewsAlex Ryzhkov, 06:26

Через 10 минут начинаем наш второй вебинар с Александром Рыжковым: "Практикум по решению основных ML-задач"

Ждем всех по ссылке в 19.00

Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…

1.36K viewsOlga Plosskaya, 15:51

LightAutoML extreme short Titanic solution

Добрый вечер всем!

Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки

Ну и на закуску ссылка на датасет с конфигами ламы.

P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩

Kaggle

Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster

1.86K viewsAlex Ryzhkov, edited 20:00

Всем привет, коллеги!

Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).

В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать automl.reader.class_mapping, который будет None, если замены не было, и dict-ом в случае замены.

Будьте внимательны 🧐🤓😎

👍1

2.4K viewsAlex Ryzhkov, 12:03

Всем привет!

Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.

Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.

Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓

1.61K viewsOlga Plosskaya, 11:23

Через 10 минут начинаем наш третий вебинар с Дмитрием Симаковым «NLP и CV пресеты LightAutoML: теория и практика»!
Ждем вас в 19.00 по ссылке

1.43K viewsOlga Plosskaya, 15:51

AutoNLPandCV.pdf

1.7 MB

Добрый день!

По мотивам вебинара про NLP:

Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента 'path_to_save' нейронной сети. Кроме того, ноутбук демонстрирует работу методов интерпретации. Интересный вывод, что на сложность восприятия текста сильно влияют артикли и местоимения.
2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).

Скор на паблике: 505.

А также презентация с первой части вебинара.

2.17K viewsДмитрий Симаков, 11:35

Всем привет! Сегодня ночью завершилось наше первое домашнее задание соревнование. В топ-5 вошли:
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry

Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍

Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.

Аппетит приходит во время еды :)

1.32K viewsAlex Ryzhkov, 14:29

Привет! Напоминаем, что в 19.00 сегодня у нас будет вебинар про отчеты, мониторинги в LightAutoML - радости разработчика моделей 📊📈.

Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!

Ждем всех в 19!

1.14K viewsOlga Plosskaya, edited 13:27

Начинаем через 10 минут!
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.

Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!

Ждем вас в 19.00 по ссылке.

1.13K viewsOlga Plosskaya, edited 15:50

Ребят, всем добрый вечер! Очень большая просьба писать в репозитории (в ишьюсах, в пуллреквестах, в комментах и т.п.) на английском. Нас там читает весь мир и хочет понимать 🙏

1.1K viewsAlex Ryzhkov, 18:54

LightAutoML interpretable model - AutoWoE

Большое спасибо всем, кто сегодня вырвался из трудовых будней послушать как за пару-тройку строчек кода построить иногда такие срочно-необходимые🚨 в работе отчеты по моделям.

Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость

Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов

Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨‍💻.

- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!

Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉

Kaggle

Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Apr 2021

1.53K viewsOlga Plosskaya, edited 19:01

Всем привет.

Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space

Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new

без регистрации и смс, и выложат в записи думаю позже

1.55K viewsOlga Plosskaya, edited 12:19

Привет. ❗️Напоминаем, сегодня в 19.00 состоится наш вебинар: Что находится под капотом LighAutoML?

Расказывать о внутренностях, препарировать LightAutoML будет Антон Вахрушев, буквально после майских праздников получивший заслуженное звание Kaggle GrandMaster!🎖

Приходите, задавайте вопросы об устройстве пресетов, алгоритмов, как вытаскивать при необходимости нужную инфу из отработавшего пайплайна LightAutoML!🚀

1.37K viewsOlga Plosskaya, 14:16

🔥НЕ ПРОПУСТИ! Присоединяся по ссылке через 5 минут разбирать на чаcти LightAutoML с Антоном Вахрушевым!

Стартуем вебинар LightAutoML: что под капотом?🚀

1.28K viewsOlga Plosskaya, 15:56

LAMA_from_inside_v1.pdf

19.8 MB

Привет!
Пермутейшн, селектор, бэндинг, стэкинг - как на самом деле работает LightAutoML? Почему результат так прекрасен и хорош в сочетании с ДатаСатанистом? 🤔

Ловите презентацию👇 Антона Вахрушева о том, как устроена LAMA, и что стоит за быстрым качеством.

Пользуйся, спрашивай - задавай повестку для лекции про кастомные пайплайны🤖

1.73K viewsOlga Plosskaya, edited 07:13

JOB-A-THON - May 2021 | Job Opportunities with Top Companies

Всем хорошего вечера пятницы 😎
Сегодня открылось очень короткое (на выходные) , но супер подходящее нам соревнование - Jobathon от Analytics Vidhya (ссылка на соревнование).
Требуется предсказывать по банковским данным будет ли клиент заинтересован в оформлении кредитки.
Данных довольно много - ~250к строк в трейне
Метрика ROC-AUC

It's LightAutoML time 🤩

Analyticsvidhya

JOB-A-THON - May 2021

1.54K viewsAlex Ryzhkov, 20:00