Всем привет, коллеги! Хотел бы поделиться важной инфой, о которой мб не все в курсе - для того, чтобы радовать других людей своими апвоутами (и чтобы их засчитывал Kaggle и учитывал в общем количестве), вам необходимо добраться до статуса Contributor из изначального статуса Novice. Как это сделать, рассказывает прикрепленная к посту картинка
Доброе утро, товарищи! Quick reminder: сегодня в 19.00 пройдет второй вебинар курса, на котором я расскажу о практическом примерении LightAutoML для решения различных задач (в том числе и активных на текущий момент соревнований на Kaggle). Также будет разобран better_baseline для текущей домашки по предсказанию стоимости машин. Приходите - будет интересно 😎
Через 10 минут начинаем наш второй вебинар с Александром Рыжковым: "Практикум по решению основных ML-задач"
Ждем всех по ссылке в 19.00
Ждем всех по ссылке в 19.00
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
Добрый вечер всем!
Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки
Ну и на закуску ссылка на датасет с конфигами ламы.
P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩
Еще раз всем большое спасибо за то, что посетили наш вебинар. Собрал в одно сообщение все кернелы, которые мы сегодня посмотрели:
1) Быстрое решение титаника
2) Титаник (шаблон решения задач)
3) House Prices регрессия
4) Предсказание цены квартир
5) Дефолты заемщиков
6) Интерпретируемая модель с отчетом и SQL
7) (Текущее открытое соревнование) Tabular Playgroung Series May 2021
8) Изначальный бейзлайн домашки
9) Обновленный бейзлайн домащки
Ну и на закуску ссылка на датасет с конфигами ламы.
P.S. Понравился кернел - не стесняйся, ткни лейкоцит ❤️. Давайте вместе загоним LightAutoML в тренды на Kaggle.🤩
Kaggle
LightAutoML extreme short Titanic solution
Explore and run machine learning code with Kaggle Notebooks | Using data from Titanic - Machine Learning from Disaster
Всем привет, коллеги!
Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).
В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать
Будьте внимательны 🧐🤓😎
Хотел бы поделиться одной довольно важной особенностью, которая есть у нас в решении для задач бинарной и мультикласс классификации (ее понимание и использование очень важно для получения адекватных результатов).
В случае, если таргет переменная в вашем датасете задана не как 0-1 для бинарки или 0-1-2-..-N для мультикласса, то LIghtAutoML все равно сможет работать с такими данными, НО самостоятельно проведет их замену на знакомые ему 0-1-.. в порядке убывания встречаемости классов. О том, каким образом прошла замена, вам может сказать
automl.reader.class_mapping
, который будет None, если замены не было, и dict-ом в случае замены. Будьте внимательны 🧐🤓😎
👍1
Всем привет!
Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.
Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.
Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓
Сегодня в 19.00 наш коллега Дмитрий Симаков расскажет про NLP- и CV-пресеты в LightAutoML, а так же про то, как работать со смешанными датасетами.
Кроме того:
- покажем, как с помощью встроенного в LightAutoML LIME можно интерпретировать модели с текстовыми признаками;
- сделаем сабмит в идущее сейчас соревнование на kaggle CommonLit Readability Prize" 🚀.
Ссылка традиционно будет в рассылке позже.
Ждем всех на вебинаре в 19.00 🎓
Через 10 минут начинаем наш третий вебинар с Дмитрием Симаковым «NLP и CV пресеты LightAutoML: теория и практика»!
Ждем вас в 19.00 по ссылке
Ждем вас в 19.00 по ссылке
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
AutoNLPandCV.pdf
1.7 MB
Добрый день!
По мотивам вебинара про NLP:
Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента
2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).
Скор на паблике: 505.
А также презентация с первой части вебинара.
По мотивам вебинара про NLP:
Соревнование CommonLit Readability Prize:
1) Ноутбук для обучения. В этом ноутбуке можно обратить внимание на две истории. Первая, как передать веса transformer модели напрямую в автомл. Вторая - если вы хотите сэкономить оперативную память, то можно сохранять чекпоинты модели на диск при помощи аргумента
'path_to_save'
нейронной сети. Кроме того, ноутбук демонстрирует работу методов интерпретации. Интересный вывод, что на сложность восприятия текста сильно влияют артикли и местоимения.2) Ноутбук для сабмита. Стоит отметить, что необходимо сохранить структуру директории, как во время обучения, поэтому мы дополнительно копируем веса наших моделей в правильную папку (ячейка 3 ноутбука).
Скор на паблике: 505.
А также презентация с первой части вебинара.
Всем привет! Сегодня ночью завершилось наше первое домашнее задание соревнование. В топ-5 вошли:
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry
Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍
Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.
Аппетит приходит во время еды :)
1. Crazy Pandas (Александр Косолапов, Сергей Кутепов)
2. Антон Чикин
3. Степан Пономарев
4. Валерий Якухин
5. Mishacamry
Поздравляю вас ребят, вы проделали классный путь и удержались в шейкапе привата 👍
Для всех, у кого не пропал соревновательный дух и хочется еще больше хлеба и соревов, напоминаю:
1) Открыта домашка 2 в реальном соревновании https://www.kaggle.com/c/commonlitreadabilityprize с кернелами от Димы Симакова по работе с NLP данными
2) Для любителей табличного экстрима есть соревнование TPS May 2021 с моим кернелом https://www.kaggle.com/alexryzhkov/lightautoml-baseline-tps-may-2021 (которому чутка осталось до голды) - там есть на что посмотреть и над чем поломать голову.
Аппетит приходит во время еды :)
Привет! Напоминаем, что в 19.00 сегодня у нас будет вебинар про отчеты, мониторинги в LightAutoML - радости разработчика моделей 📊📈.
Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!
Ждем всех в 19!
Василий Бунаков расскажет и покажет, как пользоваться ReportDeco в библиотеке, и посвятит в ближайшие планы!
Ждем всех в 19!
Начинаем через 10 минут!
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.
Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!
Ждем вас в 19.00 по ссылке.
Сделай отчет по модели к к завтра! А добавь еще вот этих диаграмм...
Мы все не раз слышали эти просьбы.
Сегодня в про отчеты, мониторинг за пару строк кода и вот эти все полезные в работе каждого DS плюшки!
Ждем вас в 19.00 по ссылке.
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
Ребят, всем добрый вечер! Очень большая просьба писать в репозитории (в ишьюсах, в пуллреквестах, в комментах и т.п.) на английском. Нас там читает весь мир и хочет понимать 🙏
Большое спасибо всем, кто сегодня вырвался из трудовых будней послушать как за пару-тройку строчек кода построить иногда такие срочно-необходимые🚨 в работе отчеты по моделям.
Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость
Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов
Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨💻.
- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!
Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉
Сегодня разбирали существующие и близкие к релизу фичи LightAutoML:
- отчеты (как находить инсайты, эксплоративный анализ данных, параметры модели, метрики и др)
- мониторинги
- интерпретируемость
Ловите парочку кернелов по итогам вебинаров👇
1. Отчеты ReportDeco для WhiteBox пресета
2. Отчеты ReportDeco для BlackBox пресетов
Мы делаем в первую очередь инструмент для людей, упрощающий их ежедневный труд в таком неопределеном мире ML, поэтому нам важно ваше мнение и запросы на доработку👨💻.
- Кидайте ваши issues, фича-реквесты на GitHub (in english, please!)
- Пишите нам и Василию Бунакову (телеграм @Vasbu ) если у вас есть запросы на доработки по отчетам и мониторингам - вроде добавления кастомных метрик
- если кидаете Pull Request c доработкой либы - in english, please!
Домашка: запили отчеты своим кернелам на текущем реальном открытом сореве, майском Tabular Playground Series May 21 сореве TPS May, опубликуй свой кернел! 😉
Kaggle
LightAutoML interpretable model - AutoWoE
Explore and run machine learning code with Kaggle Notebooks | Using data from Tabular Playground Series - Apr 2021
Всем привет.
Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space
Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new
без регистрации и смс, и выложат в записи думаю позже
Сегодня идет большая конференция для разработчиков https://smartdev.ru/program.
Не секрет, что наша библиотека LightAutoML интегрирована как основной AutoML инструмент в SberCloud ML Space
Про LightAutoML в 3х стримах 5 докладов🔥:
2 наших - о библиотеке Максим Савченко (стрим SmartUniverse) + воркшоп Антона Вахрушева (стрим SberCloud)
1 доклад SberCloud в MLSpace (стрим Machine Learning) - new
1 кейс GetTransfer по использованию LightAutoML в ML Space (стрим Machine Learning) - new
1 кейс ЦРТ (стрим Machine Learning) - про перспективные разработки learn-to-explain для колл-центров - new
без регистрации и смс, и выложат в записи думаю позже
Привет. ❗️Напоминаем, сегодня в 19.00 состоится наш вебинар: Что находится под капотом LighAutoML?
Расказывать о внутренностях, препарировать LightAutoML будет Антон Вахрушев, буквально после майских праздников получивший заслуженное звание Kaggle GrandMaster!🎖
Приходите, задавайте вопросы об устройстве пресетов, алгоритмов, как вытаскивать при необходимости нужную инфу из отработавшего пайплайна LightAutoML!🚀
Расказывать о внутренностях, препарировать LightAutoML будет Антон Вахрушев, буквально после майских праздников получивший заслуженное звание Kaggle GrandMaster!🎖
Приходите, задавайте вопросы об устройстве пресетов, алгоритмов, как вытаскивать при необходимости нужную инфу из отработавшего пайплайна LightAutoML!🚀
🔥НЕ ПРОПУСТИ! Присоединяся по ссылке через 5 минут разбирать на чаcти LightAutoML с Антоном Вахрушевым!
Стартуем вебинар LightAutoML: что под капотом?🚀
Стартуем вебинар LightAutoML: что под капотом?🚀
Zoom Video
Join our Cloud HD Video Meeting
Zoom is the leader in modern enterprise video communications, with an easy, reliable cloud platform for video and audio conferencing, chat, and webinars across mobile, desktop, and room systems. Zoom Rooms is the original software-based conference room solution…
LAMA_from_inside_v1.pdf
19.8 MB
Привет!
Пермутейшн, селектор, бэндинг, стэкинг - как на самом деле работает LightAutoML? Почему результат так прекрасен и хорош в сочетании с ДатаСатанистом? 🤔
Ловите презентацию👇 Антона Вахрушева о том, как устроена LAMA, и что стоит за быстрым качеством.
Пользуйся, спрашивай - задавай повестку для лекции про кастомные пайплайны🤖
Пермутейшн, селектор, бэндинг, стэкинг - как на самом деле работает LightAutoML? Почему результат так прекрасен и хорош в сочетании с ДатаСатанистом? 🤔
Ловите презентацию👇 Антона Вахрушева о том, как устроена LAMA, и что стоит за быстрым качеством.
Пользуйся, спрашивай - задавай повестку для лекции про кастомные пайплайны🤖
Всем хорошего вечера пятницы 😎
Сегодня открылось очень короткое (на выходные) , но супер подходящее нам соревнование - Jobathon от Analytics Vidhya (ссылка на соревнование).
Требуется предсказывать по банковским данным будет ли клиент заинтересован в оформлении кредитки.
Данных довольно много - ~250к строк в трейне
Метрика ROC-AUC
It's LightAutoML time 🤩
Сегодня открылось очень короткое (на выходные) , но супер подходящее нам соревнование - Jobathon от Analytics Vidhya (ссылка на соревнование).
Требуется предсказывать по банковским данным будет ли клиент заинтересован в оформлении кредитки.
Данных довольно много - ~250к строк в трейне
Метрика ROC-AUC
It's LightAutoML time 🤩
Analyticsvidhya
JOB-A-THON - May 2021
JOB-A-THON - May 2021 | Job Opportunities with Top Companies
Всем добрый вечер! С днем защиты детей от ручного data science :)
Сегодня классически началось новое соревнование Tabular Playground Series June 2021 - инкласс соревнование на табличных данных. Большой датасет, целочисленные фичи, мультикласс классификация на 9 классов - вкуснятина. Пример на LightAutoML уже готов и висит в топе среди кернелов - самое время залетать и искать необычные паттерны в фичах.
Важный момент: кернел является примером использования LightAutoML на GPU. Правда фокус в том, что делать вам ничего не придется, кроме включения GPU в кернеле - LightAutoML сам поставит Catboost в режим GPU расчета.
Сегодня классически началось новое соревнование Tabular Playground Series June 2021 - инкласс соревнование на табличных данных. Большой датасет, целочисленные фичи, мультикласс классификация на 9 классов - вкуснятина. Пример на LightAutoML уже готов и висит в топе среди кернелов - самое время залетать и искать необычные паттерны в фичах.
Важный момент: кернел является примером использования LightAutoML на GPU. Правда фокус в том, что делать вам ничего не придется, кроме включения GPU в кернеле - LightAutoML сам поставит Catboost в режим GPU расчета.
Kaggle
LightAutoML baseline TPS June 2021
Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources