Доброе утро, коллеги!
На прошедших выходных завершился хакатон RaifHack DS, в течение которого участникам предстояло разработать модель оценки стоимости коммерческой недвижимости и поделить 700к призового фонда. В итоге было отправлено почти 5к сабмитов от 371 команды и опубликовано более 20 публичных решений бейзлайнов.
Нам конечно же хотелось бы отметить участников, которые использовали наш LightAutoML в качестве основной модели своего решения. Так, например, команда BigSberBosses с LightAutoML моделью вошла в топ-10 на приватном LB и заняла 9-ое место, а опубликованное на Github решение команды Япики было признано лучшим публичным решением и награждено призом в 75к. Что примечательно - для Япиков это был первый хакатон и сразу же попадание в топ-50 (на привате они 42ые) 🔥🔥🔥
Свои результаты в хакатоне раскрыли и еще несколько "LightAutoML участников" - Ринат Курбанов (25ое место), Сергей Кутепов (29ое место) и Андрей Никитин (118ое место). Почти наверняка их было больше - если вдруг кого забыл, делитесь своим результатом в комментариях под этим постом 🙈
Еще раз поздравляю победителей и призеров хакатона - вместе мы сможем строить модели быстрее и качественнее 😎
На прошедших выходных завершился хакатон RaifHack DS, в течение которого участникам предстояло разработать модель оценки стоимости коммерческой недвижимости и поделить 700к призового фонда. В итоге было отправлено почти 5к сабмитов от 371 команды и опубликовано более 20 публичных решений бейзлайнов.
Нам конечно же хотелось бы отметить участников, которые использовали наш LightAutoML в качестве основной модели своего решения. Так, например, команда BigSberBosses с LightAutoML моделью вошла в топ-10 на приватном LB и заняла 9-ое место, а опубликованное на Github решение команды Япики было признано лучшим публичным решением и награждено призом в 75к. Что примечательно - для Япиков это был первый хакатон и сразу же попадание в топ-50 (на привате они 42ые) 🔥🔥🔥
Свои результаты в хакатоне раскрыли и еще несколько "LightAutoML участников" - Ринат Курбанов (25ое место), Сергей Кутепов (29ое место) и Андрей Никитин (118ое место). Почти наверняка их было больше - если вдруг кого забыл, делитесь своим результатом в комментариях под этим постом 🙈
Еще раз поздравляю победителей и призеров хакатона - вместе мы сможем строить модели быстрее и качественнее 😎
raifhack.ru
Raifhack DS - хакатон от Райффайзенбанка' by Russian Hackers
Онлайн-хакатон для аналитиков данных. Задача: разработать алгоритм оценки стоимости коммерческой недвижимости. Регистрация до 19 сентября!
#release_notes
Всем приятного пятничного вечера!
Впереди выходные, на которых обычно появляется свободное время для всего нового и интересного и мы спешим всех обрадовать - в PyPI только что было загружено глобальное обновление LightAutoML 0.3.0 🔥🔥🔥
Основное:
⁃ Добавлено решение AutoUplift для решения задач Uplift моделирования (см. туториал)
⁃ Реализованы методики интерпретации моделей через ICE и PDP (см. туториал)
⁃ Реализован новый функционал логгинга процесса обучения модели (5 уровней детализации)
⁃ Добавлена возможность получения текстового описания финальной модели
⁃ Реализована раздельная установка LightAutoML - базовая установка, NLP, CV, отчеты, полная установка
Дополнительно:
⁃ Полностью обновлены туториалы, переработана структура репозитория для более удобной навигации
⁃ Добавлены CI/CD пайплайны
⁃ Исправлены многие выявленные баги
Всем приятного пятничного вечера!
Впереди выходные, на которых обычно появляется свободное время для всего нового и интересного и мы спешим всех обрадовать - в PyPI только что было загружено глобальное обновление LightAutoML 0.3.0 🔥🔥🔥
Основное:
⁃ Добавлено решение AutoUplift для решения задач Uplift моделирования (см. туториал)
⁃ Реализованы методики интерпретации моделей через ICE и PDP (см. туториал)
⁃ Реализован новый функционал логгинга процесса обучения модели (5 уровней детализации)
⁃ Добавлена возможность получения текстового описания финальной модели
⁃ Реализована раздельная установка LightAutoML - базовая установка, NLP, CV, отчеты, полная установка
Дополнительно:
⁃ Полностью обновлены туториалы, переработана структура репозитория для более удобной навигации
⁃ Добавлены CI/CD пайплайны
⁃ Исправлены многие выявленные баги
Добрый вечер всем, коллеги!
В пылу подготовки мы совсем забыли анонсировать наши завтрашние активности на стартовавшем сегодня AI Journey 21. Прикладываю ниже расписание наших докладов и секции AutoML, которую мы в том числе и модерируем:
🔥 Секция AutoML (11 ноября, 17:00 - 18:40)
1. Рыжков Александр, Натекин Алексей «Открытый бенчмарк AutoML решений на базе ODS.AI»
2. Вахрушев Антон, Иосипой Леонид «Стенд PyBoost для изучения бустингов»
3. Бондаренко Иван «AutoML и глубокое обучение для обработки табличных данных»
4. Николай Никитин «FEDOT – открытый фреймворк для эволюционного автоматического обучения композитных пайпланов»
🔥 Секция RecSys (11 ноября, 16:20 - 16:40)
1. Васильев Алексей, Натекин Алексей «Открытый бенчмарк рекомендательных систем RecSys»
🔥 Секция Workshops (11 ноября, 18:00 - 18:30)
1. Васильев Алексей, Тамм Ян-Мартин «RePlay - opensource фреймворк для создания офлайн рекомендаций»
Будем рады видеть вас на наших докладах и воркшопах - регистрация на конференцию доступна по ссылке https://ai-journey.ru/conference ☺️
В пылу подготовки мы совсем забыли анонсировать наши завтрашние активности на стартовавшем сегодня AI Journey 21. Прикладываю ниже расписание наших докладов и секции AutoML, которую мы в том числе и модерируем:
🔥 Секция AutoML (11 ноября, 17:00 - 18:40)
1. Рыжков Александр, Натекин Алексей «Открытый бенчмарк AutoML решений на базе ODS.AI»
2. Вахрушев Антон, Иосипой Леонид «Стенд PyBoost для изучения бустингов»
3. Бондаренко Иван «AutoML и глубокое обучение для обработки табличных данных»
4. Николай Никитин «FEDOT – открытый фреймворк для эволюционного автоматического обучения композитных пайпланов»
🔥 Секция RecSys (11 ноября, 16:20 - 16:40)
1. Васильев Алексей, Натекин Алексей «Открытый бенчмарк рекомендательных систем RecSys»
🔥 Секция Workshops (11 ноября, 18:00 - 18:30)
1. Васильев Алексей, Тамм Ян-Мартин «RePlay - opensource фреймворк для создания офлайн рекомендаций»
Будем рады видеть вас на наших докладах и воркшопах - регистрация на конференцию доступна по ссылке https://ai-journey.ru/conference ☺️
Коллеги, всем привет!
Open source решения Sber AI Lab
LAMA: LightAutoML - самый быстрый и точный фреймфорк AutoML на табличных данных
RePlay - фреймоврк для создания RecSys на PySpark
вышли в этап открытого голосования за звание лучшего open source решения в рамках конференции HighLoad++, где нам очень нужна ваша поддержка (голосование продлится до 26 февраля).
Проголосуйте за лучшее open source решение тут:
https://opensource.highload.ru/vote
Вы знаете что делать :))
P.S. На этой конфе мы планируем презентовать 2 новых пайплайна для LightAutoML: для GPU и для Spark - LAMA станет еще быстрее и эффективнее. Если вдруг вам интересно протестить их раньше остальных, то пишите в личку.
Open source решения Sber AI Lab
LAMA: LightAutoML - самый быстрый и точный фреймфорк AutoML на табличных данных
RePlay - фреймоврк для создания RecSys на PySpark
вышли в этап открытого голосования за звание лучшего open source решения в рамках конференции HighLoad++, где нам очень нужна ваша поддержка (голосование продлится до 26 февраля).
Проголосуйте за лучшее open source решение тут:
https://opensource.highload.ru/vote
Вы знаете что делать :))
P.S. На этой конфе мы планируем презентовать 2 новых пайплайна для LightAutoML: для GPU и для Spark - LAMA станет еще быстрее и эффективнее. Если вдруг вам интересно протестить их раньше остальных, то пишите в личку.
GitHub
GitHub - sberbank-ai-lab/LightAutoML: LAMA - automatic model creation framework
LAMA - automatic model creation framework. Contribute to sberbank-ai-lab/LightAutoML development by creating an account on GitHub.
🔥15👍8
Всем привет, коллеги!
Давно не радовали вас хорошими новостями - несколько дней назад завершилось соревнование Netflix Appetency на Kaggle от Prevision.io, в котором нам удалось подняться на приватном лидерборде на 89 позиций и оказаться на итоговом 19ом месте (проигрывая первому месту менее 0.1% ROC-AUC). Дополнительно отметим, что решение, построенное на LightAutoML, оказалось лучшим из автоматически сгенерированных решений без ручных доработок. Код самого решения был открыт два месяца назад (еще пока соревнование было открыто) и доступен здесь.
Мы продолжаем улучшать наше решение для того, чтобы получать все более качественные модели для различных задач. Будем рады вашим отзывам о работе LightAutoML на ваших данных - как позитивным, так и негативным.
Всем добра! 🦙
Давно не радовали вас хорошими новостями - несколько дней назад завершилось соревнование Netflix Appetency на Kaggle от Prevision.io, в котором нам удалось подняться на приватном лидерборде на 89 позиций и оказаться на итоговом 19ом месте (проигрывая первому месту менее 0.1% ROC-AUC). Дополнительно отметим, что решение, построенное на LightAutoML, оказалось лучшим из автоматически сгенерированных решений без ручных доработок. Код самого решения был открыт два месяца назад (еще пока соревнование было открыто) и доступен здесь.
Мы продолжаем улучшать наше решение для того, чтобы получать все более качественные модели для различных задач. Будем рады вашим отзывам о работе LightAutoML на ваших данных - как позитивным, так и негативным.
Всем добра! 🦙
Kaggle
Netflix Appetency
Identify consumer willing to subscribe
👍27🔥13
👂🏻Важен ваш опыт❗️
Пост от коллег из SberCloud:
Всем привет!
Не секрет, что LightAutoML можно встроить в любую платформу. Например, библиотека является ядром сервиса AutoML в SberCloud.
SberCloud собирают фидбек в части улучшения клиентского опыта использования библиотеки LightAutoML и других сервисов на ее основе.
Расскажите, как пользуетесь библиотекой, какие задачи решаете - напишите пожалуйста @magkarina
Будем очень признательны вашей помощи! 🤝
Пост от коллег из SberCloud:
Всем привет!
Не секрет, что LightAutoML можно встроить в любую платформу. Например, библиотека является ядром сервиса AutoML в SberCloud.
SberCloud собирают фидбек в части улучшения клиентского опыта использования библиотеки LightAutoML и других сервисов на ее основе.
Расскажите, как пользуетесь библиотекой, какие задачи решаете - напишите пожалуйста @magkarina
Будем очень признательны вашей помощи! 🤝
❤4
Коллеги, добрый вечер!
Вы часто спрашиваете нас о научной составляющей нашего LightAutoML и о том, что находится внутри него - поделимся списком материалов, которые помогут разобраться в этой теме:
1. Вышло обновление нашей статьи на arxiv - если еще не успели ознакомиться, то она доступна тут
2. На ODS.AI доступна третья часть курса по LightAutoML, в которой рассказывается о подкапотной жизни ламы и возможностях кастомизации существующих пайплайнов
Будем рады ответить на возникающие вопросы, а также новым контрибьюторам в наше решение.
Всем добра! 🦙
Вы часто спрашиваете нас о научной составляющей нашего LightAutoML и о том, что находится внутри него - поделимся списком материалов, которые помогут разобраться в этой теме:
1. Вышло обновление нашей статьи на arxiv - если еще не успели ознакомиться, то она доступна тут
2. На ODS.AI доступна третья часть курса по LightAutoML, в которой рассказывается о подкапотной жизни ламы и возможностях кастомизации существующих пайплайнов
Будем рады ответить на возникающие вопросы, а также новым контрибьюторам в наше решение.
Всем добра! 🦙
👍16🔥2
HL_Ryzhkov_LightAutoML_final.pdf
1.9 MB
Всем приятного пятничного дня и будущих выходных!
Совсем недавно прошла конференция HighLoad++, на которой мы презентовали 2 новых пайплайна для нашего LightAutoML фреймворка: GPU и Spark пайплайны, позволяющие работать быстрее и использовать датасеты в миллиард строк для обучения моделей.
Мое выступление на OpenSource трибуне можно посмотреть тут с 7:12 до 21:59. Дополнительно прикладываю презентацию своего выступления. 📈
Будем рады вашим вопросам и отзывам о наших новых пайплайнах, а также контрибьюту в них нового функционала.
Всем мира и лам! 🦙
Совсем недавно прошла конференция HighLoad++, на которой мы презентовали 2 новых пайплайна для нашего LightAutoML фреймворка: GPU и Spark пайплайны, позволяющие работать быстрее и использовать датасеты в миллиард строк для обучения моделей.
Мое выступление на OpenSource трибуне можно посмотреть тут с 7:12 до 21:59. Дополнительно прикладываю презентацию своего выступления. 📈
Будем рады вашим вопросам и отзывам о наших новых пайплайнах, а также контрибьюту в них нового функционала.
Всем мира и лам! 🦙
👍21🔥8
Всем привет!
Рады сообщить, что теперь LAMA: LightAutoML и ее сырцы доступны в новом репозитории 👉 по ссылке
Будем признательны, если ваши лайки хоть как-то помогут восстановить потерянное количество ⭐⭐⭐ старого репозитория❤️
Так же доступны другие решения от нашей группы:
- Библиотека-конструктор для RecSys
- Интерпретируемый AutoML
- быстрый градиентный бустинг на GPU для multioutput задач и не только
Рады сообщить, что теперь LAMA: LightAutoML и ее сырцы доступны в новом репозитории 👉 по ссылке
Будем признательны, если ваши лайки хоть как-то помогут восстановить потерянное количество ⭐⭐⭐ старого репозитория❤️
Так же доступны другие решения от нашей группы:
- Библиотека-конструктор для RecSys
- Интерпретируемый AutoML
- быстрый градиентный бустинг на GPU для multioutput задач и не только
GitHub
GitHub - sb-ai-lab/LightAutoML: Fast and customizable framework for automatic ML model creation (AutoML)
Fast and customizable framework for automatic ML model creation (AutoML) - sb-ai-lab/LightAutoML
👍20❤8🔥2
Коллеги, всем привет!
Недавно на Kaggle открылось соревнование от American Express по предсказанию дефолта клиентов на основе информации о них в нескольких временных срезах.
Если вы тоже хотите начать участвовать в этом соревновании, то предлагаем вашему вниманию подготовленные кернелы по использованию наших инструментов:
1) Кернел на основе Py-Boost GPU с реализацией быстрой метрики
2) Кернел на LightAutoML
Также вчера стартовало ставшее уже классическим соревнование Tabular Playground Series June 2022 в необычной постановке - в датасете необходимо предсказывать значения для заполнения пропусков. Для него мы также уже подготовили quick start notebook на LightAutoML, строящий 55 моделей регрессии 🤪
Будем рады, если подготовленные материалы окажутся полезными для вас при решении соревнований.
Желаем удачи!
Недавно на Kaggle открылось соревнование от American Express по предсказанию дефолта клиентов на основе информации о них в нескольких временных срезах.
Если вы тоже хотите начать участвовать в этом соревновании, то предлагаем вашему вниманию подготовленные кернелы по использованию наших инструментов:
1) Кернел на основе Py-Boost GPU с реализацией быстрой метрики
2) Кернел на LightAutoML
Также вчера стартовало ставшее уже классическим соревнование Tabular Playground Series June 2022 в необычной постановке - в датасете необходимо предсказывать значения для заполнения пропусков. Для него мы также уже подготовили quick start notebook на LightAutoML, строящий 55 моделей регрессии 🤪
Будем рады, если подготовленные материалы окажутся полезными для вас при решении соревнований.
Желаем удачи!
Kaggle
American Express - Default Prediction
Predict if a customer will default in the future
👍22❤5🔥3
Привет, коллеги!
Мы снова к вам с хорошими новостями с полей практического применения инструментов нашего центра AI Lab.
Некоторое время назад завершилось соревнование Autism Prediction, в котором на приватном ЛБ нам удалось занять 23-е место из 118 (поднялись на 12 мест относительно публичного ЛБ) с использованием LightAutoML (кернел с пруфом). Мы до конца верили в устойчивость своей модели и новые данные нас за это вознаградили - shake-up всего ЛБ оказался супер-драматичным: в топ-10 приватного ЛБ оказались участники, поднявшиеся на 20+ позиций по итогу пересчета. Отдельно хочу отметить, что нам удалось серьезно (на 0.7%) обогнать коллег из Prevision.io, которых пересчет опустил на 20 позиций и поставил на 30-ое место.
Также на текущий момент мы продолжаем участие в Tabular Playground Series с предсказанием значений для пропусков в датасете. Из последнего - опробовали на соревновании 2 технологии:
1) Пока все участники пробуют решают задачу в формате one-vs-all, наш коллега Антон Вахрушев (btbpanda) решил ее в формате multioutput при помощи собственной opensource реализации градиентного бустинга на GPU Py-Boost. Решение специально уложили в публичный кернел для удобства переиспользования в этой и других задачах и что важно - такой подход показывает лучший результат среди GBM семейства и находится на уровне нейросетевых подходов.
2) Мы продолжаем развивать сам LightAutoML и на текущий момент доступна девелоперская версия c нейросетевыми моделями для табличных данных. Из нововведений в ней - Добавятся новые модели, адаптированные для табличных данных, например, densenet, resnet. По своему желанию вы можете сильно кастомизировать обучение модели и ее архитектуру (передать лосс и другие параметры). При обучение есть возможность использовать SWA для улучшения качества, а также клиппинг градиентов для регуляризации. Среди таcков, помимо стандартных задач, поддерживается мульти-регрессия и мультилэйбл. Для тех, кто заинтересовался и хочет попробовать такую версию уже сейчас, есть пример установки и работы в этом публичном кернеле. Будем рады вашей обратной связи по реализованному функционалу 😎
P.S. Благодаря вашей активной поддержке наших решений на Kaggle и поддержке международного коммьюнити @RyzhkovAlex в итоге стал двухкратным грандмастером Kaggle - по соревнованиям и по кернелам. Таких людей всего 22 человека в мире, а если считать только тех, кто тоже смог в соревнования, то всего 10. Впереди остались ачивки за посты на форуме и за датасеты - как-нибудь тоже к ним подберемся ☺️
Всем мира и добра 🦙
Мы снова к вам с хорошими новостями с полей практического применения инструментов нашего центра AI Lab.
Некоторое время назад завершилось соревнование Autism Prediction, в котором на приватном ЛБ нам удалось занять 23-е место из 118 (поднялись на 12 мест относительно публичного ЛБ) с использованием LightAutoML (кернел с пруфом). Мы до конца верили в устойчивость своей модели и новые данные нас за это вознаградили - shake-up всего ЛБ оказался супер-драматичным: в топ-10 приватного ЛБ оказались участники, поднявшиеся на 20+ позиций по итогу пересчета. Отдельно хочу отметить, что нам удалось серьезно (на 0.7%) обогнать коллег из Prevision.io, которых пересчет опустил на 20 позиций и поставил на 30-ое место.
Также на текущий момент мы продолжаем участие в Tabular Playground Series с предсказанием значений для пропусков в датасете. Из последнего - опробовали на соревновании 2 технологии:
1) Пока все участники пробуют решают задачу в формате one-vs-all, наш коллега Антон Вахрушев (btbpanda) решил ее в формате multioutput при помощи собственной opensource реализации градиентного бустинга на GPU Py-Boost. Решение специально уложили в публичный кернел для удобства переиспользования в этой и других задачах и что важно - такой подход показывает лучший результат среди GBM семейства и находится на уровне нейросетевых подходов.
2) Мы продолжаем развивать сам LightAutoML и на текущий момент доступна девелоперская версия c нейросетевыми моделями для табличных данных. Из нововведений в ней - Добавятся новые модели, адаптированные для табличных данных, например, densenet, resnet. По своему желанию вы можете сильно кастомизировать обучение модели и ее архитектуру (передать лосс и другие параметры). При обучение есть возможность использовать SWA для улучшения качества, а также клиппинг градиентов для регуляризации. Среди таcков, помимо стандартных задач, поддерживается мульти-регрессия и мультилэйбл. Для тех, кто заинтересовался и хочет попробовать такую версию уже сейчас, есть пример установки и работы в этом публичном кернеле. Будем рады вашей обратной связи по реализованному функционалу 😎
P.S. Благодаря вашей активной поддержке наших решений на Kaggle и поддержке международного коммьюнити @RyzhkovAlex в итоге стал двухкратным грандмастером Kaggle - по соревнованиям и по кернелам. Таких людей всего 22 человека в мире, а если считать только тех, кто тоже смог в соревнования, то всего 10. Впереди остались ачивки за посты на форуме и за датасеты - как-нибудь тоже к ним подберемся ☺️
Всем мира и добра 🦙
Kaggle
Autism Prediction
Autism Prediction in Adults
👍30🔥17
Forwarded from NoML Digest (Pavel Snurnitsyn)
В среду, 6 июля в 17:00 МСК встречаемся на семинаре NoML. Выступать будет
😎 Рыжков Александр, 2х Kaggle Grandmaster, Team Lead команды AutoML, Sber AI Lab
Аннотация:
“На семинаре расскажем про то, что такое AutoML и как пользоваться этой технологией для ускорения своей работы. На примере open source библиотеки LightAutoML разберем несколько туториалов и выясним, как правильно комбинировать усилия человека и машины для достижения наилучшего качества итоговой модели.”
Подключение по ссылке: meet.google.com/sba-wcab-ynd
😎 Рыжков Александр, 2х Kaggle Grandmaster, Team Lead команды AutoML, Sber AI Lab
Аннотация:
“На семинаре расскажем про то, что такое AutoML и как пользоваться этой технологией для ускорения своей работы. На примере open source библиотеки LightAutoML разберем несколько туториалов и выясним, как правильно комбинировать усилия человека и машины для достижения наилучшего качества итоговой модели.”
Подключение по ссылке: meet.google.com/sba-wcab-ynd
🔥11👍4
Forwarded from NoML Digest (Pavel Snurnitsyn)
В преддверии завтрашнего семинара можно, во-первых, посмотреть статью коллег:
📄 Anton Vakhrushev, Alexander Ryzhkov, Dmitry Simakov, Rinchin Damdinov, Maxim Savchenko, Alexander Tuzhilin "LightAutoML: AutoML Solution for a Large Financial Services Ecosystem”
Во-вторых, ознакомиться с кейсами нестандартного использования LightAutoML, которые Александр будет разбирать на семинаре:
📌 LightAutoML Pseudolabel NLP Baseline
📌 LightAutoML Adversarial Validation
Последний кейс подготовлен непосредственно для нашего семинара, и вообще Александр обещает, что завтра будет много нового контента про LightAutoML, так что не пропустите!
📄 Anton Vakhrushev, Alexander Ryzhkov, Dmitry Simakov, Rinchin Damdinov, Maxim Savchenko, Alexander Tuzhilin "LightAutoML: AutoML Solution for a Large Financial Services Ecosystem”
Во-вторых, ознакомиться с кейсами нестандартного использования LightAutoML, которые Александр будет разбирать на семинаре:
📌 LightAutoML Pseudolabel NLP Baseline
📌 LightAutoML Adversarial Validation
Последний кейс подготовлен непосредственно для нашего семинара, и вообще Александр обещает, что завтра будет много нового контента про LightAutoML, так что не пропустите!
🔥5👍3
SBER_AILab_LightAutoML_Ryzhkov_NoML_06_07_22.pdf
9.5 MB
Всем привет!
Вышла запись нашего вебинара в NoML Community. Постарались рассказать обо всем, что есть у нас в LAMA
Уложились по классике в ~3 часа 😇
📺 Александр Рыжков - LightAutoML: как строить ML модели быстрее
Вышла запись нашего вебинара в NoML Community. Постарались рассказать обо всем, что есть у нас в LAMA
Уложились по классике в ~3 часа 😇
📺 Александр Рыжков - LightAutoML: как строить ML модели быстрее
👍16🔥6
🎁Конкурс!
Лето☀️ - отличное время оглянуться назад и подумать куда идти дальше, и мы решили запустить конкурс кейсов на Lama 🦙. Мы приготовили несколько номинаций:
- «Fail года с LightAutoML»: о том, какую классную модель вы построили с Лама, однако что-то пошло не так;
- «Успех года с LightAutoML»: о том как Лама помогла вам ускорить свою производительность или добится существенного прироста качества за короткий срок;
- «Хакатон года с LightAutoML»: о том, как вы участвовали с Лама, с каким решением и какое место заняли, а может есть то, чего вам не хватило в Лама для победы?
- «Стахановец года с LightAutoML»: о том сколько пилотов вы сделали, внедрили моделек в пром с помощью Лама;
- «Просветитель года LightAutoML»: присылай ссылку на свою статью о том, как с помощью LAMA сделал что-либо полезное, или фреймворк тебе помог в нелегких буднях (возможно у тебя есть статья на Хабре или другом ресурсе)
Принимаем кейсы для конкурса в виде 2х красивых слайдов в pdf/pptx или ссылок на аналогичные материалы на почту ml.tools.center@gmail.com или lama_info@sberbank.ru до 30 сентября 2022 года.
Авторы лучших кейсов получат толстовки 🏆 от LightAutoML и Sber AI Lab.
Лучшие кейсы будут опубликованы в канале с согласия авторов!
Лето☀️ - отличное время оглянуться назад и подумать куда идти дальше, и мы решили запустить конкурс кейсов на Lama 🦙. Мы приготовили несколько номинаций:
- «Fail года с LightAutoML»: о том, какую классную модель вы построили с Лама, однако что-то пошло не так;
- «Успех года с LightAutoML»: о том как Лама помогла вам ускорить свою производительность или добится существенного прироста качества за короткий срок;
- «Хакатон года с LightAutoML»: о том, как вы участвовали с Лама, с каким решением и какое место заняли, а может есть то, чего вам не хватило в Лама для победы?
- «Стахановец года с LightAutoML»: о том сколько пилотов вы сделали, внедрили моделек в пром с помощью Лама;
- «Просветитель года LightAutoML»: присылай ссылку на свою статью о том, как с помощью LAMA сделал что-либо полезное, или фреймворк тебе помог в нелегких буднях (возможно у тебя есть статья на Хабре или другом ресурсе)
Принимаем кейсы для конкурса в виде 2х красивых слайдов в pdf/pptx или ссылок на аналогичные материалы на почту ml.tools.center@gmail.com или lama_info@sberbank.ru до 30 сентября 2022 года.
Авторы лучших кейсов получат толстовки 🏆 от LightAutoML и Sber AI Lab.
Лучшие кейсы будут опубликованы в канале с согласия авторов!
🔥10👍1
Forwarded from Small Data Science for Russian Adventurers
#соревнование
Статистика по гранд-мастерам Kaggle, их 4 вида: по соревнованиям, по выложенному коду, по выложенным данным и по активному общению в форуме. В мире всего пять 4х-кратных грандмастеров (всех видов). Интересно, что в соревнованиях из них побеждал только Chris Deotte. Рейтинг стран:
1. США - 77 грандмастеров,
2. Япония - 38,
3. Китай - 34,
4. Россия - 28,
5. Индия - 25.
В России два раза становился грандмастером Александр Рыжков (мой бывший студент, кстати). Ещё Андрей Лукьяненко (но он выступает теперь за ОАЭ).
Статистика по гранд-мастерам Kaggle, их 4 вида: по соревнованиям, по выложенному коду, по выложенным данным и по активному общению в форуме. В мире всего пять 4х-кратных грандмастеров (всех видов). Интересно, что в соревнованиях из них побеждал только Chris Deotte. Рейтинг стран:
1. США - 77 грандмастеров,
2. Япония - 38,
3. Китай - 34,
4. Россия - 28,
5. Индия - 25.
В России два раза становился грандмастером Александр Рыжков (мой бывший студент, кстати). Ещё Андрей Лукьяненко (но он выступает теперь за ОАЭ).
🔥35❤3👍1
Начиная с нескольких последних релизов в LightAutoML встроен функционал предсказания следующих значений временного ряда (forecasting).
Что он в себя включает:
0. Поддержка регулярных одномерных временных рядов с малым числом пропусков и дополнительными признаками.
1. Мультиатпут модели (и новые таски обучения) для предсказания сразу нескольких точек вперед одновременно, что отличает нас от аналогичных решений.
2. Простые пайплайны признаков (лаговые признаки + сезонности из дат) для фиксированного горизонта истории.
3. Модуль работы с аддитивным монотонным трендом.
4. Реализация сейчас не подразумевает тюн гиперпараметров по TS валидации.
5. Датасет должен содержать в себе колонку с таймстемпами в формате даты.
При этом сейчас мы можем работать одновременно с несколькими сегментами рядов, но только при сборке автомл пайплайна из блоков и без тренда. Айди сегмента подается как отдельный признак.
Мы также провели ряд численных экспериментов и увидели, что несмотря на крайнюю простоту подхода и простые признаки, в некоторых постановках задач LAMA работает на уровне или лучше других решений.
Обычно это:
А. Одномерные ряды среднего размера (от сотни наблюдений)
Б. В данных нет тренда, но встречается сезонность.
В. Горизонт предсказания не слишком длинный (порядка 7-20 точек).
Пример запуска на одном ряде, а также иллюстрации работы и численные результаты в комментариях к данному посту.
Что он в себя включает:
0. Поддержка регулярных одномерных временных рядов с малым числом пропусков и дополнительными признаками.
1. Мультиатпут модели (и новые таски обучения) для предсказания сразу нескольких точек вперед одновременно, что отличает нас от аналогичных решений.
2. Простые пайплайны признаков (лаговые признаки + сезонности из дат) для фиксированного горизонта истории.
3. Модуль работы с аддитивным монотонным трендом.
4. Реализация сейчас не подразумевает тюн гиперпараметров по TS валидации.
5. Датасет должен содержать в себе колонку с таймстемпами в формате даты.
При этом сейчас мы можем работать одновременно с несколькими сегментами рядов, но только при сборке автомл пайплайна из блоков и без тренда. Айди сегмента подается как отдельный признак.
Мы также провели ряд численных экспериментов и увидели, что несмотря на крайнюю простоту подхода и простые признаки, в некоторых постановках задач LAMA работает на уровне или лучше других решений.
Обычно это:
А. Одномерные ряды среднего размера (от сотни наблюдений)
Б. В данных нет тренда, но встречается сезонность.
В. Горизонт предсказания не слишком длинный (порядка 7-20 точек).
Пример запуска на одном ряде, а также иллюстрации работы и численные результаты в комментариях к данному посту.
🔥23🎉9👍5❤2
Насколько вам интересен и актуален функционал работы с временными рядами?
Пишите ваши пожелания в комментарии к данному опросу 👇или посту выше 👆 Улучшай LAMA вместе с нами!
Пишите ваши пожелания в комментарии к данному опросу 👇или посту выше 👆 Улучшай LAMA вместе с нами!
Anonymous Poll
73%
Буду пробовать, мне подходит
15%
Не хватает функционала
12%
Задачи TimeSeries не актуальны
🔥6
Всем привет, мы решили продлить до конца года сбор кейсов по использованию по LightAutoML. Присылайте материалы о вашем использовании LAMA: ml.tools.center@gmail.com, lama_info@sberbank.ru
С теми, кто уже ранее нам направил материалы, мы обязательно свяжемся!
С теми, кто уже ранее нам направил материалы, мы обязательно свяжемся!
Telegram
LightAutoML framework
🎁Конкурс!
Лето☀️ - отличное время оглянуться назад и подумать куда идти дальше, и мы решили запустить конкурс кейсов на Lama 🦙. Мы приготовили несколько номинаций:
- «Fail года с LightAutoML»: о том, какую классную модель вы построили с Лама, однако что…
Лето☀️ - отличное время оглянуться назад и подумать куда идти дальше, и мы решили запустить конкурс кейсов на Lama 🦙. Мы приготовили несколько номинаций:
- «Fail года с LightAutoML»: о том, какую классную модель вы построили с Лама, однако что…
👍7