DataGym Channel [Power of data]
2.56K subscribers
30 photos
1 video
1 file
114 links
Канал про Data Science и BigData.
Реклама в канале через благ.фонды: https://telegra.ph/Reklama-v-kanale-12-21
Для связи: @ermakovpetr
Download Telegram
#competitions : RecSys 2019 Challenge
Необходимо построить рекомендательную систему для метапоисковика отелей trivago
Дедлайн: 30/06/2019 (3.5 месяца)
Призовой фонд: пока не ясен, по опыту прошлых лет достаточно небольшой (2018: 1st - 4.000$, 2nd - 2.000$, 3rd - 1.000$, 2017: 1st - 3.000€, 2nd - 1.500€, 3rd - 500€)

Требуется на основе пользовательский сессий для пропущенных действий отсортировать объекты размещения.
Данных ~ 3Gb
Соревнование обещали объявить еще в январе, но данные появились только в начале марта, потому сроки немного продлили.

Подробнее про конкурс: http://xxtt.ru/recsys2019
#events : 🇧🇾 DataFest Minsk 🇧🇾
Когда: 27 (суббота) апреля 2019, 11:00 - 20:00
Место: Галерея Ў, улица Октябрьская 19, Минск, Беларусь
Язык докладов - русский

В конце апреля пройдет однодневный DataFest в Минске.
Доклады будут идти в 2 потока и уже есть предварительная программа:
- Кирилл Жданович "Speech recognition from 0 to 100"
- Евгений Макаров "Modern Facial Landmark Estimation and Tracking: from tree-based regressors to deep learning approaches"
- Дмитрий Северинец "Создание Data Science архитектуры на базе Apache Airflow"
- Михаил Рожков "Начните с контроля версий и управления экспериментами в ML проектах: обеспечение воспроизводимости результатов"
- Петр Ромов "Анализ реплеев компьютерных игр"
- и другие

Зарегистрироваться можно бесплатно, а можно пожертвовать 40 белорусских рублей и получить памятную футболку.
Я уже взял билеты в Минск и вам советую не откладывать.
Страница мероприятия: http://xxtt.ru/datafestby
(А уже вечером будет анонс самого большого Data Science мероприятия восточного полушария)
#events : DataFest #6 🎉 🦜
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский

В мае пройдет главное data science мероприятие года.
2 полных дня, 60 секций, 200 докладов, 10.000 гостей.
- Список секций первого (индустриального) дня:
Mega keynote, ML economics, Healthcare applications, E-commerce applications, Media applications, DS education, Poster pitch-session, Innovation board panel, A/B testing, Manufacturing applications, Banking applications, Telecom applications, Data collection & labeling, ODS Q&A, Data-driven culture, DS processes, Biometric Applications, Smartphone applications, WiML, Project pitch-session, Mini meeetups, Mythbusters, DS hiring, Industry CV/Video, Industry NLP, Industry speech, WiML workshop, Mini meetups, MLcourse finale
- Список секций второго (научного) дня:
Machine learning legends panel, Big Data / Data Engineering, ML trainings, PyData, Reinforcement Learning, ML4SG, Open microphone, ML keynotes, ML Engineering / SysML, Black ML, iPavlov workshop, DeepBayes workshop, EDA & visualisation, Fit ML, Что? Где? Когда? DS edition, BigARTM workshop, Deep CV workshop, ODS projects, Unconference, ML puzzler, Failconf, Sigbovik, Reproducible ML, Unsolved ML, ODS coaching, ODS concert, Random beer
- А также картинная галерея графиков/визуализаций и многое другое

Регистрация уже открыта.
Страница мероприятия: http://xxtt.ru/datafest6
#events : Moscow Spark Meetup #7
Когда: 17 (среда) апреля 2019, 19:00 - 22:00
Место: МегаФон, Оружейный переулок, д.41
Язык докладов - русский

В следующую среду пройдет Moscow Spark Meetup #7.
Блок докладов:
- Рустам Аляутдинов "Стриминг в упряжке с Кассандрой: хорошие практики и подводные камни"
- Андрей Титов "Стримы на питоне. Слабоумие и отвага"
- Дмитрий Урсегов "Перспективы использования GPU в обработке данных"

Обязательна регистрация: http://xxtt.ru/dfc6
#events : SysML Meetup #1
Когда: 12 (пятница) апреля 2019, 18:30 - 21:00
Место: Сбербанк, Кутузовский пр-т, д.32 корп.1
Язык докладов - русский

Уже завтра пройдет первый SysML Meetup.
SysML (ML Engineering) — это область анализа данных, в которой внимание уделяется вопросам применения машинного обучения в продакшне. На митапах мы обсуждаем почему некоторые из подходов из Kaggle-конкурсов не работают на реальных задачах, в чем особенность больших нагрузок при применения машинного обучения, как считать тяжелые фичи на лету.
Блок докладов:
- Ирина Степанюк "Построение системы модерации сообщений"
- Михаил Марюфич "Гонка со спамерами: поиск дубликатов в миллионах объявлений"
- Андрей Авдеев "Инженерный подход к построению рекомендательной системы"
Регистрация закроется сегодня в полночь, не пропустите.

Обязательна регистрация: http://xxtt.ru/sysml1
#events : Moscow Data Science Major
Когда: 20 (суббота) апреля 2019, 12:00 - 18:00
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Уже завтра пройдет Moscow Data Science Major.
Последняя возможность зарегистрироваться (до завтра, 10.00)
На мероприятии будет секция из 3-х докладов про язык R, доклад о конкурсе рекомендаций Okko и об опыте использования AirFlow.

Обязательна регистрация: http://xxtt.ru/9f2c
До конца регистрации на DataFest осталось чуть больше часа. Время чтобы отложить все дела и потратить 2-3 минуты на регистрацию. Завтра и послезавтра нас ждут увлекательнейшие секции и доклады! До встречи!

#events : DataFest #6
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский datafest.ru
#events : Митап по использованию AI & BigData в маркетинге
Когда: 23 и 24 мая 2019, 15:00 - 21:00
Место: Пространство "Весна", Спартаковский переулок, 2с1
Язык докладов - русский, английский

Завтра и послезавтра пройдет митап, посвященный использованию машинного обучения в маркетинге.
Программная сетка уже сформирована:

День первый
- Валерий Бабушкин "Как ускорить А/Б тестирование в разы"
- Максим Годзи "ML анализ траекторий пользователей для динамического управления трафиком и оптимизации интерфейса"
- Александр Рыжков "Метаобучение в AutoML: как строить модели быстрее"
- Дмитрий Панчев "Прогнозирование качества аудитории с помощью autoencoder"
- Давид Вачадзе "Статистические модели BTYD: анализ оттока и LTV в обычных неконтрактных покупках"

День второй
- Кирилл Шиденко "Практический AI. Как маркетологу начать использовать ИИ уже сегодня"
- Денис Ладанов "Маркетинг: творчество или математика? Какие задачи маркетинга реально решить алгоритмами, а какие останутся в руках людей в ближайшие 2 года"
- Samer Fatayri "Protecting your app from bots"
- Андрей Осинцев "Кейс Связной Трэвел: Как Retention engineering изменил наш способ думать о сегментации клиентов"
- "Три кейса: Применение ML для оптимизации Google UAC на примерах Superjob, Zeptolab, Делимобиль"
- Павел Пекичев "Кейс Ozon: Немного статистики - много кросс-продаж"

Сайт мероприятия: http://xxtt.ru/c33e
Посещение одного дня на выбор является бесплатным: http://xxtt.ru/7fa1
#events : Yandex Self-Driving meetup
Когда: 8 (суббота) июня 2019, 11:30 - 20:00 (сбор в 10:30)
Место: Яндекс, Москва, Цех беспилотных автомобилей (адрес держится в секрете, его отправят в письме с приглашением)
Язык докладов - русский

Яндекс проведет митап, посвященный беспилотным автомобилям.
На мероприятии можно будет послушать доклады, посмотреть интерактивные стенды различных систем беспилотного автомобиля, позадавать интересующие вас вопросы.
Уникальная возможность взглянуть на реальный сборочный цех и увидеть беспилотный автомобиль на реальном маршруте.
Число мест ограничено - 100, потому организаторы просят решить небольшую задачку для отбора слушателей.
Также стоит отметить, что место проведения мероприятия не офис Яндекса на ул. Льва Толстого и будет только в пригласительных.

Расписание:
10:30 — Сбор
11:30 — Доклады:
Антон Слесарев и Павел Воробьев "О беспилотном автомобиле из первых уст"
Роман Удовиченко "Поведение беспилотного автомобиля в условиях неопределенности"
Сергей Першин "Сенсоры и вычислительное оборудование в беспилотных автомобилях Яндекса"
Павел Картавый "Как беспилотному автомобилю не потеряться в большом городе или задача локализации"
14:00 — Обед
15:00 — Демонстрация стендов и беспилотного автомобиля, неформальное общение:
Симулятор: как беспилотный автомобиль реагирует на препятствия
Железо: устройство вычислительного центра
Визуализация: посмотреть на мир глазами беспилотного автомобиля
Калибровка: настройка сенсоров

В ответ на регистрацию вам придет задание, которое нужно решить до 29 мая.
Удачи с ее решением, почитайте еще про "Total Least Squares"!

Обязательна регистрация: http://xxtt.ru/5fcf
#competitions : ID RnD Anti-Spoofing Challenge
Необходимо детектировать spoofing-атаки лица (подмену реального лица человека фотографией или маской)
Данных ~ 30Gb изображений
Дедлайн: 20/06/2019 (1 месяц)
Призовой фонд: 600.000 руб (1st - 300.000 руб, 2nd - 150.000 руб, 3rd - 75.000 руб, за самое интересное решение от организаторов - 75.000 руб)

Системы идентификации пользователей по лицу подвержены spoofing-атакам — искусственным подменам, запутывающим распознавание. В рамках соревнования участникам предлагается сделать алгоритм выявления spoofing-атаки. Используется контейнерный формат решений.

Подробнее про конкурс: http://xxtt.ru/idrnd-antispoof
#events : ok.tech: Data Толк
Когда: 13 (четверг) июня 2019, 19:00 - 22:00 (сбор гостей с 18:30)
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Митап будет состоять из двух секций.
В первой секции специалисты компаний Яндекс.Такси, Одноклассники, ivi.ru и tutu.ru выступят с 15 минутными докладами об их опыте использования хранилищ данных.
Во второй секции всем слушателям представляется возможность поучаствовать в открытой дискуссии, задать вопросы спикерам или поделиться своим опытом.
Формат не предполагает большое число слушателей, потому не стоит горевать из-за отказа.
Пока наличие трансляции не гарантировано, но организаторы не исключают возможность трансляции секции докладов.
Модератором мероприятия будет классный Алексей Чернобровов.

День первый
(19:05 — 19:20) Федор Лаврентьев "Граница между Hadoop и MPP базами данных"
(19:20 — 19:35) Денис Габайдулин "Эволюция DWH в Одноклассниках"
(19:35 — 19:50) Ольга Макарова "Переход на ClickHouse: что нас ждало"
(19:50 — 20:05) Илья Середа "Где сегодня использовать elasticsearch"
(20:05 — 20:30) Q&A секция
(20:45 — 22:00) Дискуссия

Обязательна регистрация: http://xxtt.ru/oktech_datatolk
#events : PyData Moscow Meetup #8
Когда: 22 (суббота) июня 2019, 12:00 - 17:00 (сбор в 11:00)
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Восьмой PyData Moscow Meetup пройдет в офисе Mail.ru Group параллельно с PyCon Meetup.
Регистрация одна, а вы уже можете комбинировать доклады разных секций.
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python. Все как Вы любите.

Блок PyData докладов:
- Петр Ермаков "Как использовать JupyterHub на 100% на примере ML-школы DataGym и компании Lamoda"
- Виталий Радченко "Оформление пайплайна в NLP проекте​"
- Дмитрий Буслов "Стекаем и Блендим. Разбор популярных библиотек Python"
- Максим Кочуров "PyMC3 — Bayesian Statistical Modelling in Python"
- Дмитрий Сергеев "‘Кис-кис, вдыхай меня через кес’ или о чем говорят любители рэпа: Python для тематического моделирования комментариев Вконтакте"

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/pydata8
#events : Machine Learning REPA: Reproducible ML experiments
Когда: 18 (вторник) июня 2019, 19:00 - 21:00 (сбор в 18:30)
Место: Raiffeisenbank, проспект Андропова, д.18, корп.2
Язык докладов - русский

Встречаем новый ML-meetup в Москве:
Machine Learning REPA - Reproducibility, Experiments and Pipelines Automation.
Митап посвящен управлению экспериментами, воспроизводимости и автоматизации в машинном обучении.
Первый митап и уже с воркшопом 👍

Доклады:
- Эмели Драль "ML-based services for manufacturing: from reproducibility to automation"
- Роман Тезиков "Reproducibility in CV. Overview"
- Михаил Рожков "Workshop: DVC для автоматизации ML экспериментов и версионирования данных. Разбираемся с внутренностями: как работает, как и когда использовать"

К сожалению Регистрация уже закрыта (http://xxtt.ru/mlrepa).
Но будет доступна трансляция: http://xxtt.ru/mlrepa_broadcast
#events #competitions : Machines Can See
Когда: 25 (вторник) июня 2019, 10:20 - 19:15 (сбор в 9:30)
Место: Цифровое Деловое Пространство, ул. Покровка, д. 47
Язык докладов - английский, русский

Machines Can See — это третий ежегодный международный саммит в области компьютерного зрения и машинного обучения.

На конференции выступят приглашенные спикеры:
- Эрве Жегу (Facebook AI Research)
- Марк Поллефейс (Microsoft, ETH Zurich)
- Мубарак Ша (ETH, Microsoft)
- Пьетро Перона (Amazon, Caltech)
- Алексей Досовицкий (Google Brain)
- Гари Брадски (Arraiy)
- Ясонас Коккинос (UCL, Ariel Al)
- Эндрю Фитцгиббон (Microsoft)

Помимо выступлений спикеров, в рамках саммита пройдет постерная и демо сессия и соревнование. Задача соревнования состоит в создании алгоритма, способного наиболее точно распознать лицо человека в наборе видеокадров. Победители разделят денежный фонд в размере 500 тысяч рублей и призы от партнеров.

Обязательна регистрация: http://xxtt.ru/mcs2019_reg
Сайт мероприятия: http://xxtt.ru/mcs2019
💪 Мы запустили школу машинного обучения - *DataGym* (https://datagym.ru) 💪
#не_реклама #мой_канал #что_хочу_то_и_пишу
У нас богатый опыт преподавания на разных курсах и много идей, что нужно улучшить,поэтому мы запускаем свою школу (пока очно, пока Москва).

Наша команда преподавателей – опытные лекторы и практикующие Data Scientist-ы:
- Петр Ермаков, Senior Data Scientist @ Lamoda, https://linkedin.com/in/ermakovpetr
- Андрей Шестаков, Team Lead Data Scientist @ Mail.ru Group, https://linkedin.com/in/shestakoffandrey
- Михаил Трофимов, Senior Data Scientist @ Joom, https://linkedin.com/in/mikhailtrofimovmipt
- Эдуард Клышинский, Доцент @ Высшая Школа Экономики, МГТУ им.Баумана, https://linkedin.com/in/eduardklyshinsky
- Дмитрий Сергеев, Teaching Assistant @ Aalto University, https://www.linkedin.com/in/sergeyevdmitry

На курсе 15 лекций по 3 часа, 17 практических заданий, 10-часовой хакатон и 2-х недельный курсовой проект (полная программа на https://datagym.ru).
В своем курсе мы делаем упор на практику, большинство задач сделаны на реальных наборах данных в формате соревнования. Студентам выделяется доступ на сервер, чтобы минимизировать технические проблемы.

DataGym 🏋️‍♂️ Тренируем ваши знания в Data Science.
Осталось 2 дня по сниженной цене.
#events : ML-тренировка
Когда: 13 (суббота) июля 2019, 12:00 - 16:30 (сбор в 11:30)
Место: МегаФон, Оружейный переулок, 41
Язык докладов - русский

ML-тренировки - выступление Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.
- Алексей Натекин "Open Science & Open Data Science"
- Дмитрий Кустиков "Kaggle iMet Collection 2019 — FGVC6"
- Роман Власов "Data Souls IDRND Anti-spoofing Challenge"
- Илья Денисов "Kaggle iMaterialist (Fashion) 2019 at FGVC6"
- Кирилл Бродт "Финал соревнования по машинному обучению от Яндекс Контест"

Помимо выступлений, также пройдет дискуссия о private sharing-ах и сбор групп для решения NIPS Competitions Track.
Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/be78
#events : ML-тренировка
Когда: 3 (суббота) августа 2019, 12:00 - 15:00 (сбор в 11:30)
Место: Авито, Лесная ул, 7, 15 этаж (Москва)
Язык докладов - русский, английский

ML-тренировки - выступление Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.

Регистрация открыта до 17.00 сегодня (3 часа).
- Илья Ларченко "Kaggle Freesound Audio Tagging 2019"
- Илья Иваницкий "Финальный этап International Data Analysis Olympiad"
- Николай Сергиевский "Signate Соревнование по распознаванию сигаретных пачек"
- Алексей Могильников "Kaggle LANL Earthquake Prediction"

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/a772
#events : Machine Learning REPA: Data and Models Version control in Computer Vision
Когда: 15 (четверг) августа 2019, 19:00 - 21:00 (сбор в 18:30)
Место: Raiffeisenbank, проспект Андропова, д.18, корп.2
Язык докладов - русский

Уже второй Machine Learning REPA - Data and Models Version control in Computer Vision
Митап посвящен управлению экспериментами, воспроизводимости и автоматизации в машинном обучении.
Второй митап будет о воспроизводимости в компьютерном зрении

Доклады:
- Михаил Рожков "ML REPA: анонсы тем ближайших митапов и обзор инструментов"
- Влад Грозин "MLFlow для обеспечения воспроизводимости экспериментов"
- Роман Тезиков "Wokrshop: Dive into Catalyst"
- Дмитрий Никулин "Experiment management in research: case study"

Обязательна регистрация: http://xxtt.ru/mlrepa2