DataGym Channel [Power of data]
2.57K subscribers
29 photos
1 video
1 file
113 links
Канал про Data Science и BigData.
Реклама в канале через благ.фонды: https://telegra.ph/Reklama-v-kanale-12-21
Для связи: @ermakovpetr
Download Telegram
#events : Яндекс изнутри: рекомендательные системы Музыки и Дзена
Когда: 16 (суббота) февраля 2018, 12:00 - 18:00 (сбор гостей с 11:30)
Место: Яндекс, ул. Льва Толстого, д.16, зал Экстрополис
Язык докладов - русский.

Митап от сотрудников Яндекса, посвященный рекомендательным системам Яндекс.Музыки и Яндекс.Дзена.
Также в рамках митапа пройдет воркшоп.

(12:20 - 12:50) Даниил Бурлаков "Как рекомендовать музыку, которую почти никто не слушал"
(12:50 - 13:20) Антон Фролов "Дзен — рекомендательная система с несколькими игроками"
(13:40 - 14:10) Дмитрий Ушанов "Устройство рекомендательной системы сервиса Яндекс.Дзен"
(14:10 - 14:40) Евгений Крофто "Секретный доклад"

А в 15:00 начнется воркшоп по рекомендательным системам для музыки и текстов.
Воркшоп проведут Даниил Бурлаков (руководитель группы рекомендательных продуктов Медиасервисов Яндекса) и Евгений Соколов (руководитель группы качества рекомендаций и анализа контента Яндекс.Дзена, заместитель руководителя ФКН НИУ ВШЭ)
Но обратите внимание, что при регистрации необходимо отметить "Я хочу принять участие в воркшопе" и пройти небольшой тест.

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/4c1f
#events : Data&Science: цифровые методы в гуманитарных науках
Когда: 2 (суббота) марта 2019, 12:00 - 16:00 (сбор гостей с 11:00)
Место: Яндекс, ул. Льва Толстого, д.16, залы Экстрополис и Мулен Руж
Язык докладов - русский и английский
По мере оцифровки культурного наследия человечества цифровые методы приносят всё большую пользу историкам, литературоведам, социологам. Например:
- Как проанализировали тысячи стенограмм первого французского парламента и что получили.
- Как компьютер помогает читать китайские стихи и хороши ли его собственные.
- Как на данных Твиттера проводят глобальные исследования здоровья, а на данных мобильных операторов — исследования бедности.

В этот раз собрана большая программа про цифровые методы в гуманитарных науках – истории, литературоведении, культурологии, социологии:
- Даниил Скоринкин "Цифровые методы в гуманитарных науках"
- Frank Fischer "Digital Humanities Between Research and Infrastructure"
- Динара Гагарина "Истории о Data Science в истории"
- Лев Манович "Наука о данных в анализе современной культуры"
- Даниил Александров "Data Science в социальных науках"
- Борис Орехов "Чем может и чем не может наука о данных помочь науке о литературе"
- Илья Гусев "Как научить нейросеть генерировать стихи"
- Мариана Зорькина "Компьютеры читают: как статистика и нейросети помогают лучше понять поэзию средневекового Китая"

Это последняя встреча в формате Data&Science в Яндексе. Все хорошее когда нибудь заканчивается 😔
Обязательна регистрация: http://xxtt.ru/ad96
#competitions : Rekko Challenge 2019
#реклама : появление данного поста проспонсировано

Соревнование по машинному обучению от онлайн-кинотеатра Okko. В рамках соревнования необходимо построить рекомендательную систему для предсказания контента, который потребит пользователь.

Элементов контента (фильмы и серии сериалов): 10.200
Число пользователей, для которых нужно сделать предсказания: 50.000
Всего пользователей: ~ 500.000
Сумарный размер данных: ~430MB
Для каждого пользователя предсказать 20 элементов контента, которые он потребит за тестовые 60 дней.
Дедлайн: 18/04/2019 (почти 2 месяца)
Призовой фонд: 600.000 руб (1st - 300.000 руб, 2nd - 200.000 руб, 3rd - 100.000 руб)

Большинство данных анонимизированы (даже время потребления контента выражено в абстрактных единицах), но использование внешних данных организаторами не запрещено, что делает из задачи дополнительный квест =)
Ссылка на соревнование http://xxtt.ru/a846
Ссылка на чат обсуждения в телеграмме: http://xxtt.ru/586a
#events : Yandex.Taxi Data Driven: Митап аналитиков в Яндекс.Такси
Когда: 23 (суббота) марта 2019, 11:00 - 17:00
Место: Яндекс, ул. Льва Толстого, д.16
Язык докладов - русский

Пройдет очередная встреча аналитиков Data Driven в Яндексе.
Встреча будет состоять из двух блоков: блок докладов и блок кейсов.
Блок докладов:
- "Как доставлять больше заказов меньшими силами"
Владислав Лукьянов, аналитик Яндекс.Еды
- "Как продать больше билетов, чем мест в самолёте"
Глеб Сологуб, директор по аналитике Skyeng
- "Рекомендации удобных точек посадки в Яндекс.Такси"
Сергей Тильга, разработчик ML Яндекс.Такси
Блок кейсов пройдет в формате брейншторма, где слушателям, поделившись на группы, предстоит решать реальные рабочие аналитические задачи вместе с сотрудниками Яндекс.Такси.

Регистрация открыта до 13 марта, но количество мест ограничено (150 мест).
Так как желающих обычно в 6-10 раз больше, в форме регистрации организаторы просят решить пару аналитических задачек, чтобы на мероприятии были только те, кому не будет сложно или скучно.
Страница мероприятия: http://xxtt.ru/3183
Обязательна регистрация: http://xxtt.ru/86ea
#education #school : Начался набор в международную летнюю школу по машинному обучению: “Machine Learning Summer School” (MLSS)
В этот раз школа пройдет в Москве на территории Skoltech (Сколково)
Даты летней школы: 26 (понедельник) августа 2019 - 6 (пятница) сентября 2019
Подачи заявок: до 6 (понедельник) мая 2019
Место: Skoltech, Сколково, Москва
Язык обучения - английский

Основная аудитория: аспиранты. но рассматривают как мастеров так и окончивших образование
Сборы: 400/550/1000 евро для студентов/постдоков и преподавателей/остальных (в том числе работающих в индустрии)
Возможны спонсорское стипендиальное покрытие (полное или частичное (25%))
Организаторы: Фернандо Перес Круз, Евгений Бурнаев, Родриго Ривера Кастро

Предварительные темы:
Kernels - Arthur Gretton
Fairness & Interpretability - Isabel Valera
Causality - Joris Mooij
3D Deep Learning - Justin Solomon
Optimal Transport - Marco Cuturi
To be confirmed - Mark Girolami
Graph Neural Networks - Michael Bronstein
ML for Magnetic Resonance Imaging - Michel Besserve
Online Learning - Nicolò Cesa-Bianchi
Reinforcement Learning - Shimon Whiteson
Topological Data Analysis - Ulrich Bauer
Bayesian Deep Learning - Yarin Gal

Сайт школы: http://xxtt.ru/mlss2019
#events : PyData Moscow Meetup #6
Когда: 18 (понедельник) марта 2019, 19:00 - 21:40 (сбор гостей с 18:30)
Место: ДомКлик (офис Сбербанк), Кутузовский проспект, 32 корп.1, Москва
Язык докладов - русский

Это шестой по счету митап PyData Moscow. В этот раз мы собрали доклады связанные с обработкой изображений, OCR, Reinforcement Learning и динамической визуализацией:
(19:00 - 19:30) Александр Паринов "Albumentations: библиотека для аугментации изображений"
(19:30 - 20:00) Андрей Белов "OCR end2end: распознавание документов, детекция текста и полей"
(20:00 - 20:30) Сергей Колесников "Catalyst: from research to production"
(20:30 - 21:00) Илья Тимофеев "Altair/Vega: интерактивные графики из ноутбука на сайт или d3.js на халяву"

C 21:00 до 21:40 свободное время для вопросов докладчикам в кулуарах и нетворкинга.

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: https://pydata.moscow
#education #event #course : Yandex NLP week: четырёхдневный интенсивный курс по Natural Language Processing
Когда: 26 (вторник) марта 2019 - 29 (пятница) марта 2019 (по вечерам, с 18:00 до 21:00)
Место: Яндекс, ул. Льва Толстого, д.16
Подачи заявок: до 18 (понедельник) марта 2019
Язык докладов - английский

Yandex NLP week — это четырёхдневный интенсивный курс по Natural Language Processing, рассчитанный на разработчиков и исследователей, хорошо знакомых с Natural Language Processing и глубинным обучением. Идейно он является продолжением курса по NLP, прочитанного в Школе анализа данных осенью 2018 года

В рамках курса вы узнаете:
— как латентные переменные применяются в задачах анализа текстов и как строить глубинные генеративные модели с латентными дискретными переменными
— что такое semantic parsing: как строить формальные представления смысла текста, извлекая при этом неявные значения

Расписание занятий:
(26.03, 18:00-21:00) — Wilker Aziz "Latent variable models and posterior inference"
(27.03, 18:00-21:00) — Wilker Aziz "Deep generative models for NLP"
(28.03, 18:00-21:00) — Wilker Aziz "Advanced topics"
(29.03, 18:00-21:00) — Mirella Lapata "Semantic parsing"

Количество мест ограничено. Так как курс предполагается весьма продвинутым, участники будут отобраны на основании анкеты.
Подать заявку: http://xxtt.ru/7867
#events : SmartMail Conf: Machine Learning
Когда: 23 (суббота) марта 2019, 11:00 - 20:00
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Команда Почты Mail.ru проведёт конференцию по машинному обучению SmartMail Conf.
На встрече пройдет обсуждение разработки в области обработки естественного языка, компьютерного зрения и обучения моделей для работы со спамом.
Предварительный список докладов:
— Дмитрий Меркушов "Антиспам: Дообучение моделей распознавания спама на постоянной основе"
— Андрей Бояров "Vision: Распознавание достопримечательностей на изображениях"
— Дмитрий Парпулов "Smart Reply"
— Виктор Могилин "High Load Service"
— Софья Киселева "DIY: Девайсы, камеры, стойки распознавания лиц"
— Иван Мыздриков "Как поженить продукт с Machine Learning"

В конце конференции пройдёт нетворк-сессия: участники конференции смогут в неформальной обстановке пообщаться на животрепещущие темы. Организаторы обещают пиво, пиццу и хорошую компанию =)
Страница мероприятия: http://xxtt.ru/a753
#events : День рождения ODS в Минске, Санкт-Петербурге и Москве
Минск: 12 (вторник) марта 2019, 19:00 - 21:00, ул. Октябрьская 16/4, SPACE
Санкт-Петербург: 15 (пятница) марта 2019, 19:00 - 21:00, ул. Заставская, 22А, SEMrush
Москва: 15 (пятница) марта 2019, 18:30 - 21:00, Ленинградский пр-т, д. 39, стр.79, Mail.Ru

ODS - это крупнейшее рускоговорящее (и не только) сообщество, состоящее из более чем 29.000 ученых, исследователей и инженеров, работающих с данными и содействующих свободному обмену знаниями, идеями, возможностями и профессиональным развитием посредством высококачественных мероприятий, онлайн-дискуссий и других ресурсов.
13 марта ODS празднует 4 года. По этому случаю в Минске, Санкт-Петербурге и Москве пройдут митапы с серьезными и не очень докладами.

Ссылки с описанием и регистрацией.
Минск: http://xxtt.ru/minsk_ods_bd_2019
Санкт-Петербург: http://xxtt.ru/spb_ods_bd_2019 Москва: http://xxtt.ru/msk_ods_bd_2019
#competitions : RecSys 2019 Challenge
Необходимо построить рекомендательную систему для метапоисковика отелей trivago
Дедлайн: 30/06/2019 (3.5 месяца)
Призовой фонд: пока не ясен, по опыту прошлых лет достаточно небольшой (2018: 1st - 4.000$, 2nd - 2.000$, 3rd - 1.000$, 2017: 1st - 3.000€, 2nd - 1.500€, 3rd - 500€)

Требуется на основе пользовательский сессий для пропущенных действий отсортировать объекты размещения.
Данных ~ 3Gb
Соревнование обещали объявить еще в январе, но данные появились только в начале марта, потому сроки немного продлили.

Подробнее про конкурс: http://xxtt.ru/recsys2019
#events : 🇧🇾 DataFest Minsk 🇧🇾
Когда: 27 (суббота) апреля 2019, 11:00 - 20:00
Место: Галерея Ў, улица Октябрьская 19, Минск, Беларусь
Язык докладов - русский

В конце апреля пройдет однодневный DataFest в Минске.
Доклады будут идти в 2 потока и уже есть предварительная программа:
- Кирилл Жданович "Speech recognition from 0 to 100"
- Евгений Макаров "Modern Facial Landmark Estimation and Tracking: from tree-based regressors to deep learning approaches"
- Дмитрий Северинец "Создание Data Science архитектуры на базе Apache Airflow"
- Михаил Рожков "Начните с контроля версий и управления экспериментами в ML проектах: обеспечение воспроизводимости результатов"
- Петр Ромов "Анализ реплеев компьютерных игр"
- и другие

Зарегистрироваться можно бесплатно, а можно пожертвовать 40 белорусских рублей и получить памятную футболку.
Я уже взял билеты в Минск и вам советую не откладывать.
Страница мероприятия: http://xxtt.ru/datafestby
(А уже вечером будет анонс самого большого Data Science мероприятия восточного полушария)
#events : DataFest #6 🎉 🦜
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский

В мае пройдет главное data science мероприятие года.
2 полных дня, 60 секций, 200 докладов, 10.000 гостей.
- Список секций первого (индустриального) дня:
Mega keynote, ML economics, Healthcare applications, E-commerce applications, Media applications, DS education, Poster pitch-session, Innovation board panel, A/B testing, Manufacturing applications, Banking applications, Telecom applications, Data collection & labeling, ODS Q&A, Data-driven culture, DS processes, Biometric Applications, Smartphone applications, WiML, Project pitch-session, Mini meeetups, Mythbusters, DS hiring, Industry CV/Video, Industry NLP, Industry speech, WiML workshop, Mini meetups, MLcourse finale
- Список секций второго (научного) дня:
Machine learning legends panel, Big Data / Data Engineering, ML trainings, PyData, Reinforcement Learning, ML4SG, Open microphone, ML keynotes, ML Engineering / SysML, Black ML, iPavlov workshop, DeepBayes workshop, EDA & visualisation, Fit ML, Что? Где? Когда? DS edition, BigARTM workshop, Deep CV workshop, ODS projects, Unconference, ML puzzler, Failconf, Sigbovik, Reproducible ML, Unsolved ML, ODS coaching, ODS concert, Random beer
- А также картинная галерея графиков/визуализаций и многое другое

Регистрация уже открыта.
Страница мероприятия: http://xxtt.ru/datafest6
#events : Moscow Spark Meetup #7
Когда: 17 (среда) апреля 2019, 19:00 - 22:00
Место: МегаФон, Оружейный переулок, д.41
Язык докладов - русский

В следующую среду пройдет Moscow Spark Meetup #7.
Блок докладов:
- Рустам Аляутдинов "Стриминг в упряжке с Кассандрой: хорошие практики и подводные камни"
- Андрей Титов "Стримы на питоне. Слабоумие и отвага"
- Дмитрий Урсегов "Перспективы использования GPU в обработке данных"

Обязательна регистрация: http://xxtt.ru/dfc6
#events : SysML Meetup #1
Когда: 12 (пятница) апреля 2019, 18:30 - 21:00
Место: Сбербанк, Кутузовский пр-т, д.32 корп.1
Язык докладов - русский

Уже завтра пройдет первый SysML Meetup.
SysML (ML Engineering) — это область анализа данных, в которой внимание уделяется вопросам применения машинного обучения в продакшне. На митапах мы обсуждаем почему некоторые из подходов из Kaggle-конкурсов не работают на реальных задачах, в чем особенность больших нагрузок при применения машинного обучения, как считать тяжелые фичи на лету.
Блок докладов:
- Ирина Степанюк "Построение системы модерации сообщений"
- Михаил Марюфич "Гонка со спамерами: поиск дубликатов в миллионах объявлений"
- Андрей Авдеев "Инженерный подход к построению рекомендательной системы"
Регистрация закроется сегодня в полночь, не пропустите.

Обязательна регистрация: http://xxtt.ru/sysml1
#events : Moscow Data Science Major
Когда: 20 (суббота) апреля 2019, 12:00 - 18:00
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Уже завтра пройдет Moscow Data Science Major.
Последняя возможность зарегистрироваться (до завтра, 10.00)
На мероприятии будет секция из 3-х докладов про язык R, доклад о конкурсе рекомендаций Okko и об опыте использования AirFlow.

Обязательна регистрация: http://xxtt.ru/9f2c
До конца регистрации на DataFest осталось чуть больше часа. Время чтобы отложить все дела и потратить 2-3 минуты на регистрацию. Завтра и послезавтра нас ждут увлекательнейшие секции и доклады! До встречи!

#events : DataFest #6
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский datafest.ru
#events : Митап по использованию AI & BigData в маркетинге
Когда: 23 и 24 мая 2019, 15:00 - 21:00
Место: Пространство "Весна", Спартаковский переулок, 2с1
Язык докладов - русский, английский

Завтра и послезавтра пройдет митап, посвященный использованию машинного обучения в маркетинге.
Программная сетка уже сформирована:

День первый
- Валерий Бабушкин "Как ускорить А/Б тестирование в разы"
- Максим Годзи "ML анализ траекторий пользователей для динамического управления трафиком и оптимизации интерфейса"
- Александр Рыжков "Метаобучение в AutoML: как строить модели быстрее"
- Дмитрий Панчев "Прогнозирование качества аудитории с помощью autoencoder"
- Давид Вачадзе "Статистические модели BTYD: анализ оттока и LTV в обычных неконтрактных покупках"

День второй
- Кирилл Шиденко "Практический AI. Как маркетологу начать использовать ИИ уже сегодня"
- Денис Ладанов "Маркетинг: творчество или математика? Какие задачи маркетинга реально решить алгоритмами, а какие останутся в руках людей в ближайшие 2 года"
- Samer Fatayri "Protecting your app from bots"
- Андрей Осинцев "Кейс Связной Трэвел: Как Retention engineering изменил наш способ думать о сегментации клиентов"
- "Три кейса: Применение ML для оптимизации Google UAC на примерах Superjob, Zeptolab, Делимобиль"
- Павел Пекичев "Кейс Ozon: Немного статистики - много кросс-продаж"

Сайт мероприятия: http://xxtt.ru/c33e
Посещение одного дня на выбор является бесплатным: http://xxtt.ru/7fa1
#events : Yandex Self-Driving meetup
Когда: 8 (суббота) июня 2019, 11:30 - 20:00 (сбор в 10:30)
Место: Яндекс, Москва, Цех беспилотных автомобилей (адрес держится в секрете, его отправят в письме с приглашением)
Язык докладов - русский

Яндекс проведет митап, посвященный беспилотным автомобилям.
На мероприятии можно будет послушать доклады, посмотреть интерактивные стенды различных систем беспилотного автомобиля, позадавать интересующие вас вопросы.
Уникальная возможность взглянуть на реальный сборочный цех и увидеть беспилотный автомобиль на реальном маршруте.
Число мест ограничено - 100, потому организаторы просят решить небольшую задачку для отбора слушателей.
Также стоит отметить, что место проведения мероприятия не офис Яндекса на ул. Льва Толстого и будет только в пригласительных.

Расписание:
10:30 — Сбор
11:30 — Доклады:
Антон Слесарев и Павел Воробьев "О беспилотном автомобиле из первых уст"
Роман Удовиченко "Поведение беспилотного автомобиля в условиях неопределенности"
Сергей Першин "Сенсоры и вычислительное оборудование в беспилотных автомобилях Яндекса"
Павел Картавый "Как беспилотному автомобилю не потеряться в большом городе или задача локализации"
14:00 — Обед
15:00 — Демонстрация стендов и беспилотного автомобиля, неформальное общение:
Симулятор: как беспилотный автомобиль реагирует на препятствия
Железо: устройство вычислительного центра
Визуализация: посмотреть на мир глазами беспилотного автомобиля
Калибровка: настройка сенсоров

В ответ на регистрацию вам придет задание, которое нужно решить до 29 мая.
Удачи с ее решением, почитайте еще про "Total Least Squares"!

Обязательна регистрация: http://xxtt.ru/5fcf
#competitions : ID RnD Anti-Spoofing Challenge
Необходимо детектировать spoofing-атаки лица (подмену реального лица человека фотографией или маской)
Данных ~ 30Gb изображений
Дедлайн: 20/06/2019 (1 месяц)
Призовой фонд: 600.000 руб (1st - 300.000 руб, 2nd - 150.000 руб, 3rd - 75.000 руб, за самое интересное решение от организаторов - 75.000 руб)

Системы идентификации пользователей по лицу подвержены spoofing-атакам — искусственным подменам, запутывающим распознавание. В рамках соревнования участникам предлагается сделать алгоритм выявления spoofing-атаки. Используется контейнерный формат решений.

Подробнее про конкурс: http://xxtt.ru/idrnd-antispoof