DataGym Channel [Power of data]
2.57K subscribers
29 photos
1 video
1 file
113 links
Канал про Data Science и BigData.
Реклама в канале через благ.фонды: https://telegra.ph/Reklama-v-kanale-12-21
Для связи: @ermakovpetr
Download Telegram
☝️🎄Регистрация на CCCV18 возобновилась, а в программе появился 6-ой доклад: 19:00 — 19:30 Sergey Tulyakov (Snap Inc, California), “Learning representations for video generation, prediction and retargeting”
#education #courses : Начался весенний запуск курса по Deep Learning от Университета Карнеги - Меллона
Мы решили организовать группу людей, которые хотят самостоятельно проходить этот курс параллельно.
В открытом доступе выходят только видеолекции, но нам удалось связаться с профессором и он пообещал дать доступы к тестам, коду и конкурсам на Kaggle In-Class. Мы уже подняли всю необходимую инфраструктуру и набираем народ в ожидании первых лабораторных от профессора.
Это вторая попытка, первая (полгода назад) не увенчалась успехом. Но профессор уверил, что у нас все получится.
Регистрация на курс происходит по адресу https://dlcourse.ru (бесплатно и без смс 🙂 )
Регистрация обязательна - вскоре зарегистрированным откроются:
1) видео; 2) тесты; 3) задание на написание кода; 4) конкурсы Kaggle In-Class; 5) платформа для коммуникации, вопросов и взаимовыручки
У регистрации нет дедлайна, присоединиться можно когда угодно, но дедлайн будет у тестов и домашних работ.
После регистрации вы также получите доступ к чату, где будут появляться все анонсы.
Язык лекций: английский, язык чата: русский и английский.
#events : Яндекс изнутри: рекомендательные системы Музыки и Дзена
Когда: 16 (суббота) февраля 2018, 12:00 - 18:00 (сбор гостей с 11:30)
Место: Яндекс, ул. Льва Толстого, д.16, зал Экстрополис
Язык докладов - русский.

Митап от сотрудников Яндекса, посвященный рекомендательным системам Яндекс.Музыки и Яндекс.Дзена.
Также в рамках митапа пройдет воркшоп.

(12:20 - 12:50) Даниил Бурлаков "Как рекомендовать музыку, которую почти никто не слушал"
(12:50 - 13:20) Антон Фролов "Дзен — рекомендательная система с несколькими игроками"
(13:40 - 14:10) Дмитрий Ушанов "Устройство рекомендательной системы сервиса Яндекс.Дзен"
(14:10 - 14:40) Евгений Крофто "Секретный доклад"

А в 15:00 начнется воркшоп по рекомендательным системам для музыки и текстов.
Воркшоп проведут Даниил Бурлаков (руководитель группы рекомендательных продуктов Медиасервисов Яндекса) и Евгений Соколов (руководитель группы качества рекомендаций и анализа контента Яндекс.Дзена, заместитель руководителя ФКН НИУ ВШЭ)
Но обратите внимание, что при регистрации необходимо отметить "Я хочу принять участие в воркшопе" и пройти небольшой тест.

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/4c1f
#events : Data&Science: цифровые методы в гуманитарных науках
Когда: 2 (суббота) марта 2019, 12:00 - 16:00 (сбор гостей с 11:00)
Место: Яндекс, ул. Льва Толстого, д.16, залы Экстрополис и Мулен Руж
Язык докладов - русский и английский
По мере оцифровки культурного наследия человечества цифровые методы приносят всё большую пользу историкам, литературоведам, социологам. Например:
- Как проанализировали тысячи стенограмм первого французского парламента и что получили.
- Как компьютер помогает читать китайские стихи и хороши ли его собственные.
- Как на данных Твиттера проводят глобальные исследования здоровья, а на данных мобильных операторов — исследования бедности.

В этот раз собрана большая программа про цифровые методы в гуманитарных науках – истории, литературоведении, культурологии, социологии:
- Даниил Скоринкин "Цифровые методы в гуманитарных науках"
- Frank Fischer "Digital Humanities Between Research and Infrastructure"
- Динара Гагарина "Истории о Data Science в истории"
- Лев Манович "Наука о данных в анализе современной культуры"
- Даниил Александров "Data Science в социальных науках"
- Борис Орехов "Чем может и чем не может наука о данных помочь науке о литературе"
- Илья Гусев "Как научить нейросеть генерировать стихи"
- Мариана Зорькина "Компьютеры читают: как статистика и нейросети помогают лучше понять поэзию средневекового Китая"

Это последняя встреча в формате Data&Science в Яндексе. Все хорошее когда нибудь заканчивается 😔
Обязательна регистрация: http://xxtt.ru/ad96
#competitions : Rekko Challenge 2019
#реклама : появление данного поста проспонсировано

Соревнование по машинному обучению от онлайн-кинотеатра Okko. В рамках соревнования необходимо построить рекомендательную систему для предсказания контента, который потребит пользователь.

Элементов контента (фильмы и серии сериалов): 10.200
Число пользователей, для которых нужно сделать предсказания: 50.000
Всего пользователей: ~ 500.000
Сумарный размер данных: ~430MB
Для каждого пользователя предсказать 20 элементов контента, которые он потребит за тестовые 60 дней.
Дедлайн: 18/04/2019 (почти 2 месяца)
Призовой фонд: 600.000 руб (1st - 300.000 руб, 2nd - 200.000 руб, 3rd - 100.000 руб)

Большинство данных анонимизированы (даже время потребления контента выражено в абстрактных единицах), но использование внешних данных организаторами не запрещено, что делает из задачи дополнительный квест =)
Ссылка на соревнование http://xxtt.ru/a846
Ссылка на чат обсуждения в телеграмме: http://xxtt.ru/586a
#events : Yandex.Taxi Data Driven: Митап аналитиков в Яндекс.Такси
Когда: 23 (суббота) марта 2019, 11:00 - 17:00
Место: Яндекс, ул. Льва Толстого, д.16
Язык докладов - русский

Пройдет очередная встреча аналитиков Data Driven в Яндексе.
Встреча будет состоять из двух блоков: блок докладов и блок кейсов.
Блок докладов:
- "Как доставлять больше заказов меньшими силами"
Владислав Лукьянов, аналитик Яндекс.Еды
- "Как продать больше билетов, чем мест в самолёте"
Глеб Сологуб, директор по аналитике Skyeng
- "Рекомендации удобных точек посадки в Яндекс.Такси"
Сергей Тильга, разработчик ML Яндекс.Такси
Блок кейсов пройдет в формате брейншторма, где слушателям, поделившись на группы, предстоит решать реальные рабочие аналитические задачи вместе с сотрудниками Яндекс.Такси.

Регистрация открыта до 13 марта, но количество мест ограничено (150 мест).
Так как желающих обычно в 6-10 раз больше, в форме регистрации организаторы просят решить пару аналитических задачек, чтобы на мероприятии были только те, кому не будет сложно или скучно.
Страница мероприятия: http://xxtt.ru/3183
Обязательна регистрация: http://xxtt.ru/86ea
#education #school : Начался набор в международную летнюю школу по машинному обучению: “Machine Learning Summer School” (MLSS)
В этот раз школа пройдет в Москве на территории Skoltech (Сколково)
Даты летней школы: 26 (понедельник) августа 2019 - 6 (пятница) сентября 2019
Подачи заявок: до 6 (понедельник) мая 2019
Место: Skoltech, Сколково, Москва
Язык обучения - английский

Основная аудитория: аспиранты. но рассматривают как мастеров так и окончивших образование
Сборы: 400/550/1000 евро для студентов/постдоков и преподавателей/остальных (в том числе работающих в индустрии)
Возможны спонсорское стипендиальное покрытие (полное или частичное (25%))
Организаторы: Фернандо Перес Круз, Евгений Бурнаев, Родриго Ривера Кастро

Предварительные темы:
Kernels - Arthur Gretton
Fairness & Interpretability - Isabel Valera
Causality - Joris Mooij
3D Deep Learning - Justin Solomon
Optimal Transport - Marco Cuturi
To be confirmed - Mark Girolami
Graph Neural Networks - Michael Bronstein
ML for Magnetic Resonance Imaging - Michel Besserve
Online Learning - Nicolò Cesa-Bianchi
Reinforcement Learning - Shimon Whiteson
Topological Data Analysis - Ulrich Bauer
Bayesian Deep Learning - Yarin Gal

Сайт школы: http://xxtt.ru/mlss2019
#events : PyData Moscow Meetup #6
Когда: 18 (понедельник) марта 2019, 19:00 - 21:40 (сбор гостей с 18:30)
Место: ДомКлик (офис Сбербанк), Кутузовский проспект, 32 корп.1, Москва
Язык докладов - русский

Это шестой по счету митап PyData Moscow. В этот раз мы собрали доклады связанные с обработкой изображений, OCR, Reinforcement Learning и динамической визуализацией:
(19:00 - 19:30) Александр Паринов "Albumentations: библиотека для аугментации изображений"
(19:30 - 20:00) Андрей Белов "OCR end2end: распознавание документов, детекция текста и полей"
(20:00 - 20:30) Сергей Колесников "Catalyst: from research to production"
(20:30 - 21:00) Илья Тимофеев "Altair/Vega: интерактивные графики из ноутбука на сайт или d3.js на халяву"

C 21:00 до 21:40 свободное время для вопросов докладчикам в кулуарах и нетворкинга.

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: https://pydata.moscow
#education #event #course : Yandex NLP week: четырёхдневный интенсивный курс по Natural Language Processing
Когда: 26 (вторник) марта 2019 - 29 (пятница) марта 2019 (по вечерам, с 18:00 до 21:00)
Место: Яндекс, ул. Льва Толстого, д.16
Подачи заявок: до 18 (понедельник) марта 2019
Язык докладов - английский

Yandex NLP week — это четырёхдневный интенсивный курс по Natural Language Processing, рассчитанный на разработчиков и исследователей, хорошо знакомых с Natural Language Processing и глубинным обучением. Идейно он является продолжением курса по NLP, прочитанного в Школе анализа данных осенью 2018 года

В рамках курса вы узнаете:
— как латентные переменные применяются в задачах анализа текстов и как строить глубинные генеративные модели с латентными дискретными переменными
— что такое semantic parsing: как строить формальные представления смысла текста, извлекая при этом неявные значения

Расписание занятий:
(26.03, 18:00-21:00) — Wilker Aziz "Latent variable models and posterior inference"
(27.03, 18:00-21:00) — Wilker Aziz "Deep generative models for NLP"
(28.03, 18:00-21:00) — Wilker Aziz "Advanced topics"
(29.03, 18:00-21:00) — Mirella Lapata "Semantic parsing"

Количество мест ограничено. Так как курс предполагается весьма продвинутым, участники будут отобраны на основании анкеты.
Подать заявку: http://xxtt.ru/7867
#events : SmartMail Conf: Machine Learning
Когда: 23 (суббота) марта 2019, 11:00 - 20:00
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Команда Почты Mail.ru проведёт конференцию по машинному обучению SmartMail Conf.
На встрече пройдет обсуждение разработки в области обработки естественного языка, компьютерного зрения и обучения моделей для работы со спамом.
Предварительный список докладов:
— Дмитрий Меркушов "Антиспам: Дообучение моделей распознавания спама на постоянной основе"
— Андрей Бояров "Vision: Распознавание достопримечательностей на изображениях"
— Дмитрий Парпулов "Smart Reply"
— Виктор Могилин "High Load Service"
— Софья Киселева "DIY: Девайсы, камеры, стойки распознавания лиц"
— Иван Мыздриков "Как поженить продукт с Machine Learning"

В конце конференции пройдёт нетворк-сессия: участники конференции смогут в неформальной обстановке пообщаться на животрепещущие темы. Организаторы обещают пиво, пиццу и хорошую компанию =)
Страница мероприятия: http://xxtt.ru/a753
#events : День рождения ODS в Минске, Санкт-Петербурге и Москве
Минск: 12 (вторник) марта 2019, 19:00 - 21:00, ул. Октябрьская 16/4, SPACE
Санкт-Петербург: 15 (пятница) марта 2019, 19:00 - 21:00, ул. Заставская, 22А, SEMrush
Москва: 15 (пятница) марта 2019, 18:30 - 21:00, Ленинградский пр-т, д. 39, стр.79, Mail.Ru

ODS - это крупнейшее рускоговорящее (и не только) сообщество, состоящее из более чем 29.000 ученых, исследователей и инженеров, работающих с данными и содействующих свободному обмену знаниями, идеями, возможностями и профессиональным развитием посредством высококачественных мероприятий, онлайн-дискуссий и других ресурсов.
13 марта ODS празднует 4 года. По этому случаю в Минске, Санкт-Петербурге и Москве пройдут митапы с серьезными и не очень докладами.

Ссылки с описанием и регистрацией.
Минск: http://xxtt.ru/minsk_ods_bd_2019
Санкт-Петербург: http://xxtt.ru/spb_ods_bd_2019 Москва: http://xxtt.ru/msk_ods_bd_2019
#competitions : RecSys 2019 Challenge
Необходимо построить рекомендательную систему для метапоисковика отелей trivago
Дедлайн: 30/06/2019 (3.5 месяца)
Призовой фонд: пока не ясен, по опыту прошлых лет достаточно небольшой (2018: 1st - 4.000$, 2nd - 2.000$, 3rd - 1.000$, 2017: 1st - 3.000€, 2nd - 1.500€, 3rd - 500€)

Требуется на основе пользовательский сессий для пропущенных действий отсортировать объекты размещения.
Данных ~ 3Gb
Соревнование обещали объявить еще в январе, но данные появились только в начале марта, потому сроки немного продлили.

Подробнее про конкурс: http://xxtt.ru/recsys2019
#events : 🇧🇾 DataFest Minsk 🇧🇾
Когда: 27 (суббота) апреля 2019, 11:00 - 20:00
Место: Галерея Ў, улица Октябрьская 19, Минск, Беларусь
Язык докладов - русский

В конце апреля пройдет однодневный DataFest в Минске.
Доклады будут идти в 2 потока и уже есть предварительная программа:
- Кирилл Жданович "Speech recognition from 0 to 100"
- Евгений Макаров "Modern Facial Landmark Estimation and Tracking: from tree-based regressors to deep learning approaches"
- Дмитрий Северинец "Создание Data Science архитектуры на базе Apache Airflow"
- Михаил Рожков "Начните с контроля версий и управления экспериментами в ML проектах: обеспечение воспроизводимости результатов"
- Петр Ромов "Анализ реплеев компьютерных игр"
- и другие

Зарегистрироваться можно бесплатно, а можно пожертвовать 40 белорусских рублей и получить памятную футболку.
Я уже взял билеты в Минск и вам советую не откладывать.
Страница мероприятия: http://xxtt.ru/datafestby
(А уже вечером будет анонс самого большого Data Science мероприятия восточного полушария)
#events : DataFest #6 🎉 🦜
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский

В мае пройдет главное data science мероприятие года.
2 полных дня, 60 секций, 200 докладов, 10.000 гостей.
- Список секций первого (индустриального) дня:
Mega keynote, ML economics, Healthcare applications, E-commerce applications, Media applications, DS education, Poster pitch-session, Innovation board panel, A/B testing, Manufacturing applications, Banking applications, Telecom applications, Data collection & labeling, ODS Q&A, Data-driven culture, DS processes, Biometric Applications, Smartphone applications, WiML, Project pitch-session, Mini meeetups, Mythbusters, DS hiring, Industry CV/Video, Industry NLP, Industry speech, WiML workshop, Mini meetups, MLcourse finale
- Список секций второго (научного) дня:
Machine learning legends panel, Big Data / Data Engineering, ML trainings, PyData, Reinforcement Learning, ML4SG, Open microphone, ML keynotes, ML Engineering / SysML, Black ML, iPavlov workshop, DeepBayes workshop, EDA & visualisation, Fit ML, Что? Где? Когда? DS edition, BigARTM workshop, Deep CV workshop, ODS projects, Unconference, ML puzzler, Failconf, Sigbovik, Reproducible ML, Unsolved ML, ODS coaching, ODS concert, Random beer
- А также картинная галерея графиков/визуализаций и многое другое

Регистрация уже открыта.
Страница мероприятия: http://xxtt.ru/datafest6
#events : Moscow Spark Meetup #7
Когда: 17 (среда) апреля 2019, 19:00 - 22:00
Место: МегаФон, Оружейный переулок, д.41
Язык докладов - русский

В следующую среду пройдет Moscow Spark Meetup #7.
Блок докладов:
- Рустам Аляутдинов "Стриминг в упряжке с Кассандрой: хорошие практики и подводные камни"
- Андрей Титов "Стримы на питоне. Слабоумие и отвага"
- Дмитрий Урсегов "Перспективы использования GPU в обработке данных"

Обязательна регистрация: http://xxtt.ru/dfc6
#events : SysML Meetup #1
Когда: 12 (пятница) апреля 2019, 18:30 - 21:00
Место: Сбербанк, Кутузовский пр-т, д.32 корп.1
Язык докладов - русский

Уже завтра пройдет первый SysML Meetup.
SysML (ML Engineering) — это область анализа данных, в которой внимание уделяется вопросам применения машинного обучения в продакшне. На митапах мы обсуждаем почему некоторые из подходов из Kaggle-конкурсов не работают на реальных задачах, в чем особенность больших нагрузок при применения машинного обучения, как считать тяжелые фичи на лету.
Блок докладов:
- Ирина Степанюк "Построение системы модерации сообщений"
- Михаил Марюфич "Гонка со спамерами: поиск дубликатов в миллионах объявлений"
- Андрей Авдеев "Инженерный подход к построению рекомендательной системы"
Регистрация закроется сегодня в полночь, не пропустите.

Обязательна регистрация: http://xxtt.ru/sysml1
#events : Moscow Data Science Major
Когда: 20 (суббота) апреля 2019, 12:00 - 18:00
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Уже завтра пройдет Moscow Data Science Major.
Последняя возможность зарегистрироваться (до завтра, 10.00)
На мероприятии будет секция из 3-х докладов про язык R, доклад о конкурсе рекомендаций Okko и об опыте использования AirFlow.

Обязательна регистрация: http://xxtt.ru/9f2c
До конца регистрации на DataFest осталось чуть больше часа. Время чтобы отложить все дела и потратить 2-3 минуты на регистрацию. Завтра и послезавтра нас ждут увлекательнейшие секции и доклады! До встречи!

#events : DataFest #6
Когда: 10 (пятница) - 11 (суббота) мая 2019
Место: FLACON, ул. Большая Новодмитровская, 36, Москва
Язык докладов - русский, английский datafest.ru
#events : Митап по использованию AI & BigData в маркетинге
Когда: 23 и 24 мая 2019, 15:00 - 21:00
Место: Пространство "Весна", Спартаковский переулок, 2с1
Язык докладов - русский, английский

Завтра и послезавтра пройдет митап, посвященный использованию машинного обучения в маркетинге.
Программная сетка уже сформирована:

День первый
- Валерий Бабушкин "Как ускорить А/Б тестирование в разы"
- Максим Годзи "ML анализ траекторий пользователей для динамического управления трафиком и оптимизации интерфейса"
- Александр Рыжков "Метаобучение в AutoML: как строить модели быстрее"
- Дмитрий Панчев "Прогнозирование качества аудитории с помощью autoencoder"
- Давид Вачадзе "Статистические модели BTYD: анализ оттока и LTV в обычных неконтрактных покупках"

День второй
- Кирилл Шиденко "Практический AI. Как маркетологу начать использовать ИИ уже сегодня"
- Денис Ладанов "Маркетинг: творчество или математика? Какие задачи маркетинга реально решить алгоритмами, а какие останутся в руках людей в ближайшие 2 года"
- Samer Fatayri "Protecting your app from bots"
- Андрей Осинцев "Кейс Связной Трэвел: Как Retention engineering изменил наш способ думать о сегментации клиентов"
- "Три кейса: Применение ML для оптимизации Google UAC на примерах Superjob, Zeptolab, Делимобиль"
- Павел Пекичев "Кейс Ozon: Немного статистики - много кросс-продаж"

Сайт мероприятия: http://xxtt.ru/c33e
Посещение одного дня на выбор является бесплатным: http://xxtt.ru/7fa1