Power of data
2.01K members
9 photos
64 links
Канал про Data Science и BigData. Подробнее https://t.me/powerofdata/16
Для связи: https://tele.gg/datagym
Download Telegram
to view and join the conversation
#events : Data Halloween 🎃
Когда: 31 (четверг) октября 2019, 19:00 - 21:30 (сбор в 18:30)
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

Data Halloween - один из самых необычных митапов! 🧛‍♂️

В программе:
💀Сергей Свиридов и Сергей Колесников - Deep RL Contests: кнуты, но без пряников
💀Павел Плесков - Как я потерял $ 50к: самая страшная платформа на свете
💀Михаил Свешников - Ядовитые огурчики
💀Павел Мягких - Самые весёлые (нет) мнения людей о Data Science
💀Андрей Лукьяненко - Предсказания хаотичных действий клиентов

А также Data Science PPT Karaoke из АДа 😈 и конкурс костюмов с призами!
Обязательна регистрация http://xxtt.ru/tombstone
#events : ML-тренировка
Когда: 2 (суббота) ноября 2019, 12:00 - 15:00 (сбор в 11:30)
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

ML-тренировки - выступление Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.

Список докладов:
- Дмитрий Кулагин "Topcoder PINS Master & PINS Explorer"
- Алексей Харламов "Kaggle The 3rd YouTube-8M Video Understanding Challenge"
- Антон Попов "Kaggle IEEE-CIS Fraud Detection"

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/4230
#events : ML-тренировка
Когда: 16 (суббота) ноября 2019, 15:00 - 18:00 (сбор в 14:30)
Место: ФКН ВШЭ, аудитория R405, Покровский бульвар, 11 (вход #3 с Дурасовского переулка)
Язык докладов - русский, английский

ML-тренировки - выступление Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.

ML тренировки - открытый митап с докладами Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.
В программе 16 ноября:
- Артур Кузин "Kaggle Open Images 2019" [en]
- Павел Якубовский, Илья Добрынин "Kaggle Severstal: Steel Defect Detection"
- Владислав Крамаренко "Artificial Intelligence Journey 2019"
- Даниил Анастасьев "Artificial Intelligence Journey 2019"

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/b63a
#events : ETL-meetup #1
Когда: 20 (среда) ноября 2019, 19:00 - 21:00 (сбор в 18:30)
Место: Сбербанк, Кутузовский пр-т, д.32 корп.1
Язык докладов - русский

ETL – аббревиатура от Extract, Transform, Load. Эти системы применяются, чтобы загрузить в DWH, Data Lake и другие хранилища данные из нескольких разных систем, а также потоковые данные.
Регистрация закроется сегодня в полночь, не пропустите.

Доклады:
- Антон Васильков "Keeper - немного больше, чем система хранения датасетов"
- Адам Елдаров "Как сделать единую платформу для сбора событий"
- Артем Плотников "Хороший, плохой, злой ETL на Amazon EMR"
- Дмитрий Лахвич "Модный ETL: data lake на примере реальных компаний"

Обязательна регистрация: http://xxtt.ru/etl_1
#events : ML тренировка
Когда: 30 (суббота) ноября 2019, 12:00 - 14:30 (сбор в 11:30)
Место: офис Mail.ru Group, Переговорная 1, Ленинградский пр-т, д. 39, стр. 79
Язык докладов - русский, английский

ML тренировки - открытый митап с докладами Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.
В программе 30 ноября:
- Андрей Рыбин - XTX Global Forecasting Challenge (eng)
- Константин Котик - Kaggle RSNA Intracranial Hemorrhage Detection (rus)
- Валентина Бирюкова - McKinsey&Company Hackathon (rus)

Регистрация обязательна и открыта до 14:00 29 ноября, торопитесь: http://xxtt.ru/54b9
#video : 2 недели назад прошел ETL-meetup #1

Доклады:
- Антон Васильков "Keeper - немного больше, чем система хранения датасетов"
- Адам Елдаров "Как сделать единую платформу для сбора событий"
- Артем Плотников "Хороший, плохой, злой ETL на Amazon EMR"
- Дмитрий Лахвич "Модный ETL: data lake на примере реальных компаний"

Мы подготовили записи выступлений для вас (ссылка на плейлист): http://xxtt.ru/etl_1_video
#events : ok.tech: Data Толк 4
Когда: 16 (понедельник) декабря 2019, 19:30 - 22:00 (сбор гостей с 19:00)
Место: Mail.ru Group, Ленинградский пр-т, д.39/79
Язык докладов - русский

16 декабря в московском офисе Одноклассников соберемся и вместе с коллегами из OK, Сбербанка, VK и X5 Retail Group проведем ок.tech: Data Толк #4: новогодний выпуск. Поговорим про итоги года и десятилетия в области анализа и обработки данных.

Программа:
- Артур Кузин "CV: вчера, сегодня, завтра"
- Дмитрий Бугайченко "Data Science 2010-2019: продуктивная декада"
- Андрей Якушев "История поиска идеального МЛ-таргета"
- Дискуссия о прошлом, настоящем и будущем Data Science

Обязательна регистрация: http://xxtt.ru/260c
#events : Data Ёлки в Москве 🎄
Когда: 20 (пятница) декабря 2019, 18:30 - 22:00 (сбор гостей с 18:00)
21 (суббота) декабря 2019, 12:00 - 21:00 (сбор гостей с 11:00)
Место: Сбербанк, Кутузовский пр-т, д.32 корп.1

Data Ёлка - ежегодное мероприятие сообщества ODS в формате data-трэш
20 декабря - итоги года и награждения героев за их вклад в коллективное сознательное
21 декабря - актуальные обзоры разных DS/ML областей по состоянию на конец 2019 года
- Итоги года в ML соревнованиях
- Итоги года: инженерия и инструменты
- Итоги года: области DS/ML
- Сводки с полей NeurIPS 2019

В этом году команда канала славно постаралась и сделала для вас PyData, SysML и ETL митапы.
Голосуйте за эти и другие мероприятия на голосовании "Мероприятие Года" http://bit.ly/2r6nbA6

Программа: http://xxtt.ru/bed5
Регистрация: http://xxtt.ru/131f
#events : PyData Moscow Meetup #10 (Юбилейный 🎉)
Когда: 12 (четверг) декабря 2019, 19:00 - 21:00 (сбор в 18:30)
Место: МегаФон, Оружейный переулок, д.41
Язык докладов - русский

Десятый Юбилейный PyData Moscow Meetup пройдет в офисе Мегафона. 🥳
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python. Все как Вы любите.

Программа:
- Юлия Тувалева "Python и анализ городской среды"
- Александр Паринов "Пайплайн для компьютерного зрения: разработка, встраивание моделей, деплой и мониторинг системы видеоконтроля полок"
- Евгений Семенов "MLComp - распределённое выполнение DAG для machine learning"

Обязательна регистрация, число мест ограничено, поэтому поторопитесь: http://xxtt.ru/pydata10
#events : ML тренировка
Когда: 14 (суббота) декабря 2019, 12:00 - 14:30 (сбор в 11:30)
Место: Мегафон, Оружейный пер. 41 (вход со стороны Садового кольца)
Язык докладов - русский, английский

ML тренировки - открытый митап с докладами Data Scientist-ов о своем опыте участия в конкурсах по машинному обучению.

В программе 14 декабря:
- Yury Bolkonsky, Andrei Dukhounik - Kaggle Understanding Clouds from Satellite Images (eng)
- Павел Логачев - Kaggle Lyft 3D Object Detection for Autonomous Vehicles (rus)
- Илья Кибардин - Topcoder SpaceNet 5 Challenge & Sigante The 3rd Tellus Satellite Challenge (rus)

Регистрация обязательна и открыта до 14:00 13 декабря, торопитесь: http://xxtt.ru/22e1
#stream : PyData Moscow Meetup #10 (Юбилейный 🎉)
📆 Начало: 19:00 12.12.2019

Программа:
- Юлия Тувалева "Python и анализ городской среды"
- Александр Паринов "Пайплайн для компьютерного зрения: разработка, встраивание моделей, деплой и мониторинг системы видеоконтроля полок"
- Евгений Семенов "MLComp - распределённое выполнение DAG для machine learning"

Ссылка на трансляцию: http://xxtt.ru/pydata10_stream
#events : CCCV19 Пятый рождественский коллоквиум по компьютерному зрению
Когда: 27 (пятница) декабря 2019, 14:30 - 21:00 (сбор в 13:30)
Место: Место: Яндекс, ул. Льва Толстого, д.16 (зал Экстрополис)
Язык докладов - русский, английский.

Рождественский коллоквиум — ежегодное мероприятие, на котором выступают авторы статей, принятых на ведущие международные конференции по компьютерному зрению и смежным областям. На коллоквиуме затронут темы о передовых архитектурах нейронных сетей, генеративных моделях, работе с 3D и о многом другом.

Секция Learning and recognition:
- Александр Колесников "S4L: Self-Supervised Semi-Supervised Learning"
- Константин Софиюк "AdaptIS: Adaptive Instance Selection Network"
- Станислав Морозов "Unsupervised Neural Quantization for Compressed-Domain Similarity Search"

Секция 3D vision:
- Максим Татарченко "3D Deep Learning: Methods and Applications"
- Роман Клоков "Probabilistic Modeling for 3D Shape Generation and Inference-Based Reconstruction From a Single Image"
- Олег Войнов "Perceptual Deep Depth Super-Resolution"

Секция Image generation:
- Андрей Войнов "Генеративные модели со случайными путями"
- Алексей Досовицкий "You Only Train Once: Loss-Conditional Training of Deep Networks"
- Владимир Князь "The Point Where Reality Meets Fantasy: Mixed Adversarial Generators for Image Splice Detection"

Обязательна регистрация: http://xxtt.ru/cccv19
#video : 2 недели назад прошел PyData Moscow Meetup #10 (Юбилейный 🎉)

Доклады:
- Юлия Тувалева "Python и анализ городской среды"
- Александр Паринов "Пайплайн для компьютерного зрения: разработка, встраивание моделей, деплой и мониторинг системы видеоконтроля полок"
- Евгений Семенов "MLComp - распределённое выполнение DAG для machine learning"

Мы подготовили записи выступлений для вас (ссылка на плейлист): http://xxtt.ru/pydata_10_video
#podcast : Мы запустили подкаст про Data Science 🎙

Первый выпуск про попадание в Data Science уже там. Петя с Тимуром пригласили двух интересных гостей, Данилу и Александра, чтобы они рассказали свои нестандартные истории, как пришли в анализ данных.
Audio
Первый выпуск Russian Data Science Podcast.
Мы пригласили двух интересных гостей, Данилу и Александра, чтобы они рассказали свои нестандартные истории, как пришли в анализ данных.

ITunes, Castbox и Web, остальные площадки появятся позже
https://dscast.ru/e/russian-data-science-podcast-1/
https://t.me/dscast/4
#competitions : X5 RetailHero
Контест по машинному обучению в виде трёх соревнований с ритейловой спецификой.
Дедлайн: 09/02/2020 (1 месяц)
Призовой фонд: 1.600.000 руб (1ая задача - 400.000 руб, 2ая задача - 800.000 руб, 3я задача - 400.000 руб)
Возможно участие в любом количестве задач в рамках разных команд.

Задача 1. Каким клиентам нужно отправить SMS?
В этой задаче необходимо подготовить список клиентов, ранжированный по эффективности коммуникации.

Задача 2. Какие товары клиент купит в следующий раз?
Тут участникам предстоит построить рекомендательную систему и при этом сделать сервис, который выдержит нагрузку.

Задача 3. Как расставить товары по полкам?
Нужно реализовать алгоритм, который сможет найти самую эффективную расстановку товаров.

Подробности: http://xxtt.ru/retailhero_competitions
Лучший публичный бейзлайн 2 задачи на текущий момент: http://xxtt.ru/retailhero-recomender-baseline
#events : PyData Moscow Meetup #11
Когда: 1 (суббота) февраля 2020, 13:00 - 17:20 (сбор в 12:00)
Место: Mail.ru Group, Москва, Ленинградский проспект, 39, стр. 79
Язык докладов - русский

Одиннадцатая PyData Moscow Meetup пройдет в офисе Mail.ru Group
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python. Все как Вы любите.

Программа докладов:
- Павел Клеменков "RAPIDS: ускоряем Pandas и scikit-learn на GPU"
- Николай Маслович "CV в пайплайне распознавания ценников товаров: трюки и хитрости"
- Александр Бельских "Почему вам стоит использовать свой велосипед и почему не стоит"

Программа воркшопов:
- Михаил Трофимов "Рекомендательная система на коленке"
- Михаил Свешников "Эбонитовый воркшоп: заворачиваем свою модель в ebonite"

Обязательна регистрация, закончится через пару часов: http://xxtt.ru/pydata11
#link : Туториал по Uplift моделированию
#партнерство

Выше в канале был анонс соревнования RetailHero, где одна из задач - Uplift-моделирование.
Ребята из МТС написали туториал по Uplift и теперь хотят поделиться второй его частью: http://xxtt.ru/fe83

Если первая статья включала в себя знакомство с Uplift моделированием, разбор особенностей сбора данных для обучения модели и описание несколько базовых алгоритмов, то вторая статья является разбором более сложных подходов, которые позволяют оптимизировать Uplift напрямую.
Дедлайн соревнований продлили на 2 недели, потому статья может быть полезна тем, кто прямо сейчас решит принять участие в соревновании.
Следующему набору DataGym быть! С 6 апреля 🙂

На фоне перехода компаний на удаленку и закрытия учебных заведений на карантин мы в DataGym решили усилить дистанционный формат нашего курса.

Как это будет организовано:
– Трансляции лекций на youtube;
– Подключение слушателей по zoom;
– Для удаленных слушателей еженедельные созвоны на 1 час для ответов на вопросы (очники обычно обсуждают вопросы до/после лекции и во время перерывов).
Приглашаем всех, кто ждал дистанционный формат нашего курса! Это отличная возможность подключиться слушателям из других городов, а коллегам из Москвы не тратить время на дорогу.
Берегите себя и с пользой проводите время в карантине.

https://datagym.ru
https://www.facebook.com/datagym.ru/photos/a.621196941966812/662914941128345/
#events : PyDoma [PyData Moscow Meetup #12]
Когда: 26 (вторник) мая 2020, 19:00 - 21:00 (сбор в 18:45)
Место: трансляция YouTube и дискуссия в Zoom
Язык докладов - русский

DataGym совместно с ODS в этот раз пройдет онлайн PyData Moscow под флагом самоизоляции и благотворительности — PyDoma.
PyData Moscow Meetup - это события, посвященные Сбору, Хранению, Обработке, Анализу и Визуализации данных на Python.

Программа докладов:
- Юрий Кашницкий "Из пушки по воробьям, или BERT vs. logreg"
- Евгений Нижибицкий "Треды, процессы и хеши-беляши"
- Артур Кузин "DL пайплайны"
- Павел Якубовский "StarterKit для решения задач семантической сегментации"

Зарегистрируйтесь, чтобы не пропустить ссылку на трансляцию https://pydata.timepad.ru/event/1318959/
К митапу приурочен благотворительный сбор средств https://sluchaem.ru/event/5154
Сделайте любое пожертвование для помощи всем, кто пострадал от последствий пандемии в России. Вот в какие фонды и как будут распространены средства.