ODS Events
7.83K subscribers
223 photos
5 videos
1 file
638 links
Официальная группа новостей про мероприятия сообщества Open Data Science: Data Fest, Data Halloween, Data Ёлка и других
https://ods.ai/events, https://fest.ai
Download Telegram
Андрей Лукьяненко рассказывает про предсказания хаотичных действий клиентов.

Модели машинного обучения находят паттерны в данных и делают предсказания на их основе. Но что делать, если целевое событие обычно происходит внезапно? И достаточно ли сделать fit_predict для успешного завершения проекта?

https://youtu.be/hoo-VZ3Rd7Y
ODS awards ⭐️или пора подводить итоги 2019 года!
Какие мероприятия запомнились вам больше всего? А какие выступления и доклады были самыми полезными?

В прошлом году мы провели первую премию сообщества ods.ai Это наша благодарность участникам, спикерам и организаторам за их вклад в Open Data Science. В этом году зал славы станет ярче и шире, а лучших из лучших мы наградим на Дата Елке 20-21 декабря в Москве 🎄

Кто получит награды и подарки - зависит от вас! Призываем активно участвовать в голосовании, чтобы мы вместе смогли собрать зал славы 2019 года ⭐️

За фесты и выступления можно голосовать в двух номинациях:
📽 Лучшие доклады и выступления со всех мероприятий 2019 года!
http://bit.ly/2QBiYyN
🎉 Лучшие бесплатные DS/ML мероприятия 2019 года!
http://bit.ly/2r6nbA6

Ждем ваши голоса по итогам 2019 года! 😊
Посмотреть доклады и вспомнить лучшие из них - https://www.youtube.com/channel/UCM9ECBAZtlLeEr-m3ldZ..
Вспомнить бесплатные мероприятия этого года - https://datafest.ru/fests/
Послушайте доклад Михаила Свешникова "Ядовитые огурчики" c Data Halloween.

Давайте признаем, каждый из нас пиклил. А кто пиклил, тот и распикливал. Я расскажу, почему в документации пикла большими буквами написано что это небезопасно и что с этим может сделать больное воображение.

https://youtu.be/xm-A-h9QkXg
Data Ёлка 2019 открыта! 🎄
20 декабря, Москва, Сбербанк, с 18:30 (вечер) - подводим итоги и награждаем героев года 🏆
21 декабря, Москва, Сбербанк, с 12:00 (весь день) - топ программа с самыми актуальными обзорами состояния разных DS/ML областей по состоянию на конец 2019 года 😎

Программа и вся-вся информация: https://datafest.ru/elka/
Регистрация: https://forms.gle/1xQTxUaZHbopnEtF8
Ждем всех на нашем итоговом мероприятии года!

Итоги года и премия ODS ⭐️
ODS Awards это наша общая благодарность за вклад участников в Open Data Science. Зал славы расширяется, и нам нужна помощь - ваши голоса! Мы собрали шортлисты из кандидатов, и теперь можно выбрать варианты из списка.
А чтобы добавить 🔥 в каждом голосовании мы разыграем по паре новых толстовок. Так что если вы в этом году пока не номинировались, все равно сможете перехватить legendray loot 😉 Шансы выше, если голосовать во всех номинациях!

Номинации голосования:
🎉 Награды за лучшие бесплатные DS/ML мероприятия 2019: http://bit.ly/2r6nbA6
🎥 Награды за лучшие доклады и выступления со всех мероприятий 2019 года: http://bit.ly/2QBiYyN
🥇 Награды за лучшие полезные выступления ML тренировок: http://bit.ly/37puTWn
💪 Награды за лучшие проекты, живущие и развивающиеся в сообществе: http://bit.ly/35gq9AL
✍️ Награды за ваши лучшие посты на хабре ODS: http://bit.ly/2rd8Guo
😎 Награды за самые полезные посты, лонгриды, обзоры и кулстори в слаке: единственное голосование без шортлиста - расчехляйте сохраненные из лучшего: http://bit.ly/2qwAo51

Дедлайн по голосованию - воскресенье 08.12.2019, 16:00 часов по Московскому времени.

Ждем ваc на Ёлке, а ваши голоса - в номинациях выше! ⭐️🎄
Друзья, приглашаем вас последнюю тренировку по машинному обучению этого года! 🎉
14 декабря, в гостях у компании Мегафон.
Регистрация - https://pao-megafon--org.timepad.ru/event/1137770/

Тренировка по машинному обучению – это открытый митап, на который мы приглашаем участников соревнований по анализу данных, чтобы познакомиться, рассказать про задачи, обменяться опытом участия и пообщаться. С докладами выступают успешные участники последних соревнований на Kaggle и других платформах — рассказывают о своих решениях: какие техники и методы использовали они сами, а какие помогли их конкурентам.

Первый доклад будет на английском языке, остальные доклады будут на русском языке. В программе 14 декабря:
🔹Yury Bolkonsky, Andrei Dukhounik - Kaggle Understanding Clouds from Satellite Images
🔹Павел Логачев - Kaggle Lyft 3D Object Detection for Autonomous Vehicles
🔹Илья Кибардин - Topcoder SpaceNet 5 Challenge & Sigante The 3rd Tellus Satellite Challenge

Как всегда, обещаем трансляцию, кофе с печеньками и беседы в перерывах. Приходите 🤗
Вход бесплатный, по одобренной регистрации. В 11:30 сбор участников и регистрация, доклады с 12:00 до 14:30.
Скоро начнём трансляцию Дата Ёлки, подключайтесь!
https://www.youtube.com/watch?v=3WFYyfz5EJY
Чтобы на новогодних каникулах не пришлось скучать, мы опубликовали первую порцию докладов с Data Ёлки! 🎉😊

По ссылке ниже можно найти выступления двух секций:
Итоги года в ML соревнованиях
Итоги года: инженерия и инструменты
https://www.youtube.com/playlist?list=PLXggmPzAxFwo_KI5I5MiuLaLs3Ya_RW2H

Остальные видео появятся через несколько дней в том же плейлисте.
C наступающим, всем хороших праздников! 😎⭐️
Пока праздники продолжаются, предлагаем вам посмотреть несколько докладов и вспомнить, что важного произошло в ключевых областях DS/ML в 2019 году: где и какие случились прорывы, и какой сейчас в них статус-кво.

Итоги года: CV – Артур Кузин
https://youtu.be/kTHemZ9aQFo

Итоги года: RecSys – Дмитрий Бугайченко
https://youtu.be/umyNVwePCtw

Итоги года: NLP – Валентин Малых
https://youtu.be/cdlAUcaOCDY

Итоги года: RL – Сергей Колесников
https://youtu.be/qda9jipehmc
Друзья, мы опубликовали последнюю порцию видео с Data Ёлки, а именно доклады секции "Сводки с полей @ NeurIPS 2019".
Из видео вы сможете узнать, что обсуждали на главной мировой конференции по ML в мире? А также самые свежие обзоры, тренды, и ответы на вопрос "Куда копать?".

Сводки с полей @ NeurIPS 2019 – Артем Соболев
https://youtu.be/IRzaWXP3s3U

Сводки с полей @ NeurIPS 2019 – Павел Калайдин
https://youtu.be/tSPKzMppR2I

Сводки с полей @ NeurIPS 2019 – Дмитрий Бабаев
https://youtu.be/gLWxx-Yod4M

Сводки с полей @ NeurIPS 2019 – Данила Савенков
https://youtu.be/3lP63cYqYo0
Уже очень скоро ods.ai исполняется 5 лет! 🎉🎉🎉 А это означает, что мы приглашаем всех вас отметить это 14 марта на праздничном Data Science Major 😀

Он пройдет в Москве, в офисе Mail.Ru Group, весь день в 3 залах. Вход бесплатный, по одобренной регистрации:
https://corp.mail.ru/ru/press/events/731/

На днюхе мы расскажем о том, что напланировали и организовывали для вас зимой:

Фундаментальная прокачка ods_pet_projects: новые форматы, мега-проекты, и план по захвату мира. Мы массово расширяем и географию и направления проектов. Плюс мы проведем отдельную секцию-воркшоп в помощь проектам: про то, как их организовывать, как координировать команду, и самое важное - доводить проекты до результата.

Ивенты и что нас ждет в 2020 году: прежние Дата Фесты вернуться вновь, а также придут и в новые страны, Major-ы продолжатся и тоже расширятся на новые города. Плюс появится и что-то новенькое, чего вы раньше не видели 😉

И конечно же, сама программа: будут крутые спикеры с недостающими главами в ML, которых мы давно не видели на главной сцене! И еще больше крутых спикеров на ODS Q&A. Вопросы спикерам даете вы! 😎 Тема - "Чего не хватает Data Science области" http://bit.ly/2VqVpLH

Networking на максималках - целый зал под unconference и знакомства через нашего event bot-а на протяжении всего дня 👍🏻

Ждём вас ❤️
Друзья, 7 марта в Киеве прошёл ODS Meetup. Встречайте доклады 😉

⭐️ Руслан Купреев | Software Engineering Team Lead @DVC.org
Stop hoarding data: tidying up your workspace with DVC
DVC – это инструмент для версионирования данных и моделей в Git-workflow. Поговорим о том как хранить, шерить и деплоить ваши артефакты, от простых сценариев к более сложным.

⭐️ Дмитрий Даневский | ML Research Engineer @Respeecher
How I met transformers
Расскажу про transformer-based модели для разных задач: ASR, машинный перевод, question answering, text classification. Как пример, поведаю о нашем Top-1 :gold: решении на конкурсе под названием Google QUEST Q&A Labeling на площадке Kaggle.

⭐️ Владислав Крылов | Computer Vision / Backend Engineer @MaritimeAI
MaritimeAI – computer vision for maritime applications
Какие задачи стоят в предметной области, как можно с пользой применять ML/DL. Какие подходы используем, где берем данные, как деплоим сетки, как принимаем юзерские (потенциально баговые) данные и инференсим по ним модели. Какие программы развития предлагают большие компании стартапам вроде нас.

https://youtu.be/bW3up7LCT5s
https://youtu.be/26ACxFzGMD8
https://youtu.be/zJuslocO3a0
Привет всем!

До главного события года сообщества остается меньше месяца, поэтому мы уже с нетерпением ждем легендарный Data Fest!
Все самые горячие темы с передовой Data Science соберут самых активных участников сообщества онлайн 19-20 сентября.

В этом году фест меняет формат и будет состоять из 3 основных активностей:
- трансляция на Youtube-канале
- Networking в тематических комнатах spatial.chat
- треки на ods.ai

Именно 19-20 сентября будет основная серия онлайн-активностей, где можно познакомиться и потусить со всеми самыми активными участниками!

Все привычные тематические секции феста мы превратили в треки. Часть из них будут регулярно собирать онлайн-митапы с премьерами новых докладов, а часть треков будет на английском! Список треков пока не финальный, он обновляется на сайте Data Fest.

У феста нет регистрации в привычном формате.
Если вас интересует только лайв-стрим феста на Youtube-канале 19-20 сентября, его достаточно просто не проспать.
А если вы хотите общаться с коллегами в комнатах spatial.chat, зарегистрируйтесь на ods.ai и выберете нужную комнату там.

Чтобы не забывать обо всех активностях, используйте бот в телеграме для напоминалок!

Подробности о всех треках и программе Data Fest доступны на сайте: https://datafest.ru/2020/
До Data Fest 2020 осталось меньше 10 дней!

Все самые свежие новости индустрии прозвучат уже 19-20 сентября.

Напоминаем, что в этом году мы расширяем географию Data Fest!
ODS goes global, и у нас есть английская версия сайта: https://fest.ai/2020/

Вас ждет более 35 треков на русском и английском языках, лучшие спикеры с передовыми результатами и разработками, мощный нетворкинг. Жизнь продолжится и после феста - материалы будут выходить до самого Halloween!

Регистрация доступна через сайты феста на платформе ODS.ai
Формат и содержание докладов Data Fest остаются загадкой до самого начала мероприятия. Но сегодня мы слегка приоткроем занавес и поделимся некоторыми подробностями. В этом году секции поделили на 5 видов:

Business — важные темы со стороны бизнеса. Узнаем больше о продвинутом А/В тестировании, изучении Data Science для продуктов, экономике решений и анализе без машинного обучения.
Community — жизнь сообщества и специалистов. Поделимся новостями о карьере в DS, победителях престижных соревнований, проектах и образовании в ODS.
Engineering — технические секции о прикладных методах и о том, как это работает. Автоматизация процессов в МL, анализ больших данных и работа с ML в продакшене.
Industry — применение DS/ML в индустрии. Копнем глубже o NLP, CV и ML, применяемых в самых разных сферах. И не забудем o безопасности на производстве.
Research — научные секции по актуальным и горячим темам. Изучим, как МL помогает в искусстве и погрузимся в тему графов.

Еще больше докладов прозвучат 19-20 сентября на Data Fest Online 2020.
Регистрируйся и присоединяйся: https://datafest.ru/2020/
Сегодня мы начинаем рассказывать o треках феста. И первыми представляем Machine Learning REPA 🔥

Трек традиционно посвящен инструментам и практиками управления экспериментами в Machine Learning, воспроизводимости (Reproducibility) и автоматизации процессов. В треке довольно широкий спектр тем, которые пересекаются с темами других треков - ML Infra, SysML, Lean Data Science и другими. Все эти темы связаны, и задача ML REPA - показать, как выстроить процесс разработки ML решений, как организовать командную работу и какие технологии могут в этом помочь.

В этом году ML REPA будет проходить в течение 2 дней с докладами на русском и английском языках. Среди докладчиков - представители компаний МТС, Samsung, Одноклассники, Банк Открытие, DVC, Optia.ai, Evidently AI, Xsolla. Спикеры трека поделятся передовым опытом применения инструментов и автоматизации. Трек будет интересен для Data Scientists, ML Engineers, Project & Product managers.
Каждый Data Fest – это не только доклады, но и огромная доза нетворкинга. Люди приезжают, а в этом году подключаются, из разных регионов и стран, чтобы познакомиться и пообщаться с единомышленниками из ODS сообщества.

Теперь важно не упустить момент и попасть в выбранную тематическую комнату SpatialChat – https://spatial.chat. Иначе есть риск остаться совсем без общения на время феста.

Чтобы не пропустить активности, регистрируйтесь на странице Data Fest с профилем ODS.ai. Тогда нетворкинг 19-20 сентября гарантирован!

Самый движ будет происходить в тематических комнатах SpatialChat. Количество комнат не ограничено темами треков, поэтому попадут все!

Билет для нетворкинга ждет тут: https://datafest.ru/2020/
Graph ML - это пересечение теории графов и машинного обучения. На треке прозвучат такие выстуления, как: "Неконтролируемые графические представления", "Трансформация бизнеса через задачи на графах", "Предсказание связей с графическими нейронными сетями" и многое другое.

Один из со-организаторов секции Graph ML - Сергей Иванов, научный сотрудник компании Criteo, получил докторскую степень в Сколтехе, Москва. Область его общих исследований - прикладное машинное обучение и наука о данных для дискретных взаимосвязанных систем, таких как графы, множества, 3D точки.

Помимо исследований он пишет в:
- свой блог - https://medium.com/@sergei.ivanov_24894,
- телеграм канал - http://ttttt.me/graphML,
- ежемесячную рассылку - http://newsletter.ivanovml.com/
Сегодня познакомимся с треком ML Finance направления Industry.
Вы узнаете, как работают банки с известными отделами DS & ML в индустрии.

Перед вами выступят Eghbal Rahimikia и Ser-Huang Poon с докладом "Machine learning for realised volatility forecasting". Они расскажут о том, как машинное обучение помогает предсказывать основные колебания в работе банков.
​​​​Начинаем потихоньку знакомить вас с партнерами Data Fest. Сегодня расскажем, какие задачи решаются с помощью data science в Авито — самом популярном сервисе объявлений в России

Data science инженеры в Авито в основном занимаются машинным обучением, и их решения напрямую интегрируются в продукт.

Например, рекомендации на основе интересов пользователей. Чтобы предлагать похожие объявления на карточке товара, в Авито используют item2vec — это нейроночка, написанная на PyTorch, которая из объявления делает вектор, а для поиска по векторам уже работает Sphinx. Есть еще персональные рекомендации на главной странице. Там применяется многоуровневая модель: сначала отбора кандидатов, потом ранжирующая.

В модели отбора кандидатов используется два подхода:
1. Рекомендация объявлений, похожих на просмотренные пользователем, используя поиск по похожим;
2. Матричная факторизация — нейроночка на PyTorch.

Для ранжирующей модели data science инженеры Авито используют CatBoost, который вместе со Sphinx также используется и для поиска.

Кроме того, есть немало задач по использованию методов обработки естественного языка и методов на основе нейронных сетей для модерации объявлений, антиспам фильтров и борьбы с мошенниками. О них в двух словах не расскажешь.

Если вам интересно узнать больше о том, как data science инженеры в Авито решают задачи — заходите на их виртуальный стенд или ищите контент на сайте AvitoTech: https://avito.tech
Вы же не думаете, что как только освоите Python или R, SQL на вас сразу свалится с неба классная работа? В этом году трек Career объединяет экспертов в области Data Science для обсуждения самых интересных вопросов карьеры. Крутые спикеры делятся инсайтами: какой путь они проделали от junior до senior? Чего часто не хватает джунам для того, чтобы перейти на следующий уровень? Как найти работу в стартапе во времена пандемии? Как улучшить свои soft skills и важно ли это вообще?

Трек представлен полностью на английском языке. Кроме докладов в треке будет 2 сессии в формате диалога между ведущим и спикерами. А еще организаторы проведут баттл, аналогичный панельной дискуссии, на вечную тему "Что круче - работать из дома или ходить в офис?"