DataGym Channel [Power of data]
2.4K subscribers
52 photos
7 videos
1 file
158 links
Канал про Data Science и BigData.

Для связи: @ermakovpetr
Download Telegram
MLOps - то что захватывает меня последнее время, но у меня много претензий к текущим решениям и продуктам.

Расскажите про ваши открытия и библиотеки, даже если они давно известны, в комментарии к этому посту.

А в четверг будет онлайн-митап. Если у вас нет MLOps или вы уже опытный в этом, подключайтесь посмотреть. Уверен, что будет интересно. А мой коллега, Роман, расскажет про MLOps в Lamoda.
Сегодня вышел подкаст со мной.
Я рассказал, как попал в DS, почему работа с данными не только работа, но и веселое хобби, чем комьюнити может помочь, как "пользоваться" ODS для новичков и несколько кулстори.
Послушать можно на подкаст платформах или Ютубе.
Записывали почти месяц назад и мои предсказания про очные мероприятия можно пока серьезно не рассматривать.
#реклама

24 сентября будет облачно, потому что пройдет Yandex Scale (крупнейшая конференция платформы Yandex.Cloud)

За весь день планируются более 30 докладов в 5 потоках: Infrastructure, Data Platform, Security, Cloud-native, ML & AI
Поделюсь заинтересовавшими меня докладами:

- Облачное поколение ноутбуков — от тетрадок к сфере данных: ребята расскажут про DataSphere, у меня тут есть много вопросов спикеру, держитесь =)
- Программа содействия образованию и науке в области Computer Science: это очень круто, такое есть у многих облаков, но всегда есть вопросы, а достучаться до Яндекса явно проще
- Рекомендательная система на базе DataSphere: прям интересно, какую рек.систему можно построить и показать за 40 минут
- Расскажите какие доклады и почему заинтересовали вас в комментах к посту

Мы на нескольких проектах уже перешли или задумываемся над переходом на Yandex.Cloud. Недавно даже протестировали часть задач на GPU в DataSphere. Потому я обязательно зайду задать вопросы и узнать о новостях и скорейших релизах.

Конференция пройдет онлайн, участие бесплатное. Программа и регистрация тут: https://scale.yandex.ru/
За новостями и деталями можно следить на официальном канале конференции @yandexscale.
Data Science MeetUp (онлайн + офлайн)

29 сентября встречаемся в Иннополисе, чтобы поговорить об использовании алгоритмов ML в производстве и обработке данных с самолетов и полетов. Бонус: кое-что про космос

Узнаем:
- как экономить на производстве с помощью машинного обучения;
- как прогнозировать техническое обслуживание самолетов с помощью данных;
- как машинное обучение помогает оптимизировать обслуживание воздушных судов;
и многое другое 🔥

Спикеры:
- Александр Стрельников, Lead Data Scientist, Accenture/Applied Intelligence
- Андрей Жуков, CTO S7 Techlab
- Валентин Азанов, Lead Data Scientist, S7 Techlab
- Любовь Рожкова, Middle Data Scientist, S7 Techlab

Модератор: Василий Сафронов - немного data scientist, немного technical engineer, немного product manager

Для кого: разработчикам и ML-аналитикам, а так же всем интересующимся самолётами и производством

🕑 29 сентября, 17ч (мск)
📍г.Иннополис, Технопарк им. Попова, 2 этаж, конференц-зал

Онлайн-трансляция

Регистрация и подробности докладов
#реклама

Вебинар Бесплатный ML Space на базе инструментов Intel oneAPI для всех желающих.

У нас отличные новости, инструменты Intel® oneAPI на облачной платформе ML Space стали доступны для физических лиц. Это значит, что любой желающий может бесплатно использовать набор программных инструментов для ускорения машинного обучения, анализа данных, разработки ПО.

На вебинаре вы узнаете:

— подробности об инструментах Intel® oneAPI;
— сценарии применения этих инструментов для построения ML-моделей;
— как получить бесплатный доступ к инструментам на платформе ML Space.

Вебинар будет полезен всем, кто интересуется data science.
Регистрируйтесь по ссылке.

Вебинар пройдёт — 14 октября 2021, четверг, 12:00

*SberCloud — облачный провайдер услуг и сервисов для физлиц, бизнеса и государственных организаций.
Друзья из hh весной провели конкурс по анализу отзывов на компании.

Сегодня через 3 часа пройдет онлайн-митап с разбором конкурса и топовых решений, а также доклад от ребят из ХХ про их новый подход в матчинге вакансий на резюме.
#events : Data Fest Online 3.0
Когда: прямо сейчас!
Неожиданно, как снег в январе, пришел 3 online Data Fest
В этом году я поучаствовал в создании >20 докладов.
Еще, из интересного, можно узнать о переезде сообщества ods.ai из Slack в скором будущем.
Но все можно посмотреть потом и в записи, а сейчас лучше воспользоваться возможностью и прийти на нетворк в спейшл-чат

Регистрируйтесь на фест -> https://ods.ai/events/datafestonline2022/join

Заходите на неторк сессию -> https://live.ods.ai/
Пароль: followthepinkparrot
Почти весь день буду в комнате Яндекс-а
#events : Q&A #1 на DataFest
Когда: 11 июня, 12:00–16:30

Уже в эту субботу устроим совместный просмотр 4 докладов и нетворк со спикерами этих докладов

Расскажем как применить трансформер на событиях от пользователей, поговорим о прогнозе времени проезда по маршруту, обсудим особенности внедрения ранжирования в уже существующий проект в продакшне и поделимся решением задачи о построении рекомендаций видео по тексту.
А после докладов мы встретимся с командой CatBoost.

Ссылка на подробности -> https://ods.ai/events/yandex-df2022-11-06-2022
А еще для удобства сделали событие, которое можно добавить в ваш календарь.
#events : Последняя секция на DataFest
Когда: 02 июля 11:00-18:00

Хорошо проводите вечер пятницы? А может пора ложиться?

Завтра заключительная QnA уходящего датафеста
7 докладов, почему нет?!
Best practice по управлению топиками Kafka, Ассесоры как непрерывное звено ML pipeline-а, Data drift, Матричная факторизация на эмбеддингами переменной размерности, Суммаризация текста в рекомендациях, MLOps в облаке с одной строчкой кода. И возможный доклад MLEM - версионирование и деплой МЛ моделей без боли.

Заходите на сессию -> https://live.ods.ai/
Комната: Last chance
Пароль: followthepinkparrot
#model : Языковая модель c 176b параметрами
https://huggingface.co/bigscience/bloom
Несколько недель назад закончилось обучение BLOOM модели от BigScience
Сегодня её выложили
59 языков (русского нет)

Самой большой языковой моделью с русским языком в открытом доступе остается YaLM-100b
На сколько вы сегодня уже уменьшили число людей? 🤡
Forwarded from Russian Business
Яровая заявила, что цель создателей искусственного интеллекта — уменьшить количество людей

«А вы знаете, сколько сегодня съедает искусственный интеллект? Вот те, кто сегодня создают искусственный интеллект — создают его в надежде вытеснить человека.

А кто сегодня потребляет энергию? Люди? Значит, что нужно уменьшить количество людей. Чтобы осталась маленькая группа, обладающая властью и имеющая возможность использовать все это во благо себе с помощью искусственного интеллекта», — заключила зампред Госдумы.

@rb_ru
👍1
#events : ML-тренировка
Когда: 22 (четверг) сентября 2022, 19:00 - 21:30 (сбор с 18:00)
Место: офис Яндекса (Москва, улица Льва Толстого, 16) + онлайн
Язык - русский

Ура, это ML-тренировка: обсуждаем конкурсы и бенчмарки, максимально искренне и без прикрас. Все как в старые-добрые 😉

Программа:
- Максим Рябинин "Бенчмарк приемлемости предложений на русском языке (RuCoLA) + секретный релиз"
- Артём Стрекалов, Дмитрий Гаус "Верификация моделей автомобилей (Machines Can See 2022)"

Нетворк попробую организовать как в офлайне, так и в онлайне.

Регистрация обязательна
❤‍🔥91👍1
#opensource : RuLeanALBERT от Yandex Research
2.9B трансформер для русского, которая влезет в домашнюю ПеКарню ресерчера

Мало того, что это самая большая БЕРТ-подобная модель для русского языка, которая показывает крутые результаты в бенчмарках, так еще и с кодом для fine-tuning-а

GitHub

А в статье можете узнать, как обучалась эта модель (а-ля коллаборативное глубокое обучение) на фреймворке по децентрализованному обучению Hivemind
❤‍🔥9👍41
#events : ML-тренировка
Когда: 17 (четверг) ноября 2022, 19:00 - 21:30 (сбор с 18:00)
Место: офис Яндекса (Москва, улица Льва Толстого, 16) + онлайн
Язык - русский

В этот раз нас ждёт 3 доклада:
- призер только что завершившегося Yandex ML Cup,
- 2ое место хакатона AgroCode Hack по анализу спутниковых снимков для виноградников
- организатор ML соревнований в информационной безопасности

Подробная программа по ссылке ниже
Будем рады видеть всех очно и онлайн ;)
Регистрация обязательна
🔥8👍52❤‍🔥1🤩1🏆1🍾1
#events : ML-трек Ya.Talks
Когда: 3 декабря (завтра) 2022
15:30 - 20:00 (по Москве)
Где: онлайн
Язык: русский, с нейро-переводом на другие языки

Хочу всех вас пригласить на ML-трек.
Нас ждёт 3 доклада и 2 дискуссии.
Каждый доклад, каждая дискуссия отобраны и отработаны, везде я добавил частичку себя.
Очень вас жду, жду ваших вопросов и фидбека.

Регистрируйтесь
6🔥4👍3
#общаемся

По всей видимости 17 декабря пройдет дата-ёлка от ODS.
Она будет онлайн, подробности скину, когда будет регистрация.

Расскажу, что последнего произошло с python (как с языком, так и с компонентами для данных и мл) за последние 3 года.

Буду рад вашим советам, на что обратить внимание в своем рассказе. Писать можно тут, в комментариях к этому сообщению ;)
👍17🍾3👨‍💻2🌚1