Канал Доброго Вани | Data Science и Продуктики
1.51K subscribers
503 photos
26 videos
7 files
117 links
Самый добрый канал про DataScience, ML, техпред, стартапы и про много чего еще 🥰

Реклама, сотрудничество и любые другие вопросы -> @Pleshakovski
Download Telegram
Для начала напишу пояснительный пост про временные ряды (TimeSeries) для прогружающихся.

Временной ряд - это какая-то величина (или набор величин), которая изменяется во времени. Например, рождаемость по годам: "Год - Кол-во человек" (2022г-100чел, 2023г-200чел и тп).

Фактически, это та же самая таблица, по которой нам предстоит предсказать, например, рождаемость в 2024 и 2025 годах.

Есть большое количество математических моделей (ARIMA/SARIMA/LinReg..., которые неплохо справляются с временными рядами), но и нейронки (реккурентные, трансформеры...) с бустингами отлично разваливают задачи TimeSeries, особенно когда мы располагаем большим объемом данных.

Временные ряды - одно из моих любимых направлений, в котором есть свои особенности, отличающие его от обычного табличного МЛ 😁

Поставьте 👍 за кота :)

#Ботаем
👍203👎1
Как совмещать работу с учебой, хакатонами и еще успевать отдыхать?

Иллюзий здесь строить не нужно. Моё мнение - в 20 лет нужно пахать, а отдыхать на пенсии. Но, тем не менее, разгрузка мозгу нужна, но об этом позже.

Как не скатиться по учебе, если ты работаешь? Можно договориться с преподавателем, найти компромисс. Можно, если есть удаленные пары, смотреть их в записи на выходных на 1.5x. Можно, если работа удаленная, посещать важные пары, а рабочие таски закрывать вечером. Вариантов много, и, да, чем-то, возможно, придется жертвовать.

Но! Не так страшен черт, как говорится. Мой совет - это делать. Планировать можно сколько угодно и я, так же как и все, сначала был не уверен, но решил сделать этот шаг. Проблемы появляются, но их, поверьте, можно решать по мере поступления.

Итог - идите на первый хакатон, идите на стажировку, копите полезный опыт. Учеба не упадет, если вы сами этого не захотите. Это можно и нужно совмещать, так что вперед 🤜🤛'

#ИсторияАдмина
🔥151👍1
🎯 Итак, про Darts

1. В этой библиотеке вы создаёте объект временного ряда (одномерного или многомерного)

2. Есть Таргеты (то что хотим предсказывать), Past Covariates (фичи которые мы знаем из прошлого), Future Covariates (фичи которые знаем из будущего, например, номер месяца)

3. То есть, создаём объект временного ряда, пихаем туда нужные фичи (лаги, дни недели и остальное), применяем встроенный Scaler, делаем сплит при необходимости - и всё это в 10 строчек кода

4. Датасет готов. Осталось выбрать модель (в Darts их огромное количество). Здесь можно найти, какие модели поддерживают многомерные ряды, будущие и прошлые ковариаты и др...

5. После обучения модели предсказываем таргет (если приводили к норм распределению, то нужно применить обратную операцию к Scaler), и вуаля

Видеогайд
Пример решения

Согласитесь, удобно, да?

#Ботаем
👍5🔥1
Сегодня подписчики КДВ играют в казино 😌

Чтобы играть, используйте эмодзи 🎲

P.s. randint(1, 6) == 1
👍61
#Хакатоны

Итак, кое-что интересное попало ко мне в руки... IT Purple Hack

6 Кейсов:
Альфа Банк - Табличный МЛ
Тинькофф - AR технологии для привлечения в банковские продукты
ЦБ - Разработать систему, отвечающую на вопросы пользователей на естественном языке
Авито - Необходимо разработать админ панель (платформа ценообразования)
Сбер - Прогнозирование оттока зарплатного клиента
СберТех - Генерация оптимального календарного плана проекта

Даты:
09.03.2024 - 15.03.2024

Призы:
1 место - 100 000 рублей
2 место - 50 000 рублей
3 место - 25 000 рублей

Куча МЛ-кейсов, как будто бы можно ожидать лидерборд. Интересные партнеры, да и недельку длится всего

Оцениваю на 8.5/10
3👍1
Задачка всем неравнодушным подписчикам:

На вход дается натуральное число j. По нему в одну строчку нужно построить единичную матрицу

Можно использовать @, арифметические операции, сравнения, shape, arange, where, любые индексирования (например, a[:j], a[:, None], a[arange(10)])

Ничего другого нельзя. Никаких view, sum, take, squeeze, tensor.


На фото пример ответа для j=3

Варианты кидайте в комменты

Upd: for, while и др. встроенные функции, методы numpy и торча, кроме вышеуказанных, юзать тоже нельзя
👍1🤯1
Предпоследний опрос. Какой у тебя грейд?
Final Results
29%
Enjoyer
22%
Intern
25%
Junior
15%
Middle
4%
Senior
5%
Team Lead
Роскошные призовые заказывали?🤩🤩🤩
🤩13👏41
Написал свой backward в полночь...Sota достигнута?
🤩10
Итак, пришло время очередной истории админа

#ИсторияАдмина

Позавчера ни с того ни с сего умер мой телефон сяоми редми нот 10, доблестно отслуживший 3 года. Своей кончиной он поставил меня в ужасное положение: ни позвонить, ни смс, ни денег перебросить - в общем полный попадос.

Вот на такие случаи любому человеку нужна спасительная наличка 🙏

Вот он самый настоящий черный день, в который я откупорил свою кубышку, как говорится.

А если быть серьёзным, метнулся кабанчиком в ДНС, взял новый, за полтора часа перекинул все данные и пишу этот пост довольный как слон.

Из этой истории сделал еще один вывод: держать запасной телефон (со всеми контактами, заметками, учетками) как раз для таких ситуаций. Ну а еще удобно вставлять новую симку во второй телефон во время путешествий.

Вобщем, на заметку 🤜🤛
11👍1🤩1
Админ на VK JT 😍

Если кто-то есть, подходите на 2 этаж :)
🔥14💩41👍1
Forwarded from Даня
This media is not supported in your browser
VIEW IN TELEGRAM
😁8🔥3
Друзья, всем привет!

Как вы уже знаете, мы разрабатываем сервис, который позволит по загруженной аудиозаписи выявлять дефекты речи и получать персональные рекомендации по их устранению.

Хотели бы пригласить на кастдев (интервью)
📍Актеров
📍Спикеров
📍Преподавателей, представителей и пользователей ораторских курсов и курсов постановки голоса
📍Преподавателей школ, вузов, колледжей
📍Всех, кто хочет улучшить свои ораторские навыки и голосовое мастерство

Длительность: 45 минут

Формат: звонок в Google Meet

В качестве благодарности можем предложить месяц бесплатного пользования сервисом после его выхода, а также участие в закрытом тестировании.

Если заинтересовались, напишите мне в лс @Pleshakovski . Также буду очень признателен, если поделитесь с теми, кого может заинтересовать
🔥112👍2
Итак, шел первый день хакатона IT Purple Hack

1. Мы выбрали кейс Альфа Банка и весь день с командой тащили в офисе ВК 🤩

2. Пока лидерборда нет, накидываю актуальные мемасики

3. Впереди много бессонных ночей. Интересно, много здесь тех, кто еще пишет этот хакатончик? Пишите ваши кейсы в комменты

4. Upd: кейс заключается в следующем: у пользователей есть продуктовый кластер, который формируется на основании услуг, которыми юзер пользуется (например ипотека и вклад). Всего таких кластеров 17. Нужно предсказать переход клиента из одного кластера в другой
🔥12👍3
Ух пойдет завтра возня. Пока сил на нормальные посты нет, докладываю вести с полей хакатона. Продолжаем обрабатывать скор. Пока второе место на паблике

Сегодня спал 3 часа ☠️

Папещеки, делитесь новостями и мыслями с перпл хака
🔥14
За взятие 3 места на приватном лидерборде 🍾🍻

Впереди защита!
🔥25👍1
#Хакатоны

Защита позади! Пока ждем результаты, можете глянуть нашу презентацию и репозиторий

Презентация

Репозиторий

IT Purple Hack: Альфа Банк (табличная мультиклассовая классификация)
12👍1