Интересное что-то

Forwarded from Поступашки - ШАД, Стажировки и Магистратура

Стажировка Data Science в Альфа-Банке (2025)

Выпускник нашего курса по DS поделился своим опытом стажировки. Текст немного отредактирован.

Лонг стори шорт, зашёл на страницу программы Альфа будущее, вакансии там обновляются регулярно, начал следить за позициями по DS. Через пару недель нашёл подходящую. Требования стандартные: питон, SQL, основы ml, pandas, scikit-learn, а также любой фреймворк для глубокого обучения.

Отправил резюме с github-ссылкой. Указал два проекта: предсказание цен на недвижимость на kaggle и классификатор текстов на pytorch (BERT+дообучение на датасете с отзывами). Коммерческого опыта не было. Ответили через 20 минут с тестовым заданием.

Тест: теория ml (бэггинг против бустинга, когда используется f-score и прочая мл база), SQL:
1.написать запрос с JOIN для объединения данных о клиентах и их транзакциях
2.оконная функция для расчёта скользящего среднего дохода,
pandas для обработки данных, немного статистики:
интерпретация p-value в A/B-тесте, и как определить, что разница между группами значима?

Ответил почти всё, но ошибся с масштабированием признаков для градиентного бустинга и получил недостаточный, как мне показалось, результат. Думал, что не прошёл. Но через три недели HR снова связался - мое резюме осталось в базе, и появились позиции в группе кредитного скоринга

Началось всё с собеседования с тимлидом: обсуждали мои проекты, выбор метрик, методы борьбы с переобучением. Важно было объяснить логику решений, а не просто перечислить технический стек.
На технических собеседованиях, к моему счастью, не было ничего страшного: давались практические кейсы по типу: как обрабатывать категориальные признаки с высокой кардинальностью или как работать с данными о клиентах. Никаких задач по написанию кода.

И наконец сам офер получил через пару недель, онбординг занял несколько дней.

Первые задачи были связаны с анализом качества данных: искали утечки в фичах, проверяли стабильность распределений. Потом доверили дообучение модели - нужно было аккуратно протестировать новые гиперпараметры, чтобы не сломать продакшен + пришлось много работать с SQL: писал сложные запросы к хранилищу и агрегировал данные для новых фичей.

@postypashki_old

79 views14:01