Библиотека собеса по Data Science | вопросы с собеседований

Митап RecSys в Питере — must-have для всех, кто создаёт интеллектуальные рекомендательные системы 🧑‍💻

1 декабря встречаемся в инновационном пространстве — Технохабе Сбера (ул. Уральская, д. 1, Литера Ч) — и на стыке науки и бизнеса обсуждаем, как уже сейчас AI меняет подход к персонализации.

Вместе с Дмитрием Бугайченко — CDS B2C Сбера — и топовыми экспертами индустрии мы погрузимся в актуальные тренды и технологии RecSys, познакомимся с новыми рекомендациями Самоката и универсальными рекомендациями Okko, а также узнаем о построении рекомендателя в платёжных сервисах ЮMoney.

Регистрируйтесь , пока места ещё есть — и готовьтесь к погружению в мир рекомендательных систем!

❤2🔥2⚡1👏1

671 viewsedited 14:59

Почему использование bidirectional LSTM может быть не всегда полез?

Anonymous Quiz

Время обучения сокращается

64%

Будущие контексты могут утечь в прошлое, создавая информационный шум

32%

Требует больше параметров и может переобучаться, особенно если задача не зависит от будущих шагов

Bidirectional LSTM заменяет все gating механизмы

❤1

154 voters600 views17:37

Библиотека собеса по Data Science | вопросы с собеседований

🎄 С Нового года начну учиться — знакомо?

А потом январь — освоюсь после праздников, февраль — доделаю текущие дела... Не откладывай на следующий год то, что можно начать уже в этом.

🗓️ 4 декабря стартует экспресс-курс «Математика для Data Science»— всё, что нужно для уверенных ответов на собесах:

→ 2 месяца без воды;
→ обновлённая программа (ноябрь 2025);
→ живые вебинары с экспертами;
→ записи всех занятий;
→ практика на Python + финальный проект с фидбэком.

Формат: 2 месяца интенсива и к началу следующего года ты готов к собесам.

Пока другие будут собираться с мыслями после НГ, ты уже будешь на полпути к офферу мечты.

🎁 Только до 30 ноября:

→ скидка 40% на курс;
→ курс «Базовая математика» в подарок;
→ бесплатный тест уровня математики.

👉🏻 Хочешь на курс → пиши менеджеру

673 views19:00

Библиотека собеса по Data Science | вопросы с собеседований

Почему adaptive оптимизаторы (Adam, RMSProp) иногда хуже SGD на тестовой выборке?

Anonymous Quiz

87%

Адаптивные шаги ускоряют обучение, но иногда приводят к узким минимумам, плохо обобщающимся

Адаптивные оптимизаторы всегда лучше

SGD не может сходиться на больших данных

Adam не использует градиенты

167 voters624 views08:18

Библиотека собеса по Data Science | вопросы с собеседований

Почему обычная k-fold кросс-валидация не подходит для временных рядов?

Anonymous Quiz

Она слишком медленная

Временные ряды не имеют признаков

Она работает только для линейных моделей

84%

Разбиение на случайные фолды может вызвать утечку информации

👍2

187 voters554 views09:06

Библиотека собеса по Data Science | вопросы с собеседований

Модель была идеально откалибрована с помощью temperature scaling на исходном распределении. После дрейфа данных калибровка резко ухудшается, хотя ROC-AUC остаётся прежним. Почему это возможно?

Anonymous Quiz

90%

ROC-AUC не чувствителен к сдвигу вероятностей, а только к ранжированию

Temperature scaling автоматически адаптируется к дрейфу

Калибровка и AUC всегда ухудшаются одновременно

ROC-AUC ухудшается раньше, чем калибровка

❤2

136 voters526 views18:58

Библиотека собеса по Data Science | вопросы с собеседований

🤖 Раньше в AI мог попасть любой, кто осилил пару туториалов.

Теперь нужны те, кто может объяснить:

→ почему эта архитектура сработает, а та — нет;
→ что происходит внутри модели, когда она не сходится;
→ как найти решение, а не перебирать гиперпараметры наугад.

Все эти навыки требуют понимания того, как и почему работают модели. А это чистая математика.

🔥 Proglib Academy запускает курс «Математика для разработки AI-моделей». Ведут эксперты из SberAI, ВШЭ, Т-Банк, Wildberries.

📝 Что внутри?

→ 2 месяца живых занятий с возможностью задавать вопросы напрямую.
→ Практика на Python. Не теория в вакууме, а применение.
→ 3 домашних задания + финальный проект с детальным разбором.

⏰ Старт 4 декабря

⌛ Только до конца ноября:
→ Скидка 40%;
→ Курс «Школьная математика» в подарок;
→ Тест на определение уровня математики.

🎄 Сделай себе подарок на Новый год

532 views15:01

Библиотека собеса по Data Science | вопросы с собеседований

Почему Adam может переобучаться быстрее, чем SGD, на шумных данных при одинаковой архитектуре?

Anonymous Quiz

Adam использует глобальный шаг обучения

76%

Adam увеличивает шаги в шумных направлениях благодаря перпараметризованной адаптации

SGD всегда уходит в плоские минимумы

11%

Adam не использует нормализацию градиента

❤3

173 voters569 views19:04

Библиотека собеса по Data Science | вопросы с собеседований

Почему даже rolling-window CV может давать leakage?

Anonymous Quiz

Это невозможно

17%

Rolling-window использует слишком маленькие тестовые окна

13%

CV всегда даёт leakage

68%

Если target leakage скрыт в engineered features (например, future-based statistics)

❤1

306 voters1.59K views18:35

Библиотека собеса по Data Science | вопросы с собеседований

Почему MAE более устойчива к шуму меток, чем MSE, но часто обучается медленнее?

Anonymous Quiz

83%

MAE имеет константный градиент и не усиливает большие ошибки

MSE не выпукла

MAE зависит от Learning Rate

MSE автоматически игнорирует шум

❤2👍1

216 voters491 views18:49

Библиотека собеса по Data Science | вопросы с собеседований

Почему Bayesian Neural Networks могут по-прежнему быть плохо откалиброваны?

Anonymous Quiz

Байесовские модели всегда идеальны

50%

VI и Laplace-аппроксимации дают слишком узкие апостериоры

16%

Байесовские методы запрещают регуляризацию

33%

Байесовская неопределённость = aleatoric uncertainty

101 voters393 views18:20

Библиотека собеса по Data Science | вопросы с собеседований

🔬 Вы когда-нибудь смотрели на код и думали: «Работает, но почему?»

А теперь представьте, что вы:

→ понимаете, почему модель учится слишком медленно или слишком быстро;
→ видите, какие данные реально влияют на предсказание, а какие — шум;
→ знаете, что происходит внутри нейронки.

4 декабря стартует курс «Математика для разработки AI-моделей».

Линал, оптимизация, матан, статистика — всё, что происходит внутри модели между input и output. Практика на Python. Живые разборы с экспертами из SberAI, ВШЭ, Wildberries&Russ.

3 задания + финальный проект. Без теории ради теории — только то, что реально используется в моделях.

🎁 Бонус: курс по школьной математике + тест уровня математики

👉 Записаться

404 views19:00

Библиотека собеса по Data Science | вопросы с собеседований

Площадь под ROC-кривой (AUC-ROC) для классификатора равна 0.50. Что это означает?

Anonymous Quiz

Модель является идеальным классификатором.

Модель работает лучше, чем случайное угадывание.

10%

Это означает, что Precision и Recall равны 0.50.

86%

Модель работает не лучше, чем случайное угадывание.

❤1

178 voters316 views18:18

About

Blog

Apps

Platform