Библиотека собеса по Data Science | вопросы с собеседований
4.39K subscribers
492 photos
14 videos
1 file
614 links
Вопросы с собеседований по Data Science и ответы на них.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/7dfb7235

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://t.me/proglibrary/9197
Download Telegram
😱 Если ваш продукт не умеет отдавать данные в формате, понятном AI-агенту, то вас просто не существует

Скрипт не будет кликать по красивым кнопкам в браузере, он уйдёт к конкуренту с нормальным API. Перестроить архитектуру под машинных клиентов — это уже не хайп, а необходимое условие сохранения конкурентоспособности.

Как адаптировать продукт и не исчезнуть из выдачи:

— интегрировать MCP и A2A-взаимодействие, чтобы агенты могли вас читать;
— научиться контролировать стоимость (лимиты, кэш, роутинг между моделями);
— настроить AgentOps: трейсинг, логирование и отлов регрессий.

Всё это ждёт вас на обновлённом курсе «Разработка AI-агентов». Мы специально сделали фокус на утилитарном инжиниринге и production-ready решениях.

Кстати, до 29 марта можно забрать курс с большой скидкой, и стоит поторопиться — мест на потоке всё меньше.

Зафиксировать цену и начать деплоить агентов без слива бюджета 👈
Вы подаете на вход модели изображение панды, но добавляете к нему микроскопический «шум», невидимый для человеческого глаза. Модель с уверенностью 99% говорит, что это «гиббон».
Как называется этот феномен в глубоком обучении?
Anonymous Quiz
26%
Галлюцинация
40%
Adversarial Example
30%
Нейронный шум
4%
Ошибка округления
Вы готовите временные ряды для предсказания курса акций. Вы решили нормализовать данные (Scaling), вычислив среднее и стандартное отклонение по всему имеющемуся датасету перед разбиением на Train и Test.
К какой ошибке в оценке модели это приведет?
Anonymous Quiz
3%
Модель будет обучаться слишком долго, так как нормализация больших чисел требует много ресурсов
20%
Нормализация по всему датасету сделает веса модели маленькими, что приведет к затуханию градиента
2%
Это приведет к дублированию строк в базе данных SQL
75%
Произойдет «утечка будущего»
👍1
Алгоритмы вроде YOLO часто выдают несколько bounding boxes вокруг одного и того же объекта с разной степенью уверенности. Для очистки используется Non-Maximum Suppression.
На основе какого показателя NMS решает, что две рамки относятся к одному объекту?
Anonymous Quiz
15%
На основе разницы в площади (Area difference) между рамками
76%
На основе метрики Intersection over Union (IoU)
2%
На основе среднего цвета пикселей внутри каждой рамки
7%
На основе евклидова расстояния между левыми верхними углами рамок
🔥1
Метрика MAPE (Mean Absolute Percentage Error) очень популярна в бизнесе, потому что выражается в процентах.
В каком случае использование MAPE даст крайне искаженный или математически неопределенный результат?
Anonymous Quiz
15%
Если в данных есть выраженная сезонность
11%
Если ряд имеет слишком длинный горизонт прогнозирования
5%
Если мы используем нейросети вместо классической статистики
69%
Если фактические значения в ряду близки к нулю или равны ему
Алгоритм замечает, что тебе нравятся видео про котиков, и начинает показывать только их. Через неделю ты больше не видишь ничего другого.
Какой метод используется в RecSys для борьбы с этой проблемой, чтобы «подмешивать» пользователю новый контент?
Anonymous Quiz
28%
Exploitation
63%
Exploration
3%
Ограничение времени сессии пользователя
5%
Удаление истории просмотров каждые 24 часа