Библиотека собеса по Data Science | вопросы с собеседований
4.39K subscribers
492 photos
14 videos
1 file
614 links
Вопросы с собеседований по Data Science и ответы на них.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/7dfb7235

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://t.me/proglibrary/9197
Download Telegram
Пятница, 19:00. Худшее время для деплоя, но идеальное, чтобы подготовиться к каверзным вопросам про LLM-пайплайны, которые точно зададут на интервью.

Вопросы про RAG и Fine-tuning стали стандартом на интервью для ML-инженеров. Приходи разобраться в теме на практике.

Разберём на открытом уроке:

— выбор между Retrieval-Augmented Generation и дообучением весов;
— работа с векторными эмбеддингами (`FAISS`, `Chroma`);
— построение продакшн-пайплайна с использованием LangChain.

Один из спикеров — Алексей Яндутов, ML-инженер в поиске Яндекса.

Это вводное занятие курса «Разработка AI-агентов». Готовьтесь к коду и архитектурным схемам.

Записаться на урок
Вы используете инициализацию весов He и Batch Normalization после каждого сверточного слоя. Несмотря на это, в ResNet в начале обучения растёт дисперсия активаций с глубиной, что ухудшает сходимость.

Какое решение лучше всего устраняет это?
Anonymous Quiz
53%
Замена ReLU на Leaky ReLU с α=0.01 для обеспечения протекания градиента в отрицательной области
22%
Dropout с вероятностью p=0.5 непосредственно перед операцией сложения для регуляризации
16%
Weight Decay исключительно к весам на основном пути, исключая параметры в shortcut-соединениях
9%
Zero-γ инициализация последней BatchNorm в residual-блоке
👍3🤔2
На интервью по DS спрашивают про Agentic Workflow, а ты всё ещё «жаришь» промпты?

Настоящий Шеф проектирует Систему. В понедельник, 26 января, стартует интенсив по разработке ИИ-агентов. Получи знания, которые отличают Middle от Senior. 📊

В программе:

— мультиагентные системы в CrewAI: управление пулом агентов;
— сложная логика в LangGraph: проектирование стейт-менеджмента;
tool use интеграция: связь моделей с API и базами данных. 🧠

Записаться на курс
Завтра стартуем: курс по разработке ИИ-агентов 📊

Будьте готовы к вопросам по архитектуре автономных пайплайнов. Мы научим проектировать агентные системы на CrewAI, управлять графами в LangGraph и подключать модели к реальным бизнес-инструментам.

👉 Успейте занять место до начала занятий
Вопрос на собеседовании: «В чём разница между классическим RAG и Agentic RAG?»

Если не знаете ответ — пора на курс. Сегодня в 19:00 МСК мы начинаем разбирать архитектуру автономных систем с нуля до продакшена.

Подготовим вас к сложным вопросам по AI:

— механизмы планирования в агентах;
— работа с памятью и контекстом;
— мультиагентная оркестрация;
— методы оценки faithfulness и relevancy ответов.

Подготовиться к офферу
👍1
Вас точно спросят про AI-агентов на следующем собеседовании

В 2026 году знание только градиентного бустинга — это база. Компании ищут тех, кто умеет внедрять LLM в продакшн через агентские архитектуры и понимает разницу между LangGraph и обычным чейнингом.

Подготовьтесь к техническим вопросам на курсе «Углубленные AI-агенты».

Что вы добавите в резюме:

— навык проектирования мультиагентных систем;
— опыт работы с актуальными фреймворками CrewAI и AutoGen;
— понимание методов масштабирования ИИ-решений;
— готовый сквозной проект в портфолио.

Курс уже идет, залетайте, пока есть места.

🚀 Записаться на основной курс

Если сомневаетесь — просто посмотрите вводное занятие.
2
Какое априорное распределение обычно берут для вероятности успеха при биномиальных данных, чтобы использовать сопряжённость и получить апостериорное распределение аналитически?
Anonymous Quiz
46%
Распределение Пуассона
26%
Бета-распределение (Beta distribution)
21%
Распределение Стьюдента
7%
Экспоненциальное распределение
👍1
Продажи мороженого растут каждый год, есть сезонность: пик в июле, спад в январе, причём амплитуда сезонных колебаний увеличивается вместе с ростом общего уровня продаж.

Какую модель выбрать?
Anonymous Quiz
37%
Аддитивную модель: Y(t) = Trend + Seasonality + Noise
47%
Мультипликативную модель: Y(t) = Trend × Seasonality × Noise
2%
Линейную регрессию по времени без учета сезонности
15%
Скользящее среднее с окном в 12 месяцев для удаления всех колебаний
1👍1
Вопрос на $5k: «Как работает память в AI-агентах?»

Если ответите «просто векторная база» — провал. Векторная база — это знания, а память — это контекст. Правильный ответ включает архитектуру управления состоянием (State Management).

В LangGraph это реализовано через граф:

— состояние (State) передаётся между узлами;
— агент может «забывать» или «резюмировать» контекст;
— циклы позволяют уточнять информацию.

Разберитесь в деталях на нашем курсе.

Записаться на курс

Вводная лекция бесплатно
😁1
Вопрос с собеседования 2026: RAG vs Agentic RAG

На сеньорских позициях теперь спрашивают не просто про векторные базы, а про архитектуру агентов.

В чём отличие?

Обычный RAG: Нашёл документы → Сгенерировал ответ.

Agentic RAG (на LangGraph): Оценил вопрос → Спланировал поиск → Проверил найденное → (если плохо) Переформулировал запрос и искал снова.

Умение строить такие системы с циклами и состоянием — главный навык года. Мы учим этому на курсе.

Записаться на курс

Подготовка к вопросам по архитектуре: Смотрите вводный урок бесплатно.
Ты планируешь A/B-тест. Чтобы убедиться, что твой калькулятор p-value и система сплитования корректны, ты запускаешь A/A-тест: делишь трафик на 2 группы, но обеим показываешь одинаковый вариант сайта. Что является признаком проблемы при анализе A/A-теста?
Anonymous Quiz
10%
Конверсия в обеих группах оказалась ниже ожидаемой
9%
Средние значения в группах А и А практически совпали
63%
Если при многократном повторении A/A-тестов распределение p-value не является равномерным
17%
Значение p-value получилось равным 0.5
👍1
Вы проводите тест в online-магазине. В тест группу случайно попал оптовый закупщик, который купил товара на 1000000₽, в то время как обычный чек — 2000₽. Это завысило среднее в группе. Какой метод наиболее корректен для снижения влияния таких выбросов?
Anonymous Quiz
26%
Использование логарифмирования целевой метрики (Log-transformation)
72%
Винзоризация: замена значений выше 99-го перцентиля значением этого самого 99-го перцентиля
0%
Увеличение длительности теста в 10 раз
2%
Переход от среднего к сумме всех чеков
👍2
Вы обучили модель градиентного бустинга предсказывать вероятность поломки. Она показывает отличный ROC-AUC, но бизнес жалуется: модель выдает 0.8, а в реальности поломка происходит в 40%.

Какой инструмент позволяет визуально оценить это несоответствие?
Anonymous Quiz
63%
Confusion Matrix
19%
Reliability Diagram
6%
Elbow Method
12%
Learning Curve
🤔5👍1