Библиотека собеса по Data Science | вопросы с собеседований

«Этот манёвр будет стоить нам 51 год...»

— или потерю шанса на Senior-позицию из-за «поплывшей» математики на тех-интервью. В Data Science теоремы и алгоритмы — это фундамент, без которого не построить ни одну серьёзную модель.

19 января в Proglib Academy вырастут цены. Успейте забрать курсы по Math, ML и AI по старой стоимости:

— Разработка ИИ-агентов
— Математика для разработки AI-моделей
— ML для старта в Data Science
— Математика для Data Science
— Специалист по ИИ
— Алгоритмы и структуры данных
— Программирование на Python
— Основы IT для непрограммистов
— Архитектуры и шаблоны проектирования

Подготовиться к собеседованиям

⚠️ Стоимость изменится 19 января

😁1

834 views15:13

Библиотека собеса по Data Science | вопросы с собеседований

Вы хотите дообучить модель Llama 3 на своих личных переписках, чтобы она имитировала ваш стиль общения. Вместо того чтобы менять все веса огромных матриц модели, вы решаете использовать LoRA.

В чем заключается этот метод?

Anonymous Quiz

21%

Он просто отключает (freeze) 99% слоев, оставляя только последний

56%

Он представляет изменение весов в виде произведения двух матриц низкого ранга

Он переводит все веса модели в 1-битный формат

20%

Он использует внешнюю базу данных (RAG) вместо изменения внутренних весов

👍2

217 voters857 views17:23

Библиотека собеса по Data Science | вопросы с собеседований

Вы строите корпоративного ассистента, который должен отвечать на вопросы сотрудников по внутренним документам (которые модель никогда не видела при обучении). Вместо Fine-tuning, вы внедряете архитектуру RAG.

Как именно работает этот механизм?

Anonymous Quiz

85%

Система ищет текст в БД, добавляет его в контекст модели, и только после этого генерируется ответ

Модель генерирует ответ на основе своей памяти, а потом проверяет его правильность в Google

Модель использует слой нейронов, который физически расширяется при добавлении новых документов

Вопрос переводится на язык SQL, чтобы модель могла напрямую менять веса своих слоев

👍1

213 voters887 views18:30

Библиотека собеса по Data Science | вопросы с собеседований

ViT разбивает изображение на патчи и вычисляет внимание между патчами. Если мы увеличим разрешение фото в 2 раза, количество вычислений вырастет в 16 раз.

Для решения проблемы был создан Swin Transformer. Какое нововведение позволяет ему работать быстро?

Anonymous Quiz

Он удаляет 75% пикселей перед обработкой

75%

Он вычисляет внимание внутри локальных окон, которые сдвигаются на каждом слое

10%

Он заменяет механизм внимания на обычные свертки 3×3

Он использует только один слой внимания в самом конце сети

❤2👍2

155 voters809 views18:51

Библиотека собеса по Data Science | вопросы с собеседований

В отличие от GAN, где 2 сети соревнуются, диффузионные модели обучаются на процессе постепенного разрушения данных.

В процессе обратной диффузии нейросеть получает на вход сильно зашумленное изображение. Какова задача на каждом микро-шаге этого процесса?

Anonymous Quiz

Предсказать, какой объект изображен на картинке

93%

Предсказать и «вычесть» шум, который был добавлен к изображению на текущем этапе

Сжать изображение в 10 раз для экономии памяти

Перевести текстовый запрос пользователя в набор пикселей

👍2

179 voters875 views18:56

Библиотека собеса по Data Science | вопросы с собеседований

This media is not supported in your browser

VIEW IN TELEGRAM

0:47

725 views09:06

Библиотека собеса по Data Science | вопросы с собеседований

RAG или Fine-tuning: что отвечать на собеседовании?

Вопросы по архитектуре LLM-систем становятся стандартом. 23 января в 19:00 на открытом уроке к курсу «Разработка ИИ агентов» разберём матчасть: как работают Retrieval-Augmented Generation и дообучение моделей в реальных проектах.

Ведущий — Игорь Стурейко, тимлид в «Газпроме» и AI-архитектор. В своём видеосообщении Игорь делится опытом построения сложных ML-решений и рассказывает о программе подготовки специалистов по агентам.

Ключевые концепции:

— разница между параметрической и внешней памятью модели;
— использование FAISS и Chroma для хранения эмбеддингов;
— пайплайны обработки документов с помощью LangChain.

📅 Когда: 23.01 в 19:00 МСК

Узнать подробности

❤1

831 views09:06

Библиотека собеса по Data Science | вопросы с собеседований

Вы тестируете систему комп. зрения для беспилотного авто Тесты показали, что можно изменить изображение знака «STOP» так, что человек не заметит разницы, но нейросеть с 99% классифицирует его как «Ограничение скорости».

Как называется этот тип атаки?

Anonymous Quiz

Брутфорс-атака (Bruteforce)

56%

Инъекция данных (Data Poisoning)

Переполнение буфера (Buffer Overflow)

32%

Атака быстрым градиентным знаком (FGSM - Fast Gradient Sign Method)

202 voters782 views18:38

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты работаешь в банке. Твоя сложная модель отклонила заявку на кредит. Клиент требует объяснить — почему? Для этого ты используешь SHAP.

В чем заключается идея вычисления Shapley values для каждого признака?

Anonymous Quiz

82%

Метод оценивает вклад признаков, сравнивая предсказания модели для всех их комбинаций.

Метод строит график корреляции между признаком и ответом

Метод заменяет нейросеть на дерево решений, которое легче читать

Метод находит самый важный признак и обнуляет все остальные

😁4❤1

218 voters811 views18:19

Библиотека собеса по Data Science | вопросы с собеседований

This media is not supported in your browser

VIEW IN TELEGRAM

0:58

678 views11:13

Библиотека собеса по Data Science | вопросы с собеседований

Пятница, 19:00. Худшее время для деплоя, но идеальное, чтобы подготовиться к каверзным вопросам про LLM-пайплайны, которые точно зададут на интервью.

Вопросы про RAG и Fine-tuning стали стандартом на интервью для ML-инженеров. Приходи разобраться в теме на практике.

Разберём на открытом уроке:

— выбор между Retrieval-Augmented Generation и дообучением весов;
— работа с векторными эмбеддингами (`FAISS`, `Chroma`);
— построение продакшн-пайплайна с использованием LangChain.

Один из спикеров — Алексей Яндутов, ML-инженер в поиске Яндекса.

Это вводное занятие курса «Разработка AI-агентов». Готовьтесь к коду и архитектурным схемам.

Записаться на урок

proglib.academy

Курс| Разработка AI-агентов

Курс про контролируемую разработку AI-агентов: качество, стоимость, наблюдаемость и тестирование. С первого занятия — практическая работа.

751 views11:13

Библиотека собеса по Data Science | вопросы с собеседований

Вы используете инициализацию весов He и Batch Normalization после каждого сверточного слоя. Несмотря на это, в ResNet в начале обучения растёт дисперсия активаций с глубиной, что ухудшает сходимость.

Какое решение лучше всего устраняет это?

Anonymous Quiz

53%

Замена ReLU на Leaky ReLU с α=0.01 для обеспечения протекания градиента в отрицательной области

22%

Dropout с вероятностью p=0.5 непосредственно перед операцией сложения для регуляризации

16%

Weight Decay исключительно к весам на основном пути, исключая параметры в shortcut-соединениях

Zero-γ инициализация последней BatchNorm в residual-блоке

👍3🤔2

129 voters717 views18:01

Библиотека собеса по Data Science | вопросы с собеседований

На интервью по DS спрашивают про Agentic Workflow, а ты всё ещё «жаришь» промпты?

Настоящий Шеф проектирует Систему. В понедельник, 26 января, стартует интенсив по разработке ИИ-агентов. Получи знания, которые отличают Middle от Senior. 📊

В программе:

— мультиагентные системы в CrewAI: управление пулом агентов;
— сложная логика в LangGraph: проектирование стейт-менеджмента;
— tool use интеграция: связь моделей с API и базами данных. 🧠

Записаться на курс

749 views15:12

Библиотека собеса по Data Science | вопросы с собеседований

Как называется статистическое явление, при котором алгоритм A лучше в общей статистике, но хуже алгоритма B в каждом подмножестве данных (например, по устройствам)?

Anonymous Quiz

Эффект выжившего (Survivorship Bias): мы не учитываем пользователей, которые вообще не кликают

66%

Парадокс Симпсона: из-за «скрытой переменной», которая неравномерно распределена между группами

12%

Мультиколлинеарность: признаки слишком сильно коррелируют друг с другом, что «раздувает» веса модели

13%

Проблема подглядывания: мы перебираем разбиения данных до тех пор, пока не найдем аномалию

👍3

209 voters770 views18:25

Библиотека собеса по Data Science | вопросы с собеседований

Завтра стартуем: курс по разработке ИИ-агентов 📊

Будьте готовы к вопросам по архитектуре автономных пайплайнов. Мы научим проектировать агентные системы на CrewAI, управлять графами в LangGraph и подключать модели к реальным бизнес-инструментам.

👉 Успейте занять место до начала занятий

747 views15:11

Библиотека собеса по Data Science | вопросы с собеседований

Вы строите модель детекции мошеннических транзакций. Класс «мошенничество» встречается редко по сравнению с «легитимными» операциями. Вы решили применить SMOTE.

В чем заключается недостаток SMOTE, который приводит к огромному количеству False Positives?

Anonymous Quiz

Он работает только с категориальными признаками и не умеет обрабатывать числа

18%

Он требует обязательного уменьшения выборки основного класса, что ведет к потере важной информации

55%

Он линейно интерполирует точки между соседями меньшинства, игнорируя мажоритарный класс

22%

Он просто дублирует существующие строки, что приводит к переобучению на конкретных примерах

👍4

175 voters796 views18:46

Библиотека собеса по Data Science | вопросы с собеседований

Вопрос на собеседовании: «В чём разница между классическим RAG и Agentic RAG?»

Если не знаете ответ — пора на курс. Сегодня в 19:00 МСК мы начинаем разбирать архитектуру автономных систем с нуля до продакшена.

Подготовим вас к сложным вопросам по AI:

— механизмы планирования в агентах;
— работа с памятью и контекстом;
— мультиагентная оркестрация;
— методы оценки faithfulness и relevancy ответов.

Подготовиться к офферу

👍1

772 views15:19

Библиотека собеса по Data Science | вопросы с собеседований

Ты участвуешь в Kaggle соревновании. Тебе дали train набор и test. Ты подозреваешь, что данные в тесте «пришли из другого мира» (например, из другого временного периода).

Чтобы проверить, ты используешь Adversarial Validation. В чем суть метода?

Anonymous Quiz

42%

Ты обучаешь классификатор «Train vs Test»: если ROC-AUC высокий, выборки различаются.

Ты просишь генератор сделать фейковые данные и пытаешься их классифицировать.

24%

Ты сравниваешь средние значения всех признаков в Train и Test и удаляешь те, где разница больше 10%

27%

Ты объединяешь Train и Test, перемешиваешь их и заново разбиваешь на фолды, чтобы «усреднить» ошибку

❤2👍2

208 voters824 views18:02

Библиотека собеса по Data Science | вопросы с собеседований

Вы строите логистическую регрессию для предсказания оттока клиентов. В вашем наборе данных есть признаки, которые сильно коррелируют между собой. Вы решаете проверить их с помощью VIF.

Для одного из признаков вы получили VIF = 12. Что это означает?

Anonymous Quiz

12%

Ошибка модели на этом признаке составляет 12%, что является допустимым порогом в Data Science

11%

Признак распределен по закону Пуассона, что нарушает требования нормальности логистической регрессии

69%

Признак сильно зависит от других независимых переменных, оценка его коэффициента ненадежна

Признак имеет очень низкую предсказательную силу, и его нужно заменить на случайный шум

👍4

169 voters799 views18:22

Библиотека собеса по Data Science | вопросы с собеседований

Вас точно спросят про AI-агентов на следующем собеседовании

В 2026 году знание только градиентного бустинга — это база. Компании ищут тех, кто умеет внедрять LLM в продакшн через агентские архитектуры и понимает разницу между LangGraph и обычным чейнингом.

Подготовьтесь к техническим вопросам на курсе «Углубленные AI-агенты».

Что вы добавите в резюме:

— навык проектирования мультиагентных систем;
— опыт работы с актуальными фреймворками CrewAI и AutoGen;
— понимание методов масштабирования ИИ-решений;
— готовый сквозной проект в портфолио.

Курс уже идет, залетайте, пока есть места.

🚀 Записаться на основной курс

Если сомневаетесь — просто посмотрите вводное занятие.

❤2

757 views15:02

Библиотека собеса по Data Science | вопросы с собеседований

Какое априорное распределение обычно берут для вероятности успеха при биномиальных данных, чтобы использовать сопряжённость и получить апостериорное распределение аналитически?

Anonymous Quiz

46%

Распределение Пуассона

26%

Бета-распределение (Beta distribution)

21%

Распределение Стьюдента

Экспоненциальное распределение

👍1

196 voters759 views19:00

About

Blog

Apps

Platform