«Расскажите про ваш опыт с Agentic RAG» — стандартный вопрос собеседования
Рынок DS в 2026 году требует большего, чем знание
На курсе мы даём то, что требуют на позициях Senior AI Engineer. Мы разбираем реальные задачи: как оценивать качество генерации (LLM-as-a-Judge), как строить мультиагентные системы и выводить это в прод.
Темы для вашего резюме:
— Orchestration:
— Retrieval: Hybrid Search, Reranking, GraphRAG.
— Fine-tuning: адаптация моделей под специфику агента.
— Evaluation: метрики качества для генеративных моделей.
Подготовиться к собеседованиям нового уровня
Рынок DS в 2026 году требует большего, чем знание
torch и pandas. Компании ищут инженеров, умеющих строить автономные системы, способные решать задачи без участия человека.На курсе мы даём то, что требуют на позициях Senior AI Engineer. Мы разбираем реальные задачи: как оценивать качество генерации (LLM-as-a-Judge), как строить мультиагентные системы и выводить это в прод.
Темы для вашего резюме:
— Orchestration:
LangGraph, LangChain.— Retrieval: Hybrid Search, Reranking, GraphRAG.
— Fine-tuning: адаптация моделей под специфику агента.
— Evaluation: метрики качества для генеративных моделей.
Подготовиться к собеседованиям нового уровня
Представь, что ты обучаешь модель предсказывать стоимость квартир. Первое дерево предсказало 10 млн ₽, а реальная цена — 12 млн ₽. Ошибка (остаток) составила 2 млн ₽.
Что будет делать второе дерево в алгоритме градиентного бустинга?
Что будет делать второе дерево в алгоритме градиентного бустинга?
Anonymous Quiz
10%
Снова будет предсказывать цену квартиры (12 млн ₽), но на другой выборке
81%
Будет предсказывать не цену, а ошибку первого дерева (эти самые 2 млн ₽)
3%
Будет предсказывать среднюю цену всех квартир в базе
7%
Попробует предсказать, было ли первое дерево право или нет (классификация)
❤1
Представь, что у тебя есть облако точек в 2D (два признака: рост и вес), которое вытянуто вдоль одной линии. Ты хочешь сжать эти данные в 1D, чтобы не потерять структуру данных.
Как PCA выбирает направление для этой новой оси (первой главной компоненты)?
Как PCA выбирает направление для этой новой оси (первой главной компоненты)?
Anonymous Quiz
2%
Это ось, которая делит количество точек ровно пополам
4%
Это один из исходных признаков, у которого меньше всего пропущенных значений
62%
Это направление, вдоль которого данные имеют максимальную самый большой разброс
32%
Это ось, которая проходит через среднее значение всех точек и перпендикулярна самой длинной стороне
❤4
K-means работает итеративно: сначала он ставит случайные точки (центроиды), а затем двигает их, пока они не окажутся в центрах своих групп.
На каждом шаге происходят две вещи. Какая из них описывает процесс обновления координат центроида?
На каждом шаге происходят две вещи. Какая из них описывает процесс обновления координат центроида?
Anonymous Quiz
4%
Каждый объект данных притягивается к самому дальнему от него центроиду
83%
Центроид перемещается в точку со средними координатами всех объектов кластера
4%
Центроид удаляется, если в его радиусе оказалось меньше 5 объектов
9%
Координаты центроида выбираются случайным образом из исходного набора данных
❤3
В отличие от K-means, где мы заранее задаем K, в DBSCAN мы задаем «правила соседства»: радиус поиска и минимальное количество соседей.
Как DBSCAN поступает с точкой, у которой в радиусе слишком мало соседей, и она не является соседом «плотной» группы?
Как DBSCAN поступает с точкой, у которой в радиусе слишком мало соседей, и она не является соседом «плотной» группы?
Anonymous Quiz
12%
Принудительно прикрепляет её к самому близкому большому кластеру
72%
Помечает её как «Noise» (шум/выброс) и не включает ни в один кластер
14%
Создает для этой точки отдельный кластер из одного элемента
2%
Удаляет эту точку из датасета навсегда
👍3
Представь, что мы используем агломеративный подход. В начале каждая точка — это отдельный кластер. Затем алгоритм попарно объединяет близкие точки в группы, пока всё не превратится в один кластер. Как называется график, который визуализирует этот процес?
Anonymous Quiz
4%
Гистограмма
29%
Диаграмма рассеяния
61%
Дендрограмма
6%
Тепловая карта
❤2
Forwarded from Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
Какие методы синтаксического анализа текста могут быть использованы для обнаружения именных групп (noun phrases), глагольных групп (verb phrases), а также для определения подлежащего (subject) и дополнения (object) в NLP?
Anonymous Quiz
58%
Part of speech tagging (Тегирование частей речи)
14%
Skip Gram and N-gram extraction (Извлечение N-грамм и модель Skip-gram)
8%
Continuous Bag of Words (Модель непрерывного мешка слов — CBOW)
20%
Dependency Parsing and Constituency Parsing (Парсинг зависимостей и парсинг составляющих)
👍5❤1
Ты создаешь рек-ную систему для статей. Ты хочешь понять, насколько статья А похожа на Б по смыслу. Для этого ты превращаешь тексты в векторы.
Какую метрику используют, чтобы измерить «близость» векторов, если важно направление интересов пользователя?
Какую метрику используют, чтобы измерить «близость» векторов, если важно направление интересов пользователя?
Anonymous Quiz
10%
Евклидово расстояние
10%
Коэффициент корреляции Пирсона
79%
Косинусное сходство
1%
Сумма всех слов в тексте
👍1
У тебя есть датасет, где на 1000 «хороших» примеров приходится всего 10 «плохих». Тебе нужно обучить классификатор. Какой метод генерации новых данных (Oversampling) создаёт синтетические примеры редкого класса, а не просто дублирует существующие?
Anonymous Quiz
16%
Random Oversampling
69%
SMOTE
10%
Undersampling
5%
Кластеризация K-means
👍4❤2
Самый популярный метод — K-Fold.
Однако есть ситуация, когда обычный K-Fold нельзя использовать. О каком типе данных идет речь?
Однако есть ситуация, когда обычный K-Fold нельзя использовать. О каком типе данных идет речь?
Anonymous Quiz
3%
Данные с картинками высокого разрешения
13%
Данные с большим количеством пропусков
78%
Временные ряды
7%
Данные, в которых признаков больше, чем строк
Представь, что ты строишь модель предсказания спроса на доставку еды. У тебя есть столбец с датой заказа: 2026-02-16 19:30:00. Если ты оставишь его в таком виде, модель ничего не поймет.
Какое преобразование этого признака принесет пользу для модели?
Какое преобразование этого признака принесет пользу для модели?
Anonymous Quiz
16%
Превратить дату в количество секунд, прошедших с 1 января 1970 года (Unix Timestamp)
78%
Извлечь циклические признаки: «День недели» (Is_Weekend) и «Час суток» (Обед/Ужин)
1%
Просто удалить дату, так как это не числовой признак
5%
Заменить каждую дату на порядковый номер дня в году (от 1 до 365)
Главный секрет трансформеров — механизм Self-Attention (внимания к себе). Представь предложение: «Банк закрыли, потому что он был ограблен».
Как механизм внимания помогает модели понять, к чему относится слово «он»?
Как механизм внимания помогает модели понять, к чему относится слово «он»?
Anonymous Quiz
2%
Модель просто выбирает ближайшее слово слева и справа
93%
Модель вычисляет математическую связь между словом «он» и всеми остальными словами в предложении
4%
Модель ищет слово «он» в специальном словаре и присваивает оценку
1%
Это заложено в код программистами вручную для каждого случая
🤩2
Вопрос с собеседования: «Как вы обеспечите стабильность AI-агента в проде?»
Если вы начнёте говорить про промпт-инжиниринг, вас не наймут. Правильный ответ включает: метрики, трейсинг, RAG-пайплайны и управление ресурсами. Этому мы учим на обновлённом курсе
«Разработка AI-агентов».
Разбираем на практике:
🔹 Архитектура.
🔹 RAG. Работа со сложными документами и таблицами.
🔹 Ops. Логирование, мониторинг затрат и качества.
Стартуй сейчас! Материалы доступны сразу после покупки.
🎟 ПромокодAgent — скидка 10 000 ₽ (до 28 февраля).
👉 Подготовиться к реальным задачам
Если вы начнёте говорить про промпт-инжиниринг, вас не наймут. Правильный ответ включает: метрики, трейсинг, RAG-пайплайны и управление ресурсами. Этому мы учим на обновлённом курсе
«Разработка AI-агентов».
Разбираем на практике:
🔹 Архитектура.
LangGraph, state-management, time-travel отладка.🔹 RAG. Работа со сложными документами и таблицами.
🔹 Ops. Логирование, мониторинг затрат и качества.
Стартуй сейчас! Материалы доступны сразу после покупки.
🎟 Промокод
👉 Подготовиться к реальным задачам
Как математически изменяется размерность тензора на выходе одного блока Scaled Dot-Product Attention по сравнению с входным тензором (при условии, что d_{model} остается неизменной)?
Anonymous Quiz
19%
Размерность увеличивается в 3 раза (из-за Q, K, V)
34%
Размерность не меняется
30%
Размерность зависит от количества голов (heads)
17%
Размерность уменьшается до вектора скаляров
😢4👍1
Ваша модель предсказания спроса на куртки стала работать хуже. Вы заметили, что распределение температур в этом году сильно изменилось по сравнению с прошлым. Как называется этот тип деградации?
Anonymous Quiz
19%
Concept Drift (сдвиг концепции)
77%
Data Drift (сдвиг данных)
1%
Насыщение модели
3%
Overfitting (переобучение)
Почему джуны-датасайентисты не могут вывести LLM в прод?
На собеседованиях кандидаты отлично рассказывают про эмбеддинги и трансформеры. Но когда их просят спроектировать отказоустойчивую систему, контролировать бюджет на токены или настроить RAG по сканам — они сыпятся.
Мы пересобрали курс по AI-агентам. Фокус смещён с теории на суровый инжиниринг: метрики, предотвращение регрессий и экономику агентов. Это знания, которые сейчас требуют от Middle+ DS.
Что в программе для прокачки:
🔹 промышленный RAG: обработка таблиц, сканов и специализированный поиск;
🔹 архитектура агентов: LangGraph, перемотка времени (time-travel) и контрольные точки;
🔹 контроль затрат: ограничение времени исполнения ресурсов, динамический роутинг;
🔹 интеграции: работа агентов с legacy-интерфейсами и браузером;
🔹 комплаенс: развёртывание LLM-решений с соблюдением 152-ФЗ.
Забирайте скидку 10 000 рублей по промокоду
Используйте акцию «3 курса по цене 1», чтобы забрать ещё два курса бесплатно.
Подготовиться к реальному продакшну
На собеседованиях кандидаты отлично рассказывают про эмбеддинги и трансформеры. Но когда их просят спроектировать отказоустойчивую систему, контролировать бюджет на токены или настроить RAG по сканам — они сыпятся.
Мы пересобрали курс по AI-агентам. Фокус смещён с теории на суровый инжиниринг: метрики, предотвращение регрессий и экономику агентов. Это знания, которые сейчас требуют от Middle+ DS.
Что в программе для прокачки:
🔹 промышленный RAG: обработка таблиц, сканов и специализированный поиск;
🔹 архитектура агентов: LangGraph, перемотка времени (time-travel) и контрольные точки;
🔹 контроль затрат: ограничение времени исполнения ресурсов, динамический роутинг;
🔹 интеграции: работа агентов с legacy-интерфейсами и браузером;
🔹 комплаенс: развёртывание LLM-решений с соблюдением 152-ФЗ.
Забирайте скидку 10 000 рублей по промокоду
Agent (до 28 февраля).Используйте акцию «3 курса по цене 1», чтобы забрать ещё два курса бесплатно.
Подготовиться к реальному продакшну
Представь, что у нейросети есть маленькое «окошко» (фильтр), например, размером 3x3 пикселя. Оно ползает по всей картинке и умножает свои веса на значения пикселей.
Зачем нужен этот процесс, вместо того чтобы подать все пиксели в обычную нейросеть?
Зачем нужен этот процесс, вместо того чтобы подать все пиксели в обычную нейросеть?
Anonymous Quiz
87%
Чтобы сохранить пространственную структуру и научиться находить паттерны
4%
Чтобы уменьшить яркость изображения и сэкономить видеопамять
4%
Чтобы превратить цветную картинку в черно-белую для упрощения расчетов
4%
Чтобы модель могла работать только с центральной частью кадра, игнорируя фон
📊 Промышленный DS: как пройти интервью на позицию AI-разработчика в 2026 году
Компании больше не ищут «исследователей», им нужны инженеры, способные запустить агентов в прод. В обновлённом курсе мы даём базу по измеримости, метрикам производительности и экономике моделей.
📚 Ключевые темы для подготовки:
— продвинутый
— инжиниринг: как выявлять регрессии и настраивать трассировку в реальных системах;
—
— управление ресурсами: детальный расчёт токенов и кэширования.
Забирайте материалы для предварительной подготовки сразу после оплаты и будьте на шаг впереди конкурентов.
⏳ Специальные условия до 28 февраля:
— введите промокод
— участвуйте в **акции «3 курса по цене 1» — выберите два любых курса в дополнение к основному.
👉 Получить доступ к курсу и подаркам
Компании больше не ищут «исследователей», им нужны инженеры, способные запустить агентов в прод. В обновлённом курсе мы даём базу по измеримости, метрикам производительности и экономике моделей.
📚 Ключевые темы для подготовки:
— продвинутый
RAG: методы оценки качества поиска и подготовки данных;— инжиниринг: как выявлять регрессии и настраивать трассировку в реальных системах;
—
LangGraph: управление сложными графами и механизмы human-in-the-loop;— управление ресурсами: детальный расчёт токенов и кэширования.
Забирайте материалы для предварительной подготовки сразу после оплаты и будьте на шаг впереди конкурентов.
⏳ Специальные условия до 28 февраля:
— введите промокод
Agent для получения скидки 10 000 рублей**; — участвуйте в **акции «3 курса по цене 1» — выберите два любых курса в дополнение к основному.
👉 Получить доступ к курсу и подаркам
В RL есть Агент (тот, кто учится), Среда (мир вокруг) и Награда (цель). Главная проблема Агента — это дилемма Exploration vs Exploitation.
В чем она заключается?
В чем она заключается?
Anonymous Quiz
1%
Нужно выбрать: обучать модель на GPU или на CPU
85%
Нужно выбрать: использовать уже известный путь или рискнуть и исследовать новые действия
9%
Нужно выбрать между скоростью обучения и точностью предсказаний
5%
Нужно решить, наказывать ли агента за медлительность или только за ошибки
❤2👍2🤩1
Любой сложный временной ряд (например, продажи мороженого) можно разложить на несколько составляющих. Как называется компонент, который отвечает за регулярные колебания данных в зависимости от времени года, дня недели или часа?
Anonymous Quiz
7%
Тренд (Trend)
16%
Цикличность (Cycle)
75%
Сезонность (Seasonality)
1%
Белый шум (White Noise)
👍2
В GNN используется механизм под названием Message Passing (передача сообщений). Представь, что ты хочешь предсказать, купит ли человек товар, зная только его друзей в соцсети.
Как нейронная сеть собирает информацию для конкретного узла на каждом слое?
Как нейронная сеть собирает информацию для конкретного узла на каждом слое?
Anonymous Quiz
1%
Она смотрит только на собственные признаки этого человека (возраст, пол)
15%
Она ищет похожих людей по всей базе данных, даже если они не связаны
83%
Она суммирует или усредняет информацию от всех соседних узлов, «впитывая» контекст окружения
2%
Она превращает связи в обычный текст и читает его как LLM
❤2