Библиотека собеса по Data Science | вопросы с собеседований

За год мы провели три потока курса по ИИ-агентам, а теперь запускаем масштабное обновление!

В новом, четвёртом потоке мы учли все пожелания студентов, добавили большой блок про AgentOps и сместили фокус с базовых концепций на суровый инжиниринг. Ответить на вопрос про архитектуру трансформеров на собесе легко, а вот выкатить ИИ-агента в прод, чтобы он не сливал бюджет — задача со звёздочкой.

В программе:

— практика с первого занятия: Jupyter-ноутбуки с автопроверкой;
— оркестрация в LangGraph: human-in-the-loop и механизм time-travel;
— продвинутый RAG для продакшена и парсинг сложных документов;
— контроль экономики агентов: маршрутизация и кеширование запросов;
— развёртывание локальных опенсорс-моделей с соблюдением 152-ФЗ.

В честь старта продаж действует спецпредложение: 3 курса по цене 1 (два дополнительных курса в подарок).

Доступ к материалам для предварительной подготовки откроется сразу после оплаты.

По промокоду Agent забирайте скидку 10 000 ₽ (89 000 ₽ вместо 99 000 ₽). Успейте занять место до 28 февраля!

👉 Присоединиться к четвёртому потоку и вывести пайплайны в прод

672 views15:01

Представь, что ты разрабатываешь систему беспилотного вождения. Тебе нужно научить машину реагировать на очень редкое и опасное событие — например, когда на дорогу в тумане внезапно выбегает лось.

Почему в этой ситуации синтетические данные лучше?

Anonymous Quiz

89%

Потому что мы можем сгенерировать 10 000 таких сценариев в симуляции

Потому что реальные лоси слишком быстро бегают, и их трудно сфотографировать

Потому что синтетические данные всегда занимают меньше места на диске

Потому что нейросети не могут учиться только на реальных фотографиях

225 voters689 views18:45

Библиотека собеса по Data Science | вопросы с собеседований

Когда ты задаешь вопрос нейросети, где-то в дата-центре работают тысячи процессоров. Ученые подсчитали углеродный след от обучения и эксплуатации моделей.

Как ты думаешь, что потребляет больше энергии в долгосрочной перспективе?

Anonymous Quiz

27%

Процесс обучения модели (Training) — один раз, но очень мощно

68%

Процесс использования модели пользователями (Inference) — миллионы маленьких запросов каждый день

Процесс написания кода программистами

Хранение кода модели на GitHub

❤1

244 voters686 views21:06

Библиотека собеса по Data Science | вопросы с собеседований

Последний шанс: 3 курса по цене 1 и запуск AI-агентов в продакшн

На собеседованиях дата-сайентистов всё больше вопросов про вывод LLM в продакшн. Как превратить «голую» модель в автономную мультиагентную систему с RAG, контролировать затраты на инференс и не нарушить 152-ФЗ?

Обновлённая программа делает упор на жёсткий ML-инжиниринг и вывод в прод. Вы научитесь строить ReAct-циклы, работать с LangGraph и AutoGen, внедрять продвинутый RAG, протоколы MCP и AgentOps. Все ключевые навыки в одном месте: измеримость систем, time-travel дебаггинг, управление браузером, human-in-the-loop и развёртывание в закрытых контурах.

Почему нельзя откладывать:

— масштабная акция «3 курса по цене 1» сгорает уже сегодня;
— промокод Agent на скидку 10 000 рублей действует последние часы;
— сразу после оформления открываются материалы для подготовки — начать учиться можно прямо сейчас.

Забронировать место на курсе и забрать бонусы до конца дня

701 views15:01

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты показываешь нейросети видео, где человек плачет, но при этом звучит веселая музыка и текст на экране говорит: «Я так счастлив!».

Как мультимодальная модель понимает, что это сарказм, а не просто ошибка?

Anonymous Quiz

Она анализирует только текст, так как он важнее всего

19%

Она переводит видео и аудио в текст и читает их по отдельности

79%

Она использует «сквозное внимание» в едином математическом пространстве

Нейросеть выбирает самый грустный элемент и игнорирует остальные

❤1

206 voters771 views17:50

Библиотека собеса по Data Science | вопросы с собеседований

В Трансформерах сложность Self-Attention растет квадратично относительно входной последовательности N. В новых моделях вроде Mamba используется State Space Models. Какое математическое свойство позволяет моделям Mamba достигать линейной сложности?

Anonymous Quiz

51%

Использование разреженного внимания (Sparse Attention)

19%

Применение рекуррентной формулировки (Recurrent Representation)

26%

Полный отказ от использования матриц весов и замена их на быстрые преобразования Фурье

Использование квантового распределения данных

👍1

197 voters807 views18:37

Библиотека собеса по Data Science | вопросы с собеседований

При обучении LLM инженеры часто сталкиваются с феноменом "Grokking". Это специфический режим обучения, который обычно наблюдается на алгоритмических задачах или модульной арифметике.

В чем заключается главная особенность феномена Grokking?

Anonymous Quiz

40%

Переобучение: 100% на обучении, 0% на новых. Потом тест резко становится идеальным.

23%

Мгновенное переобучение: за несколько итераций — 100%, тест падает до 0%.

18%

Модель ускоряет генерацию, оптимизируя градиентный спуск в собственных весах.

20%

Модель мгновенно забывает старые знания при смене домена (catastrophic forgetting).

❤1

205 voters798 views19:16

Библиотека собеса по Data Science | вопросы с собеседований

В основе диффузионных моделей лежит процесс превращения случайного шума в четкое изображение. Этот процесс называется обратной диффузией. На каждом шаге нейросеть выполняет одну операцию. Что предсказывает нейросеть на каждом шаге обратной диффузии?

Anonymous Quiz

20%

Конечный цвет каждого пикселя будущего изображения, который должен получиться в самом конце

Класс объекта (например, «собака» или «дерево»), чтобы заменить шум на текстуру этого объекта

70%

Шум, который был добавлен к изображению на данном этапе, чтобы его можно было математически вычесть

Векторную траекторию движения каждого атома в цифровом пространстве кадра

👍2❤1🤩1

172 voters741 views19:16

Библиотека собеса по Data Science | вопросы с собеседований

При разработке сложных AI-агентов часто используется техника ReAct. Она позволяет модели не просто выдавать ответ, а взаимодействовать с внешними инструментами.

В чем заключается главная особенность цикла работы агента по методу ReAct?

Anonymous Quiz

13%

Модель сначала генерирует сразу 10 вариантов ответа, а затем выбирает лучший с помощью голосования

Модель пишет код на языке C++, компилирует его и выполняет на сервере для получения результата

78%

Модель пишет рассуждения в текст, выбирает действие, получает результат от среды и повторяет цикл

Модель использует скрытые слои для предсказания того, что пользователь нажмет в следующую секунду

❤1

166 voters776 views18:48

Библиотека собеса по Data Science | вопросы с собеседований

This media is not supported in your browser

VIEW IN TELEGRAM

0:59

697 views15:55

Библиотека собеса по Data Science | вопросы с собеседований

👍

На курсе по контролируемой разработке AI-агентов мы будем разбирать ровно то, о чём говорит Владислав в голосовом, но уже в формате системной практики.

📅 Старт курса — 20 апреля.

Если хотите разобраться, как строить управляемые агентные системы:
➡️ Присоединяйтесь.

P.S. С первого занятия будет практика: код и разбор реальных ошибок, а не только теория.

Please open Telegram to view this post

VIEW IN TELEGRAM

688 views15:55

Библиотека собеса по Data Science | вопросы с собеседований

Когда мы дообучаем готовую нейросеть на новых данных, она часто начинает «забывать» то, чему училась раньше. Это катастрофическое забывание.

Какая из перечисленных техник является наиболее эффективной для борьбы с этим эффектом в Continual Learning?

Anonymous Quiz

56%

Elastic Weight Consolidation (EWC)

Learning Rate Maximization

👍1

160 voters730 views18:39

Библиотека собеса по Data Science | вопросы с собеседований

В оригинальной архитектуре Transformer (2017 год) использовались синусоидальные позиционные эмбеддинги. Однако современные модели (Llama, Mistral, PaLM) перешли на более продвинутую технологию — RoPE.

В чем заключается главное преимущество RoPE?

Anonymous Quiz

17%

RoPE удаляет информацию о позиции слов, заставляя модель ориентироваться только на смысл

76%

RoPE внедряет информацию о позиции путем вращения векторов в комплексной плоскости

RoPE сжимает текст в 2 раза, позволяя подавать в модель в два раза больше слов

Это слой, который передвигает нейроны в видеокару в зависимости от того, насколько длинный текст

172 voters724 views19:06

Библиотека собеса по Data Science | вопросы с собеседований

При дообучении модели с помощью учителей-людей используется важный промежуточный этап: создание Reward Model. Вместо того чтобы человек проверял ответ основной нейросети, обучается отдельная нейросеть-судья.

Как именно обучается эта модель?

Anonymous Quiz

10%

Ей показывают один идеальный ответ от эксперта, и она должна выучить его наизусть, чтобы сравнивать

78%

Ей показывают ответы на вопрос, и человек помечает, какой лучше. Модель предсказывает предпочтения

Она обучается искать грамматические ошибки в тексте; чем меньше ошибок, тем выше балл

Модель вознаграждения — это база данных из словаря «плохих слов», за которые она снижает баллы

❤1

164 voters744 views19:34

Библиотека собеса по Data Science | вопросы с собеседований

Исследователи из Anthropic обнаружили внутри модели миллионы features. Оказалось, что один и тот же нейрон может активироваться и на изображение кошки, и на код на языке Python. Это называется полисемантичностью.

Как ученые решили эту проблему?

Anonymous Quiz

14%

Они увеличили количество слоев в n раз, пока каждый нейрон не стал отвечать за что-то одно

34%

Они обучили доп. нейросеть, которая раскладывает сложные состояния модели на понятные признаки

43%

Они начали удалять случайные нейроны и смотреть, когда модель перестанет узнавать кошек

Они заставили модель саму описывать каждый свой нейрон словами

👍1

202 voters776 views18:51

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты просишь ИИ решить сложную математическую задачу. Обычная GPT-4o начинает отвечать мгновенно. Но модель с System 2 Thinking (медленным мышлением) берет паузу в 30 секунд.

Что именно делает нейросеть в эти 30 секунд «молчания»?

Anonymous Quiz

Она ждет, пока освободится очередь на сервере, чтобы не перегружать систему

Она ищет ответ в Google и копирует самый популярный вариант

94%

Она генерирует дерево возможных стратегий решения

Она переводит задачу на 50 языков, чтобы найти решение в учебниках

😁2🤩1

232 voters800 views19:40

Библиотека собеса по Data Science | вопросы с собеседований

⏳ Часовая готовность: создаём ИИ-агента в прямом эфире

В 19:00 МСК в рамках нашего курса «Разработка AI-агентов» стартует вебинар «ИИ-агенты в продакшене: от хайпа к деньгам». Спикер — Полина Полунина, руководитель AI-направления в Альфа-Банке.

Будет live-демо работающего агента, реальные метрики из корпоративной среды и честный разбор архитектурных граблей — без воды и «успешного успеха».

Всем зрителям эфира дадим эксклюзивный промокод AGENTS на скидку 10 000 ₽ на любой тариф курса.

👉 Занять место на вебинаре

758 views15:00

Библиотека собеса по Data Science | вопросы с собеседований

На вечеринке N человек, среди них может быть Знаменитость:
её знают все;
она никого не знает. Можно задавать только вопрос: «Вы знаете этого человека?» Сколько минимум вопросов нужно, чтобы гарантированно найти Знаменитость (если она есть)?

Anonymous Quiz

❤2👍2

234 voters732 views19:10

Библиотека собеса по Data Science | вопросы с собеседований

Вы работаете с данными в очень высокой размерности (например, эмбеддинги на 10 000 чисел). Вы замечаете, что k-NN начинает работать очень плохо: все точки кажутся почти одинаково удаленными друг от друга.
Как называется этот эффект в линейной алгебре?

Anonymous Quiz

Переобучение (Overfitting)

58%

Концентрация меры (Measure Concentration)

👍2🤩1

204 voters703 views10:55

Библиотека собеса по Data Science | вопросы с собеседований

В 2025-2026 годах стал популярным стандарт MCP (Model Context Protocol), упомянутый в роадмапе Логана Торнлоу.
В чем главная задача этого протокола?

Anonymous Quiz

Сжатие весов модели для запуска на смартфонах

86%

Унификация того, как ИИ-агенты подключаются к внешним инструментам независимо от провайдера модели

Замена архитектуры Transformer на более быструю

Шифрование личных данных пользователя перед отправкой в LLM

192 voters692 views12:36

Библиотека собеса по Data Science | вопросы с собеседований

Самый востребованный навык в ИТ в 2026-м — навык создания ИИ-агентов

Мы полностью переработали курс «Разработка AI-агентов» под реалии 2026 года. Никакой долгой теории — с самого начала пишем код. Обучать и делиться набитыми шишками будут эксперты-практики из Газпромбанка, Альфа-Банка и других бигтехов.

В программе:

— архитектура автономных систем с тестированием, ReAct-циклами и контролем токенов;
— практическая работа с актуальными фреймворками LangGraph, AutoGen, MCP и CrewAI;
— настройка продвинутого RAG для парсинга документов и точного поиска;
— внедрение решений с учётом действующего законодательства (152-ФЗ);
— дипломная работа, за основу которой можно взять свой рабочий проект или задачу, которую предложим мы.

Эксперты поделятся инсайтами из реального продакшна — тем, о чём вам никогда не расскажет ни одна нейросеть.

Запись первого открытого вебинара, на котором мы вместе с руководителем AI-направления в Альфа-Банке Полиной Полуниной пилили агента в прямом эфире.

Ах да, чуть не забыли! Дарим промокод AGENTSWEB на скидку 10 000 рублей и два курса сверху при покупке до 15 марта 🎁

→ Стать AI-инженером

725 views11:00

About

Blog

Apps

Platform