Библиотека собеса по Data Science | вопросы с собеседований
4.39K subscribers
493 photos
14 videos
1 file
615 links
Вопросы с собеседований по Data Science и ответы на них.

По рекламе: @proglib_adv

Учиться у нас: https://proglib.io/w/7dfb7235

Для обратной связи: @proglibrary_feeedback_bot

Наши каналы: https://t.me/proglibrary/9197
Download Telegram
За год мы провели три потока курса по ИИ-агентам, а теперь запускаем масштабное обновление!

В новом, четвёртом потоке мы учли все пожелания студентов, добавили большой блок про AgentOps и сместили фокус с базовых концепций на суровый инжиниринг. Ответить на вопрос про архитектуру трансформеров на собесе легко, а вот выкатить ИИ-агента в прод, чтобы он не сливал бюджет — задача со звёздочкой.

В программе:

— практика с первого занятия: Jupyter-ноутбуки с автопроверкой;
— оркестрация в LangGraph: human-in-the-loop и механизм time-travel;
— продвинутый RAG для продакшена и парсинг сложных документов;
— контроль экономики агентов: маршрутизация и кеширование запросов;
— развёртывание локальных опенсорс-моделей с соблюдением 152-ФЗ.

В честь старта продаж действует спецпредложение: 3 курса по цене 1 (два дополнительных курса в подарок).

Доступ к материалам для предварительной подготовки откроется сразу после оплаты.

По промокоду Agent забирайте скидку 10 000 ₽ (89 000 ₽ вместо 99 000 ₽). Успейте занять место до 28 февраля!

👉 Присоединиться к четвёртому потоку и вывести пайплайны в прод
Представь, что ты разрабатываешь систему беспилотного вождения. Тебе нужно научить машину реагировать на очень редкое и опасное событие — например, когда на дорогу в тумане внезапно выбегает лось.

Почему в этой ситуации синтетические данные лучше?
Anonymous Quiz
89%
Потому что мы можем сгенерировать 10 000 таких сценариев в симуляции
8%
Потому что реальные лоси слишком быстро бегают, и их трудно сфотографировать
1%
Потому что синтетические данные всегда занимают меньше места на диске
2%
Потому что нейросети не могут учиться только на реальных фотографиях
Когда ты задаешь вопрос нейросети, где-то в дата-центре работают тысячи процессоров. Ученые подсчитали углеродный след от обучения и эксплуатации моделей.

Как ты думаешь, что потребляет больше энергии в долгосрочной перспективе?
Anonymous Quiz
27%
Процесс обучения модели (Training) — один раз, но очень мощно
68%
Процесс использования модели пользователями (Inference) — миллионы маленьких запросов каждый день
2%
Процесс написания кода программистами
2%
Хранение кода модели на GitHub
1
Последний шанс: 3 курса по цене 1 и запуск AI-агентов в продакшн

На собеседованиях дата-сайентистов всё больше вопросов про вывод LLM в продакшн. Как превратить «голую» модель в автономную мультиагентную систему с RAG, контролировать затраты на инференс и не нарушить 152-ФЗ?

Обновлённая программа делает упор на жёсткий ML-инжиниринг и вывод в прод. Вы научитесь строить ReAct-циклы, работать с LangGraph и AutoGen, внедрять продвинутый RAG, протоколы MCP и AgentOps. Все ключевые навыки в одном месте: измеримость систем, time-travel дебаггинг, управление браузером, human-in-the-loop и развёртывание в закрытых контурах.

Почему нельзя откладывать:

— масштабная акция «3 курса по цене 1» сгорает уже сегодня;
— промокод Agent на скидку 10 000 рублей действует последние часы;
— сразу после оформления открываются материалы для подготовки — начать учиться можно прямо сейчас.

Забронировать место на курсе и забрать бонусы до конца дня
Представь, что ты показываешь нейросети видео, где человек плачет, но при этом звучит веселая музыка и текст на экране говорит: «Я так счастлив!».

Как мультимодальная модель понимает, что это сарказм, а не просто ошибка?
Anonymous Quiz
1%
Она анализирует только текст, так как он важнее всего
19%
Она переводит видео и аудио в текст и читает их по отдельности
79%
Она использует «сквозное внимание» в едином математическом пространстве
0%
Нейросеть выбирает самый грустный элемент и игнорирует остальные
1
В Трансформерах сложность Self-Attention растет квадратично относительно входной последовательности N. В новых моделях вроде Mamba используется State Space Models. Какое математическое свойство позволяет моделям Mamba достигать линейной сложности?
Anonymous Quiz
51%
Использование разреженного внимания (Sparse Attention)
19%
Применение рекуррентной формулировки (Recurrent Representation)
26%
Полный отказ от использования матриц весов и замена их на быстрые преобразования Фурье
4%
Использование квантового распределения данных
👍1
При обучении LLM инженеры часто сталкиваются с феноменом "Grokking". Это специфический режим обучения, который обычно наблюдается на алгоритмических задачах или модульной арифметике.

В чем заключается главная особенность феномена Grokking?
Anonymous Quiz
40%
Переобучение: 100% на обучении, 0% на новых. Потом тест резко становится идеальным.
23%
Мгновенное переобучение: за несколько итераций — 100%, тест падает до 0%.
18%
Модель ускоряет генерацию, оптимизируя градиентный спуск в собственных весах.
20%
Модель мгновенно забывает старые знания при смене домена (catastrophic forgetting).
1
👍 На курсе по контролируемой разработке AI-агентов мы будем разбирать ровно то, о чём говорит Владислав в голосовом, но уже в формате системной практики.

📅 Старт курса — 20 апреля.

Если хотите разобраться, как строить управляемые агентные системы:
➡️ Присоединяйтесь.

P.S. С первого занятия будет практика: код и разбор реальных ошибок, а не только теория.
Please open Telegram to view this post
VIEW IN TELEGRAM
Когда мы дообучаем готовую нейросеть на новых данных, она часто начинает «забывать» то, чему училась раньше. Это катастрофическое забывание.

Какая из перечисленных техник является наиболее эффективной для борьбы с этим эффектом в Continual Learning?
Anonymous Quiz
56%
Elastic Weight Consolidation (EWC)
24%
Data Shuffling
13%
Weight Pruning
8%
Learning Rate Maximization
👍1
Представь, что ты просишь ИИ решить сложную математическую задачу. Обычная GPT-4o начинает отвечать мгновенно. Но модель с System 2 Thinking (медленным мышлением) берет паузу в 30 секунд.

Что именно делает нейросеть в эти 30 секунд «молчания»?
Anonymous Quiz
2%
Она ждет, пока освободится очередь на сервере, чтобы не перегружать систему
1%
Она ищет ответ в Google и копирует самый популярный вариант
94%
Она генерирует дерево возможных стратегий решения
2%
Она переводит задачу на 50 языков, чтобы найти решение в учебниках
😁2🤩1
Часовая готовность: создаём ИИ-агента в прямом эфире

В 19:00 МСК в рамках нашего курса «Разработка AI-агентов» стартует вебинар «ИИ-агенты в продакшене: от хайпа к деньгам». Спикер — Полина Полунина, руководитель AI-направления в Альфа-Банке.

Будет live-демо работающего агента, реальные метрики из корпоративной среды и честный разбор архитектурных граблей — без воды и «успешного успеха».

Всем зрителям эфира дадим эксклюзивный промокод AGENTS на скидку 10 000 ₽ на любой тариф курса.

👉 Занять место на вебинаре
На вечеринке N человек, среди них может быть Знаменитость:
её знают все;
она никого не знает. Можно задавать только вопрос: «Вы знаете этого человека?» Сколько минимум вопросов нужно, чтобы гарантированно найти Знаменитость (если она есть)?
Anonymous Quiz
21%
O(N^2)
26%
O(NlogN)
41%
O(N)
12%
O(1)
2👍2
Вы работаете с данными в очень высокой размерности (например, эмбеддинги на 10 000 чисел). Вы замечаете, что k-NN начинает работать очень плохо: все точки кажутся почти одинаково удаленными друг от друга.
Как называется этот эффект в линейной алгебре?
Anonymous Quiz
4%
Переобучение (Overfitting)
58%
Концентрация меры (Measure Concentration)
27%
Мультиколлинеарность
11%
Исчезающий градиент
👍2🤩1
Самый востребованный навык в ИТ в 2026-м — навык создания ИИ-агентов

Мы полностью переработали курс «Разработка AI-агентов» под реалии 2026 года. Никакой долгой теории — с самого начала пишем код. Обучать и делиться набитыми шишками будут эксперты-практики из Газпромбанка, Альфа-Банка и других бигтехов.

В программе:

— архитектура автономных систем с тестированием, ReAct-циклами и контролем токенов;
— практическая работа с актуальными фреймворками LangGraph, AutoGen, MCP и CrewAI;
— настройка продвинутого RAG для парсинга документов и точного поиска;
— внедрение решений с учётом действующего законодательства (152-ФЗ);
— дипломная работа, за основу которой можно взять свой рабочий проект или задачу, которую предложим мы.

Эксперты поделятся инсайтами из реального продакшна — тем, о чём вам никогда не расскажет ни одна нейросеть.

Запись первого открытого вебинара, на котором мы вместе с руководителем AI-направления в Альфа-Банке Полиной Полуниной пилили агента в прямом эфире.


Ах да, чуть не забыли! Дарим промокод AGENTSWEB на скидку 10 000 рублей и два курса сверху при покупке до 15 марта 🎁

Стать AI-инженером