Библиотека собеса по Data Science | вопросы с собеседований

Любой сложный временной ряд (например, продажи мороженого) можно разложить на несколько составляющих. Как называется компонент, который отвечает за регулярные колебания данных в зависимости от времени года, дня недели или часа?

Anonymous Quiz

Тренд (Trend)

16%

Цикличность (Cycle)

75%

Сезонность (Seasonality)

Белый шум (White Noise)

👍2

269 voters803 views18:15

Библиотека собеса по Data Science | вопросы с собеседований

В GNN используется механизм под названием Message Passing (передача сообщений). Представь, что ты хочешь предсказать, купит ли человек товар, зная только его друзей в соцсети.

Как нейронная сеть собирает информацию для конкретного узла на каждом слое?

Anonymous Quiz

Она смотрит только на собственные признаки этого человека (возраст, пол)

15%

Она ищет похожих людей по всей базе данных, даже если они не связаны

83%

Она суммирует или усредняет информацию от всех соседних узлов, «впитывая» контекст окружения

Она превращает связи в обычный текст и читает его как LLM

❤2

170 voters780 views18:16

Библиотека собеса по Data Science | вопросы с собеседований

Чтобы нейросеть «влезла» в микрочип, её нужно сжать. Один из методов называется Квантование (Quantization).

Обычно веса нейросети — это дробные числа высокой точности (float32). В чём суть квантования при подготовке модели для Edge-устройства?

Anonymous Quiz

В замене некоторых весов на случайные числа для экономии места

93%

В переводе весов из 32-битных дробей в простые 8-битные целые числа

В удалении некоторых слоев нейросети, кроме первого и последнего

В превращении нейросети в текстовый файл

❤1

230 voters665 views19:18

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что банк обучил модель для выдачи кредитов. В данных за 30 лет мужчины чаще занимали руководящие посты и имели более высокие зарплаты. Модель это заметила и начала занижать кредитный рейтинг всем женщинам.

Как называется этот эффект?

Anonymous Quiz

Underfitting (Недообучение)

75%

Algorithmic Bias (Алгоритмическая предвзятость)

Data Integrity (Целостность данных)

20%

Overfitting (Переобучение)

😁6❤3🤩1

257 voters649 views18:23

Библиотека собеса по Data Science | вопросы с собеседований

За год мы провели три потока курса по ИИ-агентам, а теперь запускаем масштабное обновление!

В новом, четвёртом потоке мы учли все пожелания студентов, добавили большой блок про AgentOps и сместили фокус с базовых концепций на суровый инжиниринг. Ответить на вопрос про архитектуру трансформеров на собесе легко, а вот выкатить ИИ-агента в прод, чтобы он не сливал бюджет — задача со звёздочкой.

В программе:

— практика с первого занятия: Jupyter-ноутбуки с автопроверкой;
— оркестрация в LangGraph: human-in-the-loop и механизм time-travel;
— продвинутый RAG для продакшена и парсинг сложных документов;
— контроль экономики агентов: маршрутизация и кеширование запросов;
— развёртывание локальных опенсорс-моделей с соблюдением 152-ФЗ.

В честь старта продаж действует спецпредложение: 3 курса по цене 1 (два дополнительных курса в подарок).

Доступ к материалам для предварительной подготовки откроется сразу после оплаты.

По промокоду Agent забирайте скидку 10 000 ₽ (89 000 ₽ вместо 99 000 ₽). Успейте занять место до 28 февраля!

👉 Присоединиться к четвёртому потоку и вывести пайплайны в прод

672 views15:01

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты разрабатываешь систему беспилотного вождения. Тебе нужно научить машину реагировать на очень редкое и опасное событие — например, когда на дорогу в тумане внезапно выбегает лось.

Почему в этой ситуации синтетические данные лучше?

Anonymous Quiz

89%

Потому что мы можем сгенерировать 10 000 таких сценариев в симуляции

Потому что реальные лоси слишком быстро бегают, и их трудно сфотографировать

Потому что синтетические данные всегда занимают меньше места на диске

Потому что нейросети не могут учиться только на реальных фотографиях

225 voters689 views18:45

Библиотека собеса по Data Science | вопросы с собеседований

Когда ты задаешь вопрос нейросети, где-то в дата-центре работают тысячи процессоров. Ученые подсчитали углеродный след от обучения и эксплуатации моделей.

Как ты думаешь, что потребляет больше энергии в долгосрочной перспективе?

Anonymous Quiz

27%

Процесс обучения модели (Training) — один раз, но очень мощно

68%

Процесс использования модели пользователями (Inference) — миллионы маленьких запросов каждый день

Процесс написания кода программистами

Хранение кода модели на GitHub

❤1

244 voters686 views21:06

Библиотека собеса по Data Science | вопросы с собеседований

Последний шанс: 3 курса по цене 1 и запуск AI-агентов в продакшн

На собеседованиях дата-сайентистов всё больше вопросов про вывод LLM в продакшн. Как превратить «голую» модель в автономную мультиагентную систему с RAG, контролировать затраты на инференс и не нарушить 152-ФЗ?

Обновлённая программа делает упор на жёсткий ML-инжиниринг и вывод в прод. Вы научитесь строить ReAct-циклы, работать с LangGraph и AutoGen, внедрять продвинутый RAG, протоколы MCP и AgentOps. Все ключевые навыки в одном месте: измеримость систем, time-travel дебаггинг, управление браузером, human-in-the-loop и развёртывание в закрытых контурах.

Почему нельзя откладывать:

— масштабная акция «3 курса по цене 1» сгорает уже сегодня;
— промокод Agent на скидку 10 000 рублей действует последние часы;
— сразу после оформления открываются материалы для подготовки — начать учиться можно прямо сейчас.

Забронировать место на курсе и забрать бонусы до конца дня

701 views15:01

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты показываешь нейросети видео, где человек плачет, но при этом звучит веселая музыка и текст на экране говорит: «Я так счастлив!».

Как мультимодальная модель понимает, что это сарказм, а не просто ошибка?

Anonymous Quiz

Она анализирует только текст, так как он важнее всего

19%

Она переводит видео и аудио в текст и читает их по отдельности

79%

Она использует «сквозное внимание» в едином математическом пространстве

Нейросеть выбирает самый грустный элемент и игнорирует остальные

❤1

206 voters771 views17:50

Библиотека собеса по Data Science | вопросы с собеседований

В Трансформерах сложность Self-Attention растет квадратично относительно входной последовательности N. В новых моделях вроде Mamba используется State Space Models. Какое математическое свойство позволяет моделям Mamba достигать линейной сложности?

Anonymous Quiz

51%

Использование разреженного внимания (Sparse Attention)

19%

Применение рекуррентной формулировки (Recurrent Representation)

26%

Полный отказ от использования матриц весов и замена их на быстрые преобразования Фурье

Использование квантового распределения данных

👍1

197 voters807 views18:37

Библиотека собеса по Data Science | вопросы с собеседований

При обучении LLM инженеры часто сталкиваются с феноменом "Grokking". Это специфический режим обучения, который обычно наблюдается на алгоритмических задачах или модульной арифметике.

В чем заключается главная особенность феномена Grokking?

Anonymous Quiz

40%

Переобучение: 100% на обучении, 0% на новых. Потом тест резко становится идеальным.

23%

Мгновенное переобучение: за несколько итераций — 100%, тест падает до 0%.

18%

Модель ускоряет генерацию, оптимизируя градиентный спуск в собственных весах.

20%

Модель мгновенно забывает старые знания при смене домена (catastrophic forgetting).

❤1

205 voters798 views19:16

Библиотека собеса по Data Science | вопросы с собеседований

В основе диффузионных моделей лежит процесс превращения случайного шума в четкое изображение. Этот процесс называется обратной диффузией. На каждом шаге нейросеть выполняет одну операцию. Что предсказывает нейросеть на каждом шаге обратной диффузии?

Anonymous Quiz

20%

Конечный цвет каждого пикселя будущего изображения, который должен получиться в самом конце

Класс объекта (например, «собака» или «дерево»), чтобы заменить шум на текстуру этого объекта

70%

Шум, который был добавлен к изображению на данном этапе, чтобы его можно было математически вычесть

Векторную траекторию движения каждого атома в цифровом пространстве кадра

👍2❤1🤩1

172 voters742 views19:16

Библиотека собеса по Data Science | вопросы с собеседований

При разработке сложных AI-агентов часто используется техника ReAct. Она позволяет модели не просто выдавать ответ, а взаимодействовать с внешними инструментами.

В чем заключается главная особенность цикла работы агента по методу ReAct?

Anonymous Quiz

13%

Модель сначала генерирует сразу 10 вариантов ответа, а затем выбирает лучший с помощью голосования

Модель пишет код на языке C++, компилирует его и выполняет на сервере для получения результата

78%

Модель пишет рассуждения в текст, выбирает действие, получает результат от среды и повторяет цикл

Модель использует скрытые слои для предсказания того, что пользователь нажмет в следующую секунду

❤1

166 voters776 views18:48

Библиотека собеса по Data Science | вопросы с собеседований

This media is not supported in your browser

VIEW IN TELEGRAM

0:59

697 views15:55

Библиотека собеса по Data Science | вопросы с собеседований

👍

На курсе по контролируемой разработке AI-агентов мы будем разбирать ровно то, о чём говорит Владислав в голосовом, но уже в формате системной практики.

📅 Старт курса — 20 апреля.

Если хотите разобраться, как строить управляемые агентные системы:
➡️ Присоединяйтесь.

P.S. С первого занятия будет практика: код и разбор реальных ошибок, а не только теория.

Please open Telegram to view this post

VIEW IN TELEGRAM

688 views15:55

Библиотека собеса по Data Science | вопросы с собеседований

Когда мы дообучаем готовую нейросеть на новых данных, она часто начинает «забывать» то, чему училась раньше. Это катастрофическое забывание.

Какая из перечисленных техник является наиболее эффективной для борьбы с этим эффектом в Continual Learning?

Anonymous Quiz

56%

Elastic Weight Consolidation (EWC)

Learning Rate Maximization

👍1

160 voters730 views18:39

Библиотека собеса по Data Science | вопросы с собеседований

В оригинальной архитектуре Transformer (2017 год) использовались синусоидальные позиционные эмбеддинги. Однако современные модели (Llama, Mistral, PaLM) перешли на более продвинутую технологию — RoPE.

В чем заключается главное преимущество RoPE?

Anonymous Quiz

17%

RoPE удаляет информацию о позиции слов, заставляя модель ориентироваться только на смысл

76%

RoPE внедряет информацию о позиции путем вращения векторов в комплексной плоскости

RoPE сжимает текст в 2 раза, позволяя подавать в модель в два раза больше слов

Это слой, который передвигает нейроны в видеокару в зависимости от того, насколько длинный текст

172 voters724 views19:06

Библиотека собеса по Data Science | вопросы с собеседований

При дообучении модели с помощью учителей-людей используется важный промежуточный этап: создание Reward Model. Вместо того чтобы человек проверял ответ основной нейросети, обучается отдельная нейросеть-судья.

Как именно обучается эта модель?

Anonymous Quiz

10%

Ей показывают один идеальный ответ от эксперта, и она должна выучить его наизусть, чтобы сравнивать

78%

Ей показывают ответы на вопрос, и человек помечает, какой лучше. Модель предсказывает предпочтения

Она обучается искать грамматические ошибки в тексте; чем меньше ошибок, тем выше балл

Модель вознаграждения — это база данных из словаря «плохих слов», за которые она снижает баллы

❤1

164 voters744 views19:34

Библиотека собеса по Data Science | вопросы с собеседований

Исследователи из Anthropic обнаружили внутри модели миллионы features. Оказалось, что один и тот же нейрон может активироваться и на изображение кошки, и на код на языке Python. Это называется полисемантичностью.

Как ученые решили эту проблему?

Anonymous Quiz

14%

Они увеличили количество слоев в n раз, пока каждый нейрон не стал отвечать за что-то одно

34%

Они обучили доп. нейросеть, которая раскладывает сложные состояния модели на понятные признаки

43%

Они начали удалять случайные нейроны и смотреть, когда модель перестанет узнавать кошек

Они заставили модель саму описывать каждый свой нейрон словами

👍1

202 voters777 views18:51

Библиотека собеса по Data Science | вопросы с собеседований

Представь, что ты просишь ИИ решить сложную математическую задачу. Обычная GPT-4o начинает отвечать мгновенно. Но модель с System 2 Thinking (медленным мышлением) берет паузу в 30 секунд.

Что именно делает нейросеть в эти 30 секунд «молчания»?

Anonymous Quiz

Она ждет, пока освободится очередь на сервере, чтобы не перегружать систему

Она ищет ответ в Google и копирует самый популярный вариант

94%

Она генерирует дерево возможных стратегий решения

Она переводит задачу на 50 языков, чтобы найти решение в учебниках

😁2🤩1

232 voters802 views19:40

Библиотека собеса по Data Science | вопросы с собеседований

⏳ Часовая готовность: создаём ИИ-агента в прямом эфире

В 19:00 МСК в рамках нашего курса «Разработка AI-агентов» стартует вебинар «ИИ-агенты в продакшене: от хайпа к деньгам». Спикер — Полина Полунина, руководитель AI-направления в Альфа-Банке.

Будет live-демо работающего агента, реальные метрики из корпоративной среды и честный разбор архитектурных граблей — без воды и «успешного успеха».

Всем зрителям эфира дадим эксклюзивный промокод AGENTS на скидку 10 000 ₽ на любой тариф курса.

👉 Занять место на вебинаре

759 views15:00

About

Blog

Apps

Platform