BA & SA | 10000 Interview questions – Telegram

BA & SA | 10000 Interview questions

@SystemAnalystInterview

10.2K subscribers

172 photos

14 videos

342 links

Вопросы и задачи, которые задают на собеседованиях на позицию Бизнес и Системного аналитика. По вопросам сотрудничества- @DeliveryManager7

Download Telegram

About

Blog

Apps

Platform

BA & SA | 10000 Interview questions

10.2K subscribers

BA & SA | 10000 Interview questions

№4863 категория вопросов: #ARCHITECTURE

368 views05:30

BA & SA | 10000 Interview questions

4863. Распределённая система должна гарантировать, что все узлы видят одни и те же данные в любой момент времени и оставаться доступной даже при сбоях. При сетевом разделении система перестаёт принимать запись. Какую теорему иллюстрирует этот пример?

Anonymous Quiz

Теорема Геделя о неполноте

CAP-теорема Брюера

Закон Амдала о распараллеливании

Теорема Коуза о трансакционных издержках

96 voters381 views05:30

BA & SA | 10000 Interview questions

☀Объяснение:

Что такое CAP-теорема?

В 2000 году профессор Эрик Брюер сформулировал, что в распределённой системе (данные хранятся на нескольких узлах) невозможно одновременно гарантировать все три свойства:
Consistency (C) – строгая согласованность: после успешной записи все последующие чтения видят эту запись (нет устаревших данных).
Availability (A) – доступность: каждый запрос получает ответ (даже если часть узлов недоступна).

Partition tolerance (P) – устойчивость к сетевым разделениям: система продолжает работать, когда связь между узлами нарушена.
При сетевом разделении (например, кабель между дата-центрами оборван) система вынуждена выбирать между C и A.
Если выбираем CP (согласованность + устойчивость к разделениям), то при разделении блокируем запись, чтобы не нарушить согласованность. Доступность падает: некоторые запросы не получают ответа.
Если выбираем AP (доступность + устойчивость к разделениям), то разрешаем запись в каждый раздел независимо, но потом данные могут расходиться (согласованность нарушена).

Почему пример иллюстрирует CAP?
В задаче сказано: система должна быть строго согласованной и доступной. При сетевом разделении она перестаёт принимать запись. Это значит, что система жертвует доступностью для сохранения согласованности. То есть система выбрала CP. CAP-теорема объясняет, почему невозможно иметь и то, и другое одновременно.

Разбор других вариантов:
A (теорема Геделя) – о неполноте формальных систем, к распределённым БД не относится.
C (закон Амдала) – о максимальном ускорении при распараллеливании, не про согласованность.
D (теорема Коуза) – экономическая, о трансакционных издержках.

Реальный пример из практики:

Банковская система (CP) – при разделении между офисами временно запрещает списания, чтобы не возникло отрицательного баланса. Доступность снижена, но деньги в безопасности.

Социальная сеть (AP) – при разделении дата-центров вы всё равно можете поставить лайк (доступность), но счётчик лайков может временно расходиться (eventual consistency).

Что должен зафиксировать аналитик:
В требованиях к распределённой системе явно указать, что важнее: строгая согласованность или доступность.
Например: «В системе управления запасами товара допустима задержка репликации не более 5 секунд, но запись товара должна быть всегда доступна (AP)» или «Платёжная система должна быть строго согласованной (CP)».

Вывод: CAP-теорема – фундаментальное ограничение, которое аналитик обязан понимать при проектировании распределённых систем. Нельзя попросить «идеальную систему», нужно выбирать компромисс.

Please open Telegram to view this post

VIEW IN TELEGRAM

354 views08:30

BA & SA | 10000 Interview questions

№4864 категория вопросов: #BROKER

310 views10:03

BA & SA | 10000 Interview questions

4864. В очереди RabbitMQ сообщения поступают быстрее, чем потребитель успевает их обрабатывать. Со временем очередь растёт, задержка обработки увеличивается. Как называется эта проблема и как её решить?

Anonymous Quiz

Retry storm – увеличить количество реплик

Consumer lag – добавить параллельных потребителей или увеличить их количество

Deadlock – переключиться на синхронные вызовы

Split brain – использовать экспоненциальный бэккофф

99 voters326 views10:03

BA & SA | 10000 Interview questions

☀Объяснение:

Что такое consumer lag (отставание потребителя)?
Это разница между смещением последнего сообщения в очереди и смещением, которое уже обработал потребитель. Если сообщения приходят быстрее, чем обрабатываются, очередь растёт, и задержка доставки (латентность) увеличивается. Например, очередь растёт на 100 сообщений в секунду, через час в ней будет 360 000 необработанных сообщений, а новое сообщение будет ждать обработки часы.

Причины consumer lag:
Медленная бизнес-логика (тяжёлые запросы в БД, вызовы внешних API).
Недостаточное количество потребителей (один consumer на много партиций).
Сетевые задержки или блокировки.

Как решить:
Увеличить количество параллельных потребителей (в RabbitMQ – добавить экземпляры приложения, слушающие ту же очередь; в Kafka – увеличить число consumer’ов в группе, но не больше числа партиций).

Оптимизировать обработку – асинхронные вызовы, пакетная обработка (batch), распараллеливание внутри потребителя.
Использовать flow control – если потребитель не успевает, можно временно приостановить чтение.

Почему не другие варианты:
A (retry storm) – это проблема синхронных ретраев, а не медленного потребителя.
C (deadlock) – взаимоблокировка, не связано с очередью.
D (split brain) – проблема распределённых систем, когда два узла думают, что они лидеры.

Реальный кейс:
В системе логистики потребитель Kafka обрабатывал каждое сообщение (заказ) синхронно, вызывая внешний API доставки (среднее время 200 мс). При пике 5000 сообщений/сек очередь начала расти на 2000 сообщений/сек. Увеличили количество партиций с 1 до 10 и запустили 10 потребителей. Потребление выросло в 10 раз, и отставание прекратилось.

Что должен зафиксировать аналитик:
В требованиях к интеграции указать допустимый consumer lag (например, не более 10 000 сообщений).
Предусмотреть автоматическое масштабирование потребителей (Kubernetes HPA по длине очереди).
Мониторинг: алерт, если lag превышает порог.

Вывод: Consumer lag – главная метрика здоровья систем на основе очередей. Аналитик должен закладывать требования к пропускной способности и мониторингу отставания.

Please open Telegram to view this post

VIEW IN TELEGRAM

344 views12:35

BA & SA | 10000 Interview questions

№4865 категория вопросов: #REQUIREMENTS

324 views14:01

BA & SA | 10000 Interview questions

4865. Заказчик утвердил пороги скоринга (отказ < 50, проверка 50–70). Через месяц бизнес просит изменить пороги на 40 и 65. Изменение требует перевыпуска релиза. Что упустил аналитик?

Anonymous Quiz

Не провёл нагрузочное тестирование правил

Не предусмотрел внешнюю конфигурацию порогов

Не согласовал правила с юристами

Не зафиксировал логику в формальной спецификации

103 voters340 views14:01

BA & SA | 10000 Interview questions

☀Объяснение:

Почему это реальная проблема?
Бизнес-правила, особенно в скоринге или ценообразовании, со временем меняются. Если пороги (50 и 70 баллов) жёстко зашить в код, каждое изменение правила потребует нового релиза, тестирования и развертывания. Это медленно, дорого и рискованно.

Что должен был сделать аналитик:
Выделить варьируемые параметры – в данном случае пороги и, возможно, саму шкалу.
Требовать, чтобы эти параметры хранились во внешней конфигурации (файл, база данных, административная панель) и могли изменяться без перекомпиляции и передеплоя.
Зафиксировать в требованиях механизм динамической настройки – например, «система должна считывать пороги скоринга из таблицы БД при старте и периодически перечитывать их без остановки».

Почему не подходят другие варианты:
A (нагрузочное тестирование) – не связано с изменчивостью правил.
C (согласование с юристами) – полезно, но не решает проблему частых изменений.
D (формальная спецификация) – нужна, но без гибкости всё равно потребуется перекомпиляция.

Реальный кейс:
В одном банке кредитные пороги менялись раз в месяц. Они были закодированы в Java-классах. Каждый раз команда делала релиз (2 дня). После перехода на конфигурационный файл с автоматической перезагрузкой изменения стали занимать 10 минут.
Что должен зафиксировать аналитик (расширенное требование):

«Пороговые значения для принятия решения по скорингу должны быть вынесены во внешний конфигурационный файл или базу данных. Система должна перечитывать их без перезапуска при изменении. Интервал перечитывания – не более 5 минут. Изменение порогов не должно требовать остановки работы системы».

Дополнительные аспекты:
Аудит изменений – кто, когда и почему изменил порог.
Валидация новых порогов (например, нижний порог не может быть выше верхнего).
Возможность A/B-тестирования разных порогов в разных сегментах клиентов.

Вывод: Аналитик обязан выявлять параметры бизнес-правил, которые могут меняться со временем, и закладывать их во внешнюю конфигурацию. Это ускоряет внесение изменений и снижает стоимость доработок.

Please open Telegram to view this post

VIEW IN TELEGRAM

390 views15:34

BA & SA | 10000 Interview questions

№4866 категория вопросов: #UML

352 views05:35

BA & SA | 10000 Interview questions

4866. При вызове внешнего API мобильное приложение отправляет запрос и продолжает работу, а ответ приходит позже через callback. Как на диаграмме последовательности обозначить такой асинхронный вызов?

Anonymous Quiz

Сплошная стрелка с заполненным треугольником

Открытая стрелка (незаполненный треугольник)

Пунктирная стрелка с ромбом

Двойная сплошная стрелка

106 voters365 views05:35

BA & SA | 10000 Interview questions

☀Объяснение:

Нотация UML:
Синхронное сообщение – сплошная стрелка с заполненным треугольником (отправитель ждёт ответа).

Асинхронное сообщение – открытая стрелка (незаполненный треугольник). Отправитель не блокируется.
Ответ (callback) изображается отдельным асинхронным сообщением в обратном направлении (или сплошной стрелкой, если это возврат управления).

Реальный пример: Приложение отправляет запрос на оплату в платёжный шлюз и продолжает показывать анимацию. Через некоторое время шлюз присылает результат на webhook – это отдельное асинхронное сообщение.

Ошибка: Если нарисовать синхронную стрелку, подразумевается блокировка, что не соответствует реальности.

Вывод: Аналитик, моделируя интеграции, должен различать синхронные и асинхронные вызовы на диаграммах последовательности.

Please open Telegram to view this post

VIEW IN TELEGRAM

349 views08:31

BA & SA | 10000 Interview questions

This media is not supported in your browser

VIEW IN TELEGRAM

Хочешь зарабатывать в Telegram, но канал стоит на месте?

Скорее всего, ты просто делаешь всё «наугад».

❌ системы.
❌ понимания.
❌ результата.

Мне постоянно пишут:

✅«Почему не идут подписчики?»
✅«Почему нет продаж?»
✅«Что я делаю не так?»

Ответ почти всегда один — у тебя нет базы.

Не хватает понимания маркетинга, продвижения и логики заработка в Telegram.

И именно поэтому я собрала папку, где уже есть всё необходимое:

— как расти в Telegram
— где брать трафик
— как превращать подписчиков в деньги
— как выстроить систему, а не надеяться на «повезёт»

Ссылка: https://t.me/addlist/sieqVFdCuh5iZWIy

Записывайся в подборку

🫶

Please open Telegram to view this post

VIEW IN TELEGRAM

323 views09:33

BA & SA | 10000 Interview questions

№4867 категория вопросов: #DBMS

290 views10:03

BA & SA | 10000 Interview questions

4867. В таблице orders есть колонка order_number с последовательными числами, но некоторые номера пропущены (например, из-за отката транзакций). Как найти все пропущенные номера без циклов?

Anonymous Quiz

Использовать оконную функцию LAG() и найти разрывы

Сделать LEFT JOIN с таблицей всех возможных чисел

Применить GROUP BY и HAVING COUNT(*) = 0

Использовать NOT EXISTS с подзапросом на соседние номера

93 voters304 views10:03

BA & SA | 10000 Interview questions

☀Объяснение:

Оконная функция LAG() позволяет получить предыдущее значение в отсортированном наборе. Если

order_number - LAG(order_number) > 1

, значит есть пропуск между предыдущим и текущим номером.
Пример запроса:
sql

WITH gaps AS (
    SELECT 
        LAG(order_number) OVER (ORDER BY order_number) AS prev_num,
        order_number AS curr_num
    FROM orders
)
SELECT (prev_num + 1) AS missing_start, (curr_num - 1) AS missing_end
FROM gaps
WHERE curr_num - prev_num > 1;

Почему другие варианты хуже:

B (LEFT JOIN с таблицей всех чисел) – требует генерации последовательности, что при больших диапазонах неэффективно.
C (GROUP BY) – не может найти пропуски без генерации всех значений.
D (NOT EXISTS) – потребует для каждого номера подзапрос, что медленно.

Реальный кейс: В интернет-магазине из-за ошибок в интеграции номера заказов иногда пропускались. Аналитик написал запрос с

LAG()

и за 0.1 секунды нашёл все разрывы в таблице из 10 млн записей.

Вывод:

LAG()

– оптимальный инструмент для поиска пропусков в последовательностях без генерации вспомогательных таблиц.

Please open Telegram to view this post

VIEW IN TELEGRAM

355 views12:32

BA & SA | 10000 Interview questions

№4868 категория вопросов: #SYSTEMDESIGN

331 views14:01

BA & SA | 10000 Interview questions

4868. Пользователь авторизовался на сайте и начал заполнять корзину. На следующем шаге его запрос попал на другой сервер, и корзина «обнулилась». Как называется механизм, обеспечивающий попадание всех запросов одного пользователя на один сервер?

Anonymous Quiz

Сессионная аффинность (sticky sessions)

Циклический алгоритм (round robin)

Алгоритм наименьших соединений (least connections)

Хеширование IP-адреса (IP hash)

93 voters333 views14:01

BA & SA | 10000 Interview questions

☀Объяснение:

Когда за сайтом стоит несколько серверов (кластер), балансировщик распределяет запросы между ними. Если балансировщик отправляет каждый запрос на случайный сервер (round robin), то данные сессии (корзина, авторизация) могут храниться на одном сервере, а следующий запрос попадёт на другой, где этих данных нет. Пользователь «теряет» корзину или его выкидывает из системы.

Что такое sticky sessions (сессионная аффинность)?
Балансировщик «привязывает» пользователя к определённому серверу на время его сессии. Обычно это делается:
По IP-адресу (не очень надёжно, так как несколько пользователей могут быть за одним NAT).
По cookie, которую балансировщик устанавливает клиенту (более надёжно).
Все последующие запросы этого пользователя направляются на тот же сервер, где хранятся его сессионные данные.

Почему не подходят другие варианты:
B (round robin) – как раз вызывает проблему, так как запросы распределяются по очереди без учёта сессии.
C (least connections) – направляет запрос на сервер с наименьшим числом активных соединений, тоже не учитывает сессию.
D (IP hash) – один из способов реализации sticky sessions, но это не общее название механизма, а частная техника. Правильным ответом является именно термин «sticky sessions» (сессионная аффинность).

Реальный пример:
В интернет-магазине на платформе Magento с несколькими бэкенд-серверами не настроили sticky sessions. Пользователи жаловались, что корзина очищается при переходе на страницу оформления заказа. После включения sticky sessions на балансировщике (HAProxy) проблема исчезла.

Что должен зафиксировать аналитик:
В требованиях к отказоустойчивости и масштабированию указать необходимость поддержки сессионной аффинности.
Уточнить, где хранить сессии (в памяти сервера, в Redis, в БД).
Если используется Redis для централизованного хранения сессий, sticky sessions не нужны, но требуется надёжный Redis-кластер.

Вывод: Sticky sessions — простой способ решить проблему «потери» сессии при масштабировании, но он создаёт свою проблему: при отказе сервера пользователь теряет сессию. Более современный подход — централизованное хранилище сессий (Redis) и отказ от липких сессий. Аналитик должен понимать оба варианта и выбирать под требования.

Please open Telegram to view this post

VIEW IN TELEGRAM

367 views15:35

BA & SA | 10000 Interview questions

№4869 категория вопросов: #ARCHITECTURE

326 views05:31

BA & SA | 10000 Interview questions

4869. В приложении онлайн-кинотеатра при падении сервиса рекомендаций пользователь не может смотреть фильм, так как запрос на получение рекомендаций блокирует загрузку плеера. Какой принцип архитектуры был нарушен?

Anonymous Quiz

Горизонтальное масштабирование

Отказоустойчивость с сохранением основной функции

Событийная архитектура

Изоляция данных

93 voters341 views05:31