BA & SA | 10000 Interview questions – Telegram

BA & SA | 10000 Interview questions

@SystemAnalystInterview

10.2K subscribers

172 photos

14 videos

342 links

Вопросы и задачи, которые задают на собеседованиях на позицию Бизнес и Системного аналитика. По вопросам сотрудничества- @DeliveryManager7

Download Telegram

About

Blog

Apps

Platform

BA & SA | 10000 Interview questions

10.2K subscribers

BA & SA | 10000 Interview questions

☀Объяснение:

Как работает асинхронная репликация
Мастер-сервер принимает транзакцию, подтверждает клиенту «успех» и потом отправляет изменения на реплику. Если мастер падает между подтверждением и отправкой, реплика не получает данные → потеря транзакций. Это допустимо в системах, где допустима микро-потеря (например, аналитика), но не в финансовых или критичных системах.

Синхронная репликация
Мастер отправляет данные на реплику, ждёт её подтверждения, и только после этого отвечает клиенту «успех». При падении мастера реплика уже имеет данные, и потери нет. Недостаток: задержка увеличивается, так как клиент ждёт ответа от реплики.
Пример из реальной жизни
В банковских системах (например, при переводе денег) используется синхронная репликация. В социальных сетях (лайки, просмотры) — асинхронная, так как пара потерянных лайков не критична.

Что должен зафиксировать аналитик
Допустимо ли RPO (Recovery Point Objective) больше нуля? Если нет — синхронная репликация.
Какая задержка допустима? Синхронная репликация медленнее.

Нужно ли распределение по географическим зонам? Тогда синхронная репликация может быть очень медленной.
Вывод: Для критичных к потере данных систем синхронная репликация обязательна. Аналитик должен указать это в требованиях к отказоустойчивости.

Please open Telegram to view this post

VIEW IN TELEGRAM

369 views10:02

BA & SA | 10000 Interview questions

№4842 категория вопросов: #INTEGRATION

331 views10:02

BA & SA | 10000 Interview questions

4842. Внешний API ограничивает 10 запросов в секунду. Ваше приложение шлёт 50 запросов в секунду и получает ошибки 429. Какая техника защиты должна быть реализована на стороне клиента?

Anonymous Quiz

Увеличить таймаут соединения

Внедрить token bucket или leaky bucket на клиенте, ограничивая исходящий поток

Увеличить количество потоков

Перестать использовать API

122 voters349 views10:02

BA & SA | 10000 Interview questions

☀Объяснение:

Что такое token bucket?
Это алгоритм, который контролирует скорость отправки запросов:
Корзина с токенами (например, 10 токенов).
Каждый запрос забирает 1 токен.
Корзина пополняется с заданной скоростью (например, 1 токен в 0.1 секунды).
Если токенов нет, запрос задерживается или отклоняется.

Leaky bucket — аналогичен, но ограничивает не пиковую скорость, а среднюю.

Почему это должен делать клиент?
Если клиент превышает лимиты API, он получит HTTP 429 («Too Many Requests») и может быть заблокирован. Клиент сам должен ограничивать свою нагрузку, чтобы не перегружать внешний сервис и не терять запросы.

Реальный пример
Twitter API ограничивает 300 запросов на 15 минут. Клиентские библиотеки (например, Tweepy) содержат встроенный token bucket. Без него приложение поймает 429 и упадёт.

Что должен зафиксировать аналитик
Требование: «На стороне клиента реализовать ограничение частоты запросов в соответствии со спецификацией API (token bucket)».
Параметры: максимальная скорость, размер корзины, стратегия при переполнении (блокировка, очередь).
Обработка ошибок 429: увеличение задержки (exponential backoff).

Вывод: Rate limiting — обязанность не только провайдера API, но и клиента. Аналитик должен включать это требование в спецификации интеграций.

Please open Telegram to view this post

VIEW IN TELEGRAM

403 views12:31

BA & SA | 10000 Interview questions

№4843 категория вопросов: #REQUIREMENTS

371 views05:31

BA & SA | 10000 Interview questions

4843. Заказчик: «Система должна импортировать Excel-файл». Аналитик передал задачу разработчику. Импорт сломался из-за файла в 2 ГБ. Что аналитик упустил?

Anonymous Quiz

Проверку формата файла

Брейкдаун на нефункциональные требования: максимальный размер, скорость, формат, обработка ошибок

Согласование с администратором

Проверку антивирусом

❤2

135 voters375 views05:31

BA & SA | 10000 Interview questions

☀Объяснение:

«Импортировать Excel» — функциональное требование, но без брейкдауна (декомпозиции) нельзя спроектировать решение. Аналитик обязан разбить на подвопросы:

Максимальный размер файла: 1 МБ или 2 ГБ? Это влияет на потоковую обработку (chunked) vs загрузка в память.
Форматы:

.xlsx

,

.xls

,

.csv

? Разные парсеры.
Скорость: импорт за 5 секунд или 5 минут?
Обработка ошибок: при неверной строке — откат всего импорта или пропуск с логом?
Многопоточность: можно ли обрабатывать несколько файлов параллельно?

Реальный кейс: Один аналитик не спросил про размер, разработчик загружал файл целиком в память. При 500 МБ сервер упал с OOM. Переделали на потоковый импорт.

Вывод: Любое общее требование должно быть разбито на проверяемые компоненты. Это ключевая техника системного анализа.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2

398 views08:33

BA & SA | 10000 Interview questions

№4844 категория вопросов: #INTEGRATION

352 views10:03

BA & SA | 10000 Interview questions

4844. Внешний сервис может присылать уведомления о событиях не мгновенно, а с задержкой до 5 минут. Какой способ получения событий обеспечит минимальную задержку?

Anonymous Quiz

Polling каждую секунду

Webhook (callback)

Очередь сообщений с периодическим чтением

Email-уведомления

117 voters368 views10:03

BA & SA | 10000 Interview questions

☀Объяснение:

Webhook — это механизм, при котором внешний сервис сам отправляет HTTP-запрос на ваш endpoint в момент наступления события. Задержка минимальна (секунды). Polling — ваша система постоянно опрашивает сервис «есть ли новости?». Если опрашивать часто, растёт нагрузка; если редко — растёт задержка. Очередь с периодическим чтением тоже вносит задержку. Email — ещё медленнее. В задаче дано: внешний сервис может задерживать отправку до 5 минут, но внутри этого окна webhook — самый быстрый способ.

Реальный пример: Платёжные системы (Stripe, PayPal) используют webhook для оповещения о статусе платежа. Ваш сервер получает уведомление через секунды после оплаты, а не через минуты при polling.

Вывод: Если внешний сервис поддерживает webhook, это лучший вариант для получения событий в реальном времени. Аналитик должен уметь сравнивать webhook и polling в требованиях к интеграции.

Please open Telegram to view this post

VIEW IN TELEGRAM

391 views12:31

BA & SA | 10000 Interview questions

В мае стало очевидно: digital снова штормит. AI-выдача давит классический трафик, воронки проседают, и выигрывают не самые опытные — а самые быстрые.

В такой момент решает не количество информации, а её качество.

Мы собрали папку тех, кто уже адаптируется, работает с цифрами и делится тем, что реально даёт результат.

Без шума. Только практика.
Если ты в маркетинге / digital / IT — это способ не выпасть из рынка.

Сохранить папку себе 📨

385 views13:05

BA & SA | 10000 Interview questions

№4845 категория вопросов: #DBMS

348 views14:02

BA & SA | 10000 Interview questions

4845. Проектируется каталог товаров, где у каждого товара разный набор атрибутов (телефоны: экран, память; книги: автор, издательство). Схема часто меняется. Какой тип БД предпочтителен?

Anonymous Quiz

Реляционная с EAV (сущность-атрибут-значение)

Документоориентированная NoSQL (MongoDB, Couchbase)

Графовая БД

Ключ-значение

104 voters366 views14:02

BA & SA | 10000 Interview questions

☀Объяснение:

В реляционной БД для товаров с разным набором атрибутов пришлось бы использовать либо много колонок с NULL (жестко и негибко), либо EAV-модель (таблица «сущность-атрибут-значение»). EAV приводит к сложным запросам с множеством JOIN, падению производительности и нечитаемости. Документоориентированные БД (MongoDB, Couchbase) хранят каждый товар как отдельный JSON-документ, где атрибуты просто поля документа. Схема гибкая, можно добавлять новые атрибуты без миграций. Это идеально для каталогов, CMS, лидов в CRM.

Реальный пример: Интернет-магазины электроники используют MongoDB для каталога, чтобы легко добавлять новые характеристики (например, «наличие eSIM») без изменения схемы.

Вывод: Аналитик должен различать случаи: когда схема стабильна и известна — подходит SQL, когда схема часто меняется или вариативна — NoSQL.

Please open Telegram to view this post

VIEW IN TELEGRAM

412 views15:30

BA & SA | 10000 Interview questions

№4846 категория вопросов: #REQUIREMENTS

380 views05:31

BA & SA | 10000 Interview questions

4846. Заказчик говорит: «Система должна обрабатывать заказы очень быстро». Аналитик записывает это в требования. На приёмке заказчик недоволен, потому что заказ обрабатывается 2 секунды, а он ожидал 0.5 секунды. Что нужно было сделать аналитику?

Anonymous Quiz

Передать требование архитектору

Уточнить и зафиксировать цифры: время отклика, процентиль, объём данных

Добавить в команду тестировщика производительности

Попросить заказчика подождать следующей версии

122 voters397 views05:31

BA & SA | 10000 Interview questions

☀Объяснение:

Слово «очень быстро» субъективно. Для одного заказчика 2 секунды — отлично, для другого — неприемлемо. Аналитик обязан перевести неопределённое пожелание в измеримые критерии. Например:

«95% запросов на создание заказа должны выполняться не более 500 мс при нагрузке 1000 RPS».

Без цифр разработчик ориентируется на свой опыт, тестировщик не может проверить, а на приёмке начинаются споры. Хороший аналитик задаёт уточняющие вопросы:

Какое максимальное время допустимо?
Какой процент запросов должен укладываться в это время (процентиль)?
При какой нагрузке?

Реальный кейс: В одном проекте «быстрая выгрузка отчёта» означала для заказчика 10 секунд, а разработчик сделал 2 минуты (думая, что это быстро). После внедрения конкретных цифр время сократили до 5 секунд, и заказчик принял работу.

Вывод: Любое расплывчатое требование о качестве (быстрота, надёжность, удобство) нужно превращать в числовые метрики. Это экономит часы споров и переделок.

Please open Telegram to view this post

VIEW IN TELEGRAM

387 views08:33

BA & SA | 10000 Interview questions

№4847 категория вопросов: #TESTING

342 views10:02

BA & SA | 10000 Interview questions

4847. Ежедневная ETL-выгрузка из CRM в DWH иногда дублирует строки из-за того, что загрузка прерывается и перезапускается. Какой механизм нужно добавить, чтобы избежать дублей даже при перезапуске?

Anonymous Quiz

Очищать таблицу перед каждой загрузкой

Использовать идемпотентную вставку (UPSERT / MERGE) с уникальным ключом

Сортировать строки перед вставкой

Увеличить таймаут соединения

91 voters339 views10:02

BA & SA | 10000 Interview questions

Вы ведь уже задумывались о заработке в Telegram…

Сохраняли посты.
Читали советы.
Откладывали «на потом».

И вроде бы интерес есть…
но до действий так и не доходит.

Мозг выбирает самое простое — ничего не делать

👉

https://t.me/addlist/BHoA9CZmCi5lM2Yy

Чтобы разорвать этот круг, не нужно сразу «делать идеально».
Достаточно просто дать себе понятную точку входа.

Мы собрали папку, где уже есть база:
— как расти в Telegram
— как привлекать людей
— как выстраивать систему
— как приходить к доходу

Подпишись и просто начни с малого
https://t.me/addlist/BHoA9CZmCi5lM2Yy

Иногда самое сложное — это первый шаг.

Записывайся в подборку

🫶

Please open Telegram to view this post

VIEW IN TELEGRAM

374 views10:09

BA & SA | 10000 Interview questions

☀Объяснение:

ETL-процессы часто прерываются: сетевой сбой, таймаут, рестарт кластера. Если загрузка не спроектирована идемпотентно, после перезапуска могут появиться дубликаты.

Решение – использовать

MERGE

(в PostgreSQL) или

INSERT ... ON CONFLICT DO UPDATE

(в SQLite, PostgreSQL), или

REPLACE

(MySQL). Уникальный составной ключ (например,

order_id + line_id

) гарантирует, что повторная вставка не создаст дубль, а обновит существующую строку или проигнорирует её.

Пример кода:
sql

INSERT INTO dwh_orders (order_id, amount, loaded_at)
VALUES (123, 1000, NOW())
ON CONFLICT (order_id) DO UPDATE SET
  amount = EXCLUDED.amount,
  loaded_at = EXCLUDED.loaded_at;

Почему это важно для аналитика?
В требованиях к интеграции данных нужно явно указывать: «Загрузка должна быть идемпотентной. Повторный запуск того же пакета не должен порождать дубликатов». Без этого после каждого сбоя оператору придётся вручную чистить таблицу.
Реальный кейс: В крупном ретейлере из-за отсутствия идемпотентности при ночном сбое накопилось 15% дублей заказов. Отчётность встала на неделю.

Please open Telegram to view this post

VIEW IN TELEGRAM

401 views12:33