BA & SA | 10000 Interview questions
10.2K subscribers
172 photos
14 videos
342 links
Вопросы и задачи, которые задают на собеседованиях на позицию Бизнес и Системного аналитика. По вопросам сотрудничества- @DeliveryManager7
Download Telegram
В мае стало очевидно: digital снова штормит. AI-выдача давит классический трафик, воронки проседают, и выигрывают не самые опытные — а самые быстрые.

В такой момент решает не количество информации, а её качество.

Мы собрали папку тех, кто уже адаптируется, работает с цифрами и делится тем, что реально даёт результат.

Без шума. Только практика.
Если ты в маркетинге / digital / IT — это способ не выпасть из рынка.

Сохранить папку себе 📨
№4845 категория вопросов: #DBMS
4845. Проектируется каталог товаров, где у каждого товара разный набор атрибутов (телефоны: экран, память; книги: автор, издательство). Схема часто меняется. Какой тип БД предпочтителен?
Anonymous Quiz
24%
Реляционная с EAV (сущность-атрибут-значение)
62%
Документоориентированная NoSQL (MongoDB, Couchbase)
1%
Графовая БД
13%
Ключ-значение
Объяснение:

В реляционной БД для товаров с разным набором атрибутов пришлось бы использовать либо много колонок с NULL (жестко и негибко), либо EAV-модель (таблица «сущность-атрибут-значение»). EAV приводит к сложным запросам с множеством JOIN, падению производительности и нечитаемости. Документоориентированные БД (MongoDB, Couchbase) хранят каждый товар как отдельный JSON-документ, где атрибуты просто поля документа. Схема гибкая, можно добавлять новые атрибуты без миграций. Это идеально для каталогов, CMS, лидов в CRM.

Реальный пример: Интернет-магазины электроники используют MongoDB для каталога, чтобы легко добавлять новые характеристики (например, «наличие eSIM») без изменения схемы.

Вывод: Аналитик должен различать случаи: когда схема стабильна и известна — подходит SQL, когда схема часто меняется или вариативна — NoSQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
№4846 категория вопросов: #REQUIREMENTS
4846. Заказчик говорит: «Система должна обрабатывать заказы очень быстро». Аналитик записывает это в требования. На приёмке заказчик недоволен, потому что заказ обрабатывается 2 секунды, а он ожидал 0.5 секунды. Что нужно было сделать аналитику?
Anonymous Quiz
0%
Передать требование архитектору
98%
Уточнить и зафиксировать цифры: время отклика, процентиль, объём данных
2%
Добавить в команду тестировщика производительности
0%
Попросить заказчика подождать следующей версии
Объяснение:

Слово «очень быстро» субъективно. Для одного заказчика 2 секунды — отлично, для другого — неприемлемо. Аналитик обязан перевести неопределённое пожелание в измеримые критерии. Например:
«95% запросов на создание заказа должны выполняться не более 500 мс при нагрузке 1000 RPS».

Без цифр разработчик ориентируется на свой опыт, тестировщик не может проверить, а на приёмке начинаются споры. Хороший аналитик задаёт уточняющие вопросы:

Какое максимальное время допустимо?
Какой процент запросов должен укладываться в это время (процентиль)?
При какой нагрузке?

Реальный кейс: В одном проекте «быстрая выгрузка отчёта» означала для заказчика 10 секунд, а разработчик сделал 2 минуты (думая, что это быстро). После внедрения конкретных цифр время сократили до 5 секунд, и заказчик принял работу.

Вывод: Любое расплывчатое требование о качестве (быстрота, надёжность, удобство) нужно превращать в числовые метрики. Это экономит часы споров и переделок.
Please open Telegram to view this post
VIEW IN TELEGRAM
№4847 категория вопросов: #TESTING
4847. Ежедневная ETL-выгрузка из CRM в DWH иногда дублирует строки из-за того, что загрузка прерывается и перезапускается. Какой механизм нужно добавить, чтобы избежать дублей даже при перезапуске?
Anonymous Quiz
2%
Очищать таблицу перед каждой загрузкой
98%
Использовать идемпотентную вставку (UPSERT / MERGE) с уникальным ключом
0%
Сортировать строки перед вставкой
0%
Увеличить таймаут соединения
Вы ведь уже задумывались о заработке в Telegram…

Сохраняли посты.
Читали советы.
Откладывали «на потом».

И вроде бы интерес есть…
но до действий так и не доходит.


Мозг выбирает самое простое — ничего не делать 👉 https://t.me/addlist/BHoA9CZmCi5lM2Yy

Чтобы разорвать этот круг, не нужно сразу «делать идеально».
Достаточно просто дать себе понятную точку входа.

Мы собрали папку, где уже есть база:
— как расти в Telegram
— как привлекать людей
— как выстраивать систему
— как приходить к доходу

Подпишись и просто начни с малого
https://t.me/addlist/BHoA9CZmCi5lM2Yy

Иногда самое сложное — это первый шаг.

Записывайся в подборку🫶
Please open Telegram to view this post
VIEW IN TELEGRAM
Объяснение:

ETL-процессы часто прерываются: сетевой сбой, таймаут, рестарт кластера. Если загрузка не спроектирована идемпотентно, после перезапуска могут появиться дубликаты.

Решение – использовать 
MERGE (в PostgreSQL) или INSERT ... ON CONFLICT DO UPDATE (в SQLite, PostgreSQL), или REPLACE (MySQL). Уникальный составной ключ (например, order_id + line_id) гарантирует, что повторная вставка не создаст дубль, а обновит существующую строку или проигнорирует её.

Пример кода:
sql
INSERT INTO dwh_orders (order_id, amount, loaded_at)
VALUES (123, 1000, NOW())
ON CONFLICT (order_id) DO UPDATE SET
amount = EXCLUDED.amount,
loaded_at = EXCLUDED.loaded_at;

Почему это важно для аналитика?
В требованиях к интеграции данных нужно явно указывать: «Загрузка должна быть идемпотентной. Повторный запуск того же пакета не должен порождать дубликатов». Без этого после каждого сбоя оператору придётся вручную чистить таблицу.
Реальный кейс: В крупном ретейлере из-за отсутствия идемпотентности при ночном сбое накопилось 15% дублей заказов. Отчётность встала на неделю.
Please open Telegram to view this post
VIEW IN TELEGRAM
№4848 категория вопросов: #REQUIREMENTS
Объяснение:

Функциональные требования описывают что система делает (например, «пользователь может посмотреть баланс»). Нефункциональные требования (NFR) описывают как система это делает (быстро, безопасно, надёжно).
«Открываться за 2 секунды» — это атрибут качества производительности. Это требование не меняет логику работы, а лишь накладывает ограничение на скорость.

Почему это важно?
NFR часто забывают или фиксируют в конце, а потом система работает медленно. Аналитик должен собирать такие требования наравне с функциональными.

Реальный кейс: В одном проекте забыли записать требование к производительности для поиска, и на проде поиск работал 30 секунд. Исправление стоило перепроектирования индексов и кэшей.
Please open Telegram to view this post
VIEW IN TELEGRAM
№4849 категория вопросов: #BROKER
4849. В системе логов используется Kafka. При отключении электричества на сервере с брокером часть последних сообщений теряется. Какая настройка предотвратит потерю данных при внезапном отключении?
Anonymous Quiz
2%
Увеличить количество партиций
93%
Включить персистентность (log.flush.interval.messages=1, flush на диск перед подтверждением)
0%
Уменьшить replication factor
6%
Использовать автоматический коммит
Объяснение:

По умолчанию Kafka сбрасывает данные на диск не сразу, а через интервал (чтобы повысить производительность). При внезапном отключении питания данные, ещё находящиеся в кэше ОС, теряются. Настройка flush.messages=1 заставляет Kafka сбрасывать каждое сообщение на диск перед тем, как подтвердить продюсеру. Недостаток: падает производительность записи.

Альтернатива: использовать репликацию с 
acks=all и min.insync.replicas=2, но при падении всех брокеров данные могут потеряться, если не сброшены на диск.

Реальный пример: В системе финансового мониторинга настроили персистентность Kafka, и даже при аварийном отключении не потеряли ни одного события.

Что должен зафиксировать аналитик:
Требование к durability (гарантия сохранности) — допускается ли потеря сообщений?
Для критичных логов — обязательная синхронная запись на диск.
Please open Telegram to view this post
VIEW IN TELEGRAM
№4850 категория вопросов: #TESTING
4850. Перед сдачей отчёта в прод аналитик проверил: отчёт открывается, фильтры работают, цифры совпадают с бэкендом. В проде обнаружилось, что при печати отчёта съезжают колонки. Какого теста не хватало в чек-листе аналитика?
Anonymous Quiz
0%
Тестирование безопасности
5%
Тестирование производительности
95%
Тестирование кросс-браузерности и печатных форм (cross-browser, print layout)
0%
Нагрузочное тестирование
Объяснение:

Аналитик проверял функциональность и корректность данных, но упустил, что отчёты могут печататься или экспортироваться в PDF. Печатные формы часто имеют отдельные CSS-стили, которые могут ломаться в разных браузерах.

Что нужно добавить в чек-лист:
Открыть отчёт в Chrome и Firefox, сравнить внешний вид.
Распечатать на PDF (Ctrl+P) и проверить, что все колонки на месте, нет разрывов.
Проверить альбомную/портретную ориентацию.

Реальный кейс: В бухгалтерской системе отлично работал интерфейс, но при печати счета колонки смещались, и клиенты не могли разобрать суммы. Аналитик добавил в чек-лист пункт «печатная форма», и проблема больше не возникала.

Вывод: Аналитик должен включать в приёмочные тесты не только GUI и API, но и вторичные сценарии (печать, экспорт, мобильная вёрстка).
Please open Telegram to view this post
VIEW IN TELEGRAM
№4851 категория вопросов: #BPMN