BA & SA | 10000 Interview questions

4615. Паттерн «Сага» используется для решения проблемы...

Anonymous Quiz

Кэширования результатов запросов к нескольким сервисам.

80%

Обеспечения согласованности данных в распределенной бизнес-транзакции.

Шифрования сообщений при передаче между сервисами.

16%

Балансировки нагрузки на один сервис с помощью нескольких его экземпляров.

69 voters226 views13:01

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:

В монолитной системе с одной базой данных согласованность обеспечивается ACID-транзакциями (Atomicity, Consistency, Isolation, Durability). Вы можете обновить 5 таблиц в одной транзакции, и либо все изменения применятся, либо ни одно.
В микросервисной архитектуре это невозможно:
* У каждого сервиса своя база данных.
* Невозможно использовать распределенные 2PC (Two-Phase Commit) транзакции из-за проблем с производительностью, блокировками и доступностью.
* Бизнес-транзакция (например, «Оформить заказ») затрагивает несколько сервисов: Заказы, Платежи, Склад, Доставка.
Как же обеспечить, чтобы либо все сервисы выполнили свою часть, либо ни один? Здесь на помощь приходит Saga.
Суть паттерна Saga:
Saga разбивает единую ACID-транзакцию на последовательность локальных транзакций, каждая в своем сервисе. Каждая локальная транзакция публикует событие, которое запускает следующую локальную транзакцию в другом сервисе.
Ключевой элемент Saga — Компенсирующие транзакции (Compensating Transactions):
Если на каком-то шаге Saga происходит ошибка, система должна «откатиться». Но просто «удалить заказ» в базе сервиса Заказов — недостаточно. Нужно выполнить логически обратные действия:
* Не delete order, а set order status = CANCELLED.
* Не delete payment, а initiate refund (запустить процесс возврата денег).
* Не delete reservation, а release stock (вернуть товар на склад).
Типы реализации Saga:
1. Оркестрация (Orchestration): Есть центральный оркестратор (отдельный сервис), который командует, что делать каждому сервису и в каком порядке. Он знает всю логику Saga и управляет компенсациями.
2. Хореография (Choreography): Сервисы общаются друг с другом через события, без центрального дирижера. Каждый сервис знает, на какие события ему реагировать и какие события публиковать после этого. Компенсация также запускается событиями.
Пример Saga «Оформление заказа» (Хореография):
1. Order Service: Создает заказ в статусе PENDING, публикует OrderCreated.
2. Payment Service (подписан на OrderCreated): Списывает деньги, публикует PaymentCompleted.
3. Warehouse Service (подписан на PaymentCompleted): Резервирует товар, публикует StockReserved.
4. Order Service (подписан на StockReserved): Меняет статус заказа на CONFIRMED. Saga завершена успешно.
Сценарий ошибки (откат):
Если Warehouse Service не может зарезервировать товар (нет на складе), он публикует StockReservationFailed.
* Payment Service (подписан на StockReservationFailed): Запускает возврат денег (компенсирующая транзакция), публикует PaymentRefunded.
* Order Service (подписан на PaymentRefunded или StockReservationFailed): Меняет статус заказа на CANCELLED.
Роль системного аналитика: При проектировании сквозных бизнес-процессов в микросервисной архитектуре необходимо явно моделировать Saga. Нужно:
1. Определить границы и шаги бизнес-транзакции.
2. Спроектировать события, которые будут связывать шаги.
3. Самый важный этап: Для каждого шага определить и описать компенсирующую транзакцию. Что делать, если следующий шаг не удался? Отмена, возврат, уведомление?
4. Выбрать подходящий тип реализации (оркестрация или хореография).
Это сложный, но абсолютно необходимый паттерн для поддержания целостности данных в современных распределенных системах.

259 views13:01

BA & SA | 10000 Interview questions

№4616 категория вопросов: #INTEGRATION

255 views13:01

BA & SA | 10000 Interview questions

4616. С каким сценарием помогает справиться механизм «Обратного давления»?

Anonymous Quiz

70%

Когда система-получатель не успевает обрабатывать входящий поток и рискует быть перегруженной.

17%

Когда система генерирует сообщения медленнее, чем система-получатель может их обрабатывать.

12%

Когда сетевое соединение между системами имеет слишком высокую пропускную способность.

Когда необходимо обеспечить абсолютный порядок доставки всех сообщений.

69 voters274 views13:01

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:

Backpressure (Обратное давление) — это механизм устойчивости и саморегулирования в системах, работающих с потоками данных. Его можно сравнить с предохранительным клапаном в водопроводе, который не дает трубе разорваться при слишком высоком давлении.
Классическая проблема без Backpressure:
1. Продюсер (Producer) генерирует сообщения с высокой скоростью (например, 10 000 в секунду).
2. Консьюмер (Consumer) может стабильно обрабатывать только 1 000 сообщений в секунду.
3. Сообщения начинают накапливаться в очереди (буфере).
4. Очередь переполняется → потребляется вся доступная память → процесс консьюмера (или брокера) падает с OutOfMemoryError. Система ломается.
Как работает Backpressure?
Это сигнальная обратная связь от получателя к отправителю. Консьюмер явно или неявно сообщает: «Стоп! Я перегружен, присылай данные медленнее или подожди».
Реализации в разных технологиях:
* На уровне TCP: Протокол TCP имеет встроенный механизм контроля перегрузки (congestion control) — получатель указывает размер своего приемного буфера (window size).
* Reactive Streams (RxJava, Project Reactor): Это стандартизированная модель, где Subscriber запрашивает у Publisher N элементов, и только после их обработки запрашивает следующую порцию (request(N)).
* Apache Kafka: Консьюмеры сами управляют offset'ами. Если консьюмер отстает, он просто не перемещает offset дальше, и сообщения остаются в партиции. Продюсер же может регулировать отправку на основе мониторинга отставания (lag) консьюмеров.
* HTTP/2 и gRPC: Поддерживают механизмы управления потоком (flow control).
Почему это важно для аналитика?
При проектировании высоконагруженных интеграций необходимо понимать не только happy path, но и поведение системы под нагрузкой. Нужно задавать вопросы:
* Что произойдет, если источник данных начнет генерировать информацию в 100 раз быстрее, чем обычно?
* Есть ли в нашей архитектуре механизмы, которые не дадут системе-приемнику «утонуть» в таком потоке?
* Как система сообщит о перегрузке? (Через метрики? Через падение? Через замедление?)
Без Backpressure система либо теряет данные (если очередь ограничена), либо падает. С Backpressure она устойчиво снижает производительность, но продолжает работать, давая время на масштабирование или устранение проблемы.

340 views13:01

BA & SA | 10000 Interview questions

№4617 категория вопросов: #INTEGRATION

362 views15:32

BA & SA | 10000 Interview questions

4617. Какой подход к интеграции описывает паттерн Change Data Capture (CDC)?

Anonymous Quiz

12%

Регулярный опрос базы данных на предмет изменений с помощью SQL-запросов.

Прямой доступ к таблицам базы данных другой системы для чтения и записи.

80%

Определение и распространение изменений данных на уровне журнала транзакций БД в реальном времени.

Ручной экспорт данных в файл и последующая загрузка его в целевую систему по расписанию.

74 voters403 views15:32

BA & SA | 10000 Interview questions

№4618 категория вопросов: #INTEGRATION

393 views05:32

BA & SA | 10000 Interview questions

4618. Какой подход позволяет системам обмениваться данными напрямую, без промежуточных компонентов?

Anonymous Quiz

11%

Паттерн «Общая база данных»

74%

Прямая интеграция Point-to-Point

10%

Использование Enterprise Service Bus

Шина событий (Event Bus)

93 voters400 views05:32

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:

Point-to-Point (P2P, «точка-точка») — это самый простой подход к интеграции, при котором две системы соединяются напрямую, без посредников.

Как это работает:

Система A знает точный адрес и протокол системы B
Отправляет данные напрямую (например, через HTTP-вызов или прямой доступ к БД)
Система B принимает и обрабатывает запрос
Пример: Мобильное приложение вызывает REST API бэкенда напрямую.

Плюсы:

Простота начальной реализации
Минимальная задержка (нет промежуточных звеньев)
Минусы (и почему это часто антипаттерн):
При добавлении третьей, четвертой системы количество связей растет экспоненциально
Создает «спагетти-архитектуру», которую невозможно поддерживать
Нет централизованного управления, логирования, мониторинга
Высокая связанность: изменение в одной системе требует изменений во всех связанных

416 views05:32

BA & SA | 10000 Interview questions

№4619 категория вопросов: #INTEGRATION

343 views10:01

BA & SA | 10000 Interview questions

4619. Какой протокол использует бинарный формат Protocol Buffers и HTTP/2 для высокопроизводительной интеграции?

Anonymous Quiz

92 voters344 views10:01

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:
gRPC (Google Remote Procedure Call) — это современный высокопроизводительный фреймворк для удаленного вызова процедур, разработанный Google.

Ключевые особенности:

Protocol Buffers (protobuf):
Бинарный формат (в отличие от текстового JSON/XML)
Занимает меньше места, быстрее сериализуется/десериализуется
Строгая типизация через .proto файлы

Пример определения:

protobuf
message User {
  int32 id = 1;
  string name = 2;
  string email = 3;
}

HTTP/2:

Мультиплексирование (несколько запросов в одном соединении)
Сжатие заголовков
Server push (сервер может отправлять данные без запроса)

Типы взаимодействия:

Унарный (один запрос — один ответ)
Стриминг (потоковая передача в обе стороны)
Клиентский или серверный стриминг

Где применяется:

Внутренняя коммуникация микросервисов
Системы реального времени (чат, уведомления)
Когда важны производительность и низкая задержка

345 views10:01

BA & SA | 10000 Interview questions

№4620 категория вопросов: #INTEGRATION

295 views10:01

BA & SA | 10000 Interview questions

4620. Какой механизм используется для изоляции сообщений, которые не могут быть обработаны после нескольких попыток?

Anonymous Quiz

89 voters307 views10:01

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:

Change Data Capture (CDC) — это современный, эффективный паттерн интеграции, который кардинально меняет подход к синхронизации данных между системами.
Как работает (упрощенно):
1. Каждая серьезная СУБД (PostgreSQL, MySQL, Oracle) ведет журнал транзакций (Write-Ahead Log, WAL; binlog). Это низкоуровневая последовательность всех операций изменения данных (INSERT, UPDATE, DELETE), записанная перед их фактическим применением к таблицам. Цель СУБД — обеспечение согласованности и восстановление после сбоев.
2. CDC-агент (например, Debezium) подключается к СУБД не как обычное приложение, а читает этот журнал транзакций.
3. Агент превращает низкоуровневые записи журнала в удобные, структурированные события (например, { "op": "c", "after": { "id": 123, "name": "New Product" } }).
4. Эти события публикуются в шину событий (чаще всего Apache Kafka).
Практическое применение для системного аналитика:
1. Актуализация кэшей и поисковых индексов: При изменении товара в основной БД, событие через CDC мгновенно отправляется в Elasticsearch для обновления поискового индекса.
2. Построение агрегированных витрин данных: События из операционной БД стримятся в систему аналитики (например, ClickHouse) для построения актуальных отчетов.
3. Микросервисная синхронизация: Сервис «Заказы» и сервис «Доставка» имеют свои БД. При создании заказа, событие через CDC уведомляет сервис «Доставка», что нужно планировать доставку. Это альтернатива прямому вызову API.
4. Аудитинг и compliance: Полный поток всех изменений данных можно сохранять для целей аудита.
Роль аналитика: При проектировании систем, где критична актуальность данных или требуется реагирование на изменения, предлагать рассмотреть CDC как более эффективную и надежную альтернативу традиционному опросу (polling) по расписанию.

🤔1

345 views10:01

BA & SA | 10000 Interview questions

№4621 категория вопросов: #INTEGRATION

318 views13:01

BA & SA | 10000 Interview questions

4621. Какой паттерн используется для чтения изменений данных из журнала транзакций БД в реальном времени?

Anonymous Quiz

87 voters318 views13:01

BA & SA | 10000 Interview questions

👩‍🏫Объяснение:

Change Data Capture (CDC) — это паттерн интеграции, который отслеживает изменения в базе данных (INSERT, UPDATE, DELETE) и передает их другим системам почти в реальном времени.

Как работает CDC:

Чтение журнала транзакций:

Каждая СУБД ведет журнал: WAL в PostgreSQL, binlog в MySQL, redo log в Oracle
В этот журнал записывается все, что происходит с данными
CDC-агент (например, Debezium) читает этот журнал
Преобразование в события:

```json
{
"op": "u", // операция: u=update, c=create, d=delete
"before": {"id": 1, "name": "Старое имя"},
"after": {"id": 1, "name": "Новое имя"},
"source": {"table": "users", "db": "main"}
}
```

Отправка в шину событий:

События публикуются в Kafka, RabbitMQ или другую очередь
Другие сервисы подписываются на эти события

Где применяется:

Синхронизация кэшей: При изменении товара в БД → обновление кэша в Redis
Аналитика в реальном времени: События сразу попадают в ClickHouse для отчетов
Уведомления: При создании заказа → отправка email клиенту
Поисковые индексы: Обновление Elasticsearch при изменении данных

300 views13:01

BA & SA | 10000 Interview questions

№4622 категория вопросов: #INTEGRATION

263 views13:01

BA & SA | 10000 Interview questions

4622. Какой компонент служит единой точкой входа для внешних клиентов и управляет аутентификацией, роутингом и ограничением запросов?

Anonymous Quiz