BA & SA | 10000 Interview questions

☀Объяснение:

Проблема в том, что одна и та же модель данных используется и для интерактивных запросов (должны быть молниеносными), и для аналитических (могут быть медленными, так как агрегируют много данных). В классическом монолите или даже микросервисе часто одна база и одни таблицы обслуживают оба типа нагрузки, что приводит к конфликту: либо страдает скорость интерактива, либо аналитика работает слишком долго.

Что такое CQRS?
CQRS разделяет модели чтения и записи. У вас появляется отдельный сервис/модуль для команд (изменение данных) и отдельный — для запросов (чтение). Для чтения можно использовать специально оптимизированные хранилища: денормализованные таблицы, кэш (Redis), поисковый движок (Elasticsearch) или даже read-реплики основной БД. Запись идёт в нормализованное хранилище, а затем изменения асинхронно проецируются в модель чтения.

Применительно к кейсу:

Запрос на главную страницу (список фильмов с рейтингом) идёт в оптимизированную модель чтения — например, в Redis, где данные уже денормализованы и лежат в виде готовых страниц.
Генерация аналитического отчёта (например, распределение жанров по годам) идёт в ту же модель чтения или даже в отдельное аналитическое хранилище (clickhouse, колоночная БД). При этом нагрузка на основную операционную БД (которая принимает команды) практически отсутствует.

Почему не подходят другие паттерны?

A (Микросервисы) — помогают разнести команды и запросы по разным сервисам, но сами по себе не решают проблему производительности запросов, если внутри каждого микросервиса одна БД. CQRS — это более глубокий принцип организации данных.

C (Event Sourcing) — часто используется вместе с CQRS, но это отдельный паттерн хранения истории изменений. Без CQRS он не ускорит запросы.

D (Saga) — паттерн для распределённых транзакций, не про производительность чтения.
Реальный кейс:

В одном онлайн-кинотеатре после внедрения CQRS время отклика главной страницы сократилось с 1.2 сек до 50 мс (за счёт кэша), а аналитики перестали жаловаться на блокировки отчётных запросов, потому что их выделили на отдельную read-реплику. Проекция изменений (из командной модели в read-модель) происходила через брокер сообщений (Kafka) с задержкой менее 1 секунды.

Что должен сделать аналитик:

Зафиксировать требования к производительности для разных типов запросов (интерактивные vs аналитические).
Предложить архитектурное решение CQRS на этапе проектирования.
Определить, допустима ли задержка между записью и чтением (eventual consistency).
Согласовать с командой, какие модели чтения нужны (кэш, реплика, отдельное хранилище).

Вывод: CQRS — это не усложнение ради усложнения, а способ решить реальную проблему роста нагрузки на чтение и запись одновременно. Аналитик, понимающий CQRS, может вовремя предложить его вместо «купим сервер побольше».

🎯

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

500 views12:31